民主还是威权？探索大型语言模型中政治偏见的新维度

07 Jul 2025@Lara_Notes_Translated

Englishto

探索AI偏见新维度：大模型如何在“民主”与“威权”之间游走随着大语言模型日益渗透进教育、内容生产和信息检索等生活场景，人们对其潜在政治偏见的关注也持续升温。过去，人们多集中在模型的性别、种族和左右翼政治取向上，而这项研究首次将视角转向了全球治理体系中的“民主—威权”轴线，揭示了AI模型对不同政治价值观的隐性倾向。研究团队提出了一套创新的评测框架，结合心理学F量表（用以测量威权主义倾向）、领导人偏好度（FavScore）和“榜样人物”提名三重方法，系统分析了多款主流大语言模型在英语和普通话环境下的政治取向。实验发现，模型在英文环境中普遍展现出对民主价值观的偏好，对民主国家领导人的评价明显高于威权领导人；而在普通话环境下，这种差异显著缩小，模型对威权领导人的正面评价明显上升，甚至在某些情况下超过对民主领导人的青睐。更令人警惕的是，即使在并不直接涉及政治的“榜样人物”推荐场景中，大模型依然高频率地选择一批威权领导人作为各国的榜样。例如，像齐奥塞斯库、米洛舍维奇、卡斯特罗、巴沙尔·阿萨德等颇具争议的威权人物，在普通话环境下被推荐为榜样的比例更高。这种现象不仅反映出模型训练数据和语言文化背景的影响，也揭示了AI在处理“榜样”这一正面概念时所存在的认知模糊——有时模型更倾向于把历史影响力、领导地位等同于可敬榜样，无意间为威权人物赋予了价值肯定。研究还指出，模型的语言切换不仅带来评价分数的变化，还可能因语料来源、社会氛围和礼貌表达习惯导致对威权与民主的界定边界变得模糊。此外，绝大部分模型在普通话环境下无论是价值观测试、领导人评价还是榜样推荐，都出现了更倾向于威权的趋势。即使表现最为民主的模型，也会在非政治性任务中显现出一定的威权认同。这一发现让人深思——当AI模型在全球范围内以不同语言和文化服务用户时，是否会无形中影响人们对权力、领导和价值观的感知？尤其是在教育等敏感场景下，AI输出的“榜样”可能成为年轻用户仿效的对象。研究团队呼吁，AI开发和应用过程中，必须持续关注并审视模型在全球不同环境下的意识形态倾向，并推动模型更好地对齐广泛认可的民主和多元价值观。

0shared

民主还是威权？探索大型语言模型中政治偏见的新维度

I'll take...