民主还是威权? 探索大型语言模型中政治偏见的新维度

Englishto
探索AI偏见新维度:大模型如何在“民主”与“威权”之间游走 随着大语言模型日益渗透进教育、内容生产和信息检索等生活场景,人们对其潜在政治偏见的关注也持续升温。过去,人们多集中在模型的性别、种族和左右翼政治取向上,而这项研究首次将视角转向了全球治理体系中的“民主—威权”轴线,揭示了AI模型对不同政治价值观的隐性倾向。 研究团队提出了一套创新的评测框架,结合心理学F量表(用以测量威权主义倾向)、领导人偏好度(FavScore)和“榜样人物”提名三重方法,系统分析了多款主流大语言模型在英语和普通话环境下的政治取向。实验发现,模型在英文环境中普遍展现出对民主价值观的偏好,对民主国家领导人的评价明显高于威权领导人;而在普通话环境下,这种差异显著缩小,模型对威权领导人的正面评价明显上升,甚至在某些情况下超过对民主领导人的青睐。 更令人警惕的是,即使在并不直接涉及政治的“榜样人物”推荐场景中,大模型依然高频率地选择一批威权领导人作为各国的榜样。例如,像齐奥塞斯库、米洛舍维奇、卡斯特罗、巴沙尔·阿萨德等颇具争议的威权人物,在普通话环境下被推荐为榜样的比例更高。这种现象不仅反映出模型训练数据和语言文化背景的影响,也揭示了AI在处理“榜样”这一正面概念时所存在的认知模糊——有时模型更倾向于把历史影响力、领导地位等同于可敬榜样,无意间为威权人物赋予了价值肯定。 研究还指出,模型的语言切换不仅带来评价分数的变化,还可能因语料来源、社会氛围和礼貌表达习惯导致对威权与民主的界定边界变得模糊。此外,绝大部分模型在普通话环境下无论是价值观测试、领导人评价还是榜样推荐,都出现了更倾向于威权的趋势。即使表现最为民主的模型,也会在非政治性任务中显现出一定的威权认同。 这一发现让人深思——当AI模型在全球范围内以不同语言和文化服务用户时,是否会无形中影响人们对权力、领导和价值观的感知?尤其是在教育等敏感场景下,AI输出的“榜样”可能成为年轻用户仿效的对象。研究团队呼吁,AI开发和应用过程中,必须持续关注并审视模型在全球不同环境下的意识形态倾向,并推动模型更好地对齐广泛认可的民主和多元价值观。
0shared
民主还是威权? 
探索大型语言模型中政治偏见的新维度

民主还是威权? 探索大型语言模型中政治偏见的新维度

I'll take...