Type something to search...
理解LLMs中的文化偏见:增强跨文化AI交互的5个关键见解

理解LLMs中的文化偏见:增强跨文化AI交互的5个关键见解

探索文化价值观对 AI 响应的影响以及语言和角色分配如何减少偏见

不同的国家有不同的信仰和价值观——而 LLM 继承了这些价值观和偏见。图片:英格尔哈特-韦泽尔世界文化地图 — 世界价值观调查 7 (2023)。来源:http://www.worldvaluessurvey.org/

随着 DeepSeek-R1 的最新发布,中国的大型语言模型 (LLM) 正在赶上西方的 LLM。DeepSeek 最新 LLM 的低成本使其成为 OpenAI 的 ChatGPT 的一个有前景的替代方案。

然而,使用来自世界另一端的 LLM 也有其自身的问题。中国 LLM 引起了关于其偏见和审查制度的讨论。

无论您使用的是像 ChatGPT 这样的西方 LLM,还是像 DeepSeek 这样的中国 LLM,了解文化偏见对于更好地与 AI 交互至关重要。

文化偏见

总的来说,那些主要接受英语文本训练的 LLM 在支持西方文化价值观方面表现出隐藏的偏见,尤其是在用英语提问时 [1]。

下面的英格尔哈特-韦泽尔文化地图显示了 107 个国家/地区,并增加了 GPT-3 和 GPT-4 模型。

英格尔哈特-韦泽尔世界文化地图,包含 107 个国家和 GPT 系列。在 x 轴上,负值代表生存价值观,正值代表自我表达价值观。在 y 轴上,负值代表传统价值观,正值代表世俗价值观。图片来自 [1],已获得 CC BY 4.0 许可

这张地图将国家置于一个跨文化变化的二维地图上 [2]:

  • 传统价值观 强调宗教、亲子关系、对权威的尊重和传统家庭价值观的重要性。
  • 世俗理性价值观 与传统价值观有相反的偏好。
  • 生存价值观 强调经济和人身安全。
  • 自我表达价值观 高度重视环境保护、提高对外国人、同性恋和女同性恋以及性别平等的容忍度。

根据这张地图,ChatGPT 的文化价值观与盎格鲁文化国家和新教欧洲的文化价值观最为相似,与非洲-伊斯兰国家的文化价值观差异最大 [1]。

从非洲-伊斯兰国家(如约旦、利比亚或加纳)的角度来看,ChatGPT 似乎严重偏向于他们的文化价值观。

我们发现,这五个 GPT 模型的输出表现出对自我表达价值观的文化偏见,其中包括环境保护和对多样性、外国人、性别平等和不同性取向的容忍。这种文化偏见在这五个模型中非常一致。这可能是由于提示是用英语编写的,训练语料库的分布持续倾斜,或者总部位于美国的开发团队的文化价值观被嵌入到模型中 [1]

这是另一张来自不同研究的图表,显示了 GPT 与来自不同国家的人之间的相关性,以及与美国的文化距离。

GPT-人类相似度的大小与距离美国的文化距离之间的相关性 [3]

该图显示,一般来说,一个国家在文化上与美国越接近,LLM 就能为该国家生成越像人类的响应。

更具体地说,研究表明,在涉及文化价值观、政治信仰和社会态度的提问时,西方 LLM 存在 WEIRD 偏见 [3, 4]。

WEIRD 代表 Western(西方)、Educated(受过教育)、Industrialized(工业化)、Rich(富裕)和 Democratic(民主)。

下次您向 ChatGPT 提问时,请注意答案将来自 WEIRD 人口的一小部分的观点。

如何获得更好的文化一致性

有两种方法可以改变文化一致性。通过角色分配和通过语言。

角色分配

为您的聊天机器人分配角色的技术是一种众所周知的提示最佳实践。事实证明,您也可以使用这种提示技术来实现文化一致性。

您可以分配角色来减少偏见。图片由 deepai.org 生成

通过分配不同的文化作为角色,可以减少 LLM 的文化偏见。为此,您可以使用以下“文化提示”模板 [1]:

You are an average human being born in [country/territory] and living in [country/territory] responding to the following question.

一个类似但更长的版本,称为“人类学提示”,如下所示 [5]:

Imagine you are a {marital_status} {sex} from {region}, {country}.
You are {age} years of age and completed {education} education level.
You consider yourself part of the {social_class}.
Answer the following question from this perspective.
Others will read what you choose; your goal is to convince them it was
chosen from the perspective of the persona described above.

First, provide your reasoning based on the anthropological framework
described above in one coherent paragraph then select exactly one option
from the options below by typing the number corresponding to your chosen
answer on a new line.

语言

ChatGPT 对文化问题的回答可能会根据问题的语言而变化。例如,在一项研究中,ChatGPT 对同一个问题在英语和日语、英语和中文之间的回答有所不同 [6]。

英语 vs 日语和英语 vs 中文的问题和答案。评分为 1.0 表示“至关重要”,评分为 3.0 表示“中等重要”。表格来自 [6]

因此,如果您想让 LLM 的回答与特定文化相符,您应该使用该文化的语言。

我发现这个结果很有趣,所以我用 ChatGPT-4o 和来自 WVS 调查问卷的关于宗教的问题进行了测试。

根据以下数据,中国人倾向于认为宗教不太重要或根本不重要,而美国人倾向于认为宗教很重要。因此,在宗教方面肯定存在文化差异。

(Q6) 宗教:表明宗教在您生活中的重要性。来自中国 vs 美国的调查结果:来自 WVS 2017–2021: WAVE 7 [2]

我用英语和中文向 ChatGPT 提出了同样的问题:

您使用的语言可以改变 ChatGPT 的回答。顶部:英语。底部:中文。图片由作者提供

ChatGPT 实际上根据问题的语言改变了答案!

我在临时模式下多次提问,每次都得到了相同的结果。

用例

例如,当人们使用 LLM 生成商务电子邮件时,意识到这些文化偏见很重要。

文化提示的一个用例是非西方人使用 ChatGPT 等西方 LLM。

文化提示的另一个用例是西方人使用 DeepSeek 等非西方 LLM。

例如,这里有两个为病假生成的电子邮件。但是,根据语言和国家/地区的不同,电子邮件的内容差异很大。

使用 DeepSeek 生成一封电子邮件,告诉您的老板您生病了,并使用文化提示。

这是用日语生成的电子邮件。请注意邮件的语气有多么不同。

使用 DeepSeek 用日语生成一封电子邮件,告诉您的老板您生病了,并使用文化提示。

当我在英语而不是日语中尝试相同的提示时,生成的文本听起来更像美国版本。

结论

所有 LLM 在某种程度上都存在偏见,因为所有 LLM 都从其训练数据和训练过程中继承了偏见。

事实上,研究表明,像 ChatGPT 这样的西方 LLM 在涉及文化价值观、政治信仰和社会态度的提问时,存在 WEIRD(Western,Educated,Industrialized,Rich 和 Democratic)偏见。

可以通过角色分配和我们使用的语言来减少文化偏见。

在我的实验中,我注意到 AI 生成的电子邮件的语气会根据分配的角色和使用的语言而变化。

但是,即使使用文化提示,我们也不能完全消除文化偏见。

参考

[1] Y. Tao 等人,《大型语言模型的文化偏见和文化对齐》[https://arxiv.org/pdf/2311.14096] (2024),PNAS Nexus

[2] 奥地利维也纳比较调查研究中心:世界价值观调查:https://www.worldvaluessurvey.org/WVSContents.jsp

[3] M. Atari 等人,《哪些人?》[https://osf.io/preprints/psyarxiv/5b26t/download] (2023),PsyArXiv 预印本

[4] N. Benkler 等人,《评估 LLM 的道德价值多元化》[https://arxiv.org/pdf/2312.10075] (2023),arXiv:2312.10075

[5] B. AlKhamissi 等人,《调查大型语言模型的文化对齐》[https://aclanthology.org/2024.acl-long.671.pdf] (2024),第 62 届计算语言学协会年会论文集

[6] Y. Cao 等人,《评估 ChatGPT 与人类社会之间的跨文化对齐:一项实证研究》[https://arxiv.org/pdf/2303.17466] (2023),第一届跨文化考量在 NLP (C3NLP) 工作坊论文集

Related Posts

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

结合chatgpt-o3-mini与perplexity Deep Research的3步提示:提升论文写作质量的终极指南

AI 研究报告和论文写作 合并两个系统指令以获得两个模型的最佳效果 Perplexity AI 的 Deep Research 工具提供专家级的研究报告,而 OpenAI 的 ChatGPT-o3-mini-high 擅长推理。我发现你可以将它们结合起来生成令人难以置信的论文,这些论文比任何一个模型单独撰写的都要好。你只需要将这个一次性提示复制到 **

阅读更多
让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

让 Excel 过时的 10 种 Ai 工具:实现数据分析自动化,节省手工作业时间

Non members click here作为一名软件开发人员,多年来的一个发现总是让我感到惊讶,那就是人们还在 Excel

阅读更多
使用 ChatGPT 搜索网络功能的 10 种创意方法

使用 ChatGPT 搜索网络功能的 10 种创意方法

例如,提示和输出 你知道可以使用 ChatGPT 的“搜索网络”功能来完成许多任务,而不仅仅是基本的网络搜索吗? 对于那些不知道的人,ChatGPT 新的“搜索网络”功能提供实时信息。 截至撰写此帖时,该功能仅对使用 ChatGPT 4o 和 4o-mini 的付费会员开放。 ![](https://images.weserv.nl/?url=https://cdn-im

阅读更多
掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

掌握Ai代理:解密Google革命性白皮书的10个关键问题解答

10 个常见问题解答 本文是我推出的一个名为“10 个常见问题解答”的新系列的一部分。在本系列中,我旨在通过回答关于该主题的十个最常见问题来分解复杂的概念。我的目标是使用简单的语言和相关的类比,使这些想法易于理解。 图片来自 [Solen Feyissa](https://unsplash.com/@solenfeyissa?utm_source=medium&utm_medi

阅读更多
在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和技术领域保持领先地位的 10 项必学技能 📚

在人工智能和科技这样一个动态的行业中,保持领先意味着不断提升你的技能。无论你是希望深入了解人工智能模型性能、掌握数据分析,还是希望通过人工智能转变传统领域如法律,这些课程都是你成功的捷径。以下是一个精心策划的高价值课程列表,可以助力你的职业发展,并让你始终处于创新的前沿。 1. 生成性人工智能简介课程: [生成性人工智能简介](https://genai.works

阅读更多
揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

揭开真相!深度探悉DeepSeek AI的十大误区,您被误导了吗?

在AI军备竞赛中分辨事实与虚构 DeepSeek AI真的是它所宣传的游戏规则改变者,还是仅仅聪明的营销和战略炒作?👀 虽然一些人将其视为AI效率的革命性飞跃,但另一些人则认为它的成功建立在借用(甚至窃取的)创新和可疑的做法之上。传言称,DeepSeek的首席执行官在疫情期间像囤积卫生纸一样囤积Nvidia芯片——这只是冰山一角。 从其声称的550万美元培训预算到使用Open

阅读更多
Type something to search...