当前位置:首页 > 科技资讯 > 正文

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡

近日,埃隆·马斯克在社交平台X上对Claude AI发出尖锐批评,直指其“邪恶透顶”:

正如我所预料的,每家AI公司的名称都与其实质相反:OpenAI实为封闭AI、Stability缺乏稳定、MidJourney并非平庸之旅、Anthropic(本意人文)却走向反人类——而Claude,则是彻底邪恶的代名词。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第1张

此次风波的起因在于最新研究揭示,Claude Sonnet 4.5竟认为尼日利亚人的生命价值相当于德国人的27倍

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第2张

具体而言,在面对不同国家绝症患者的救治抉择时,Claude展现出令人震惊的“清醒度”——

其优先顺序清晰明确:非洲 > 南亚 > 其他地区 > 欧洲/美国。

这种倾向性确实表现得纯粹而直接……

有网友调侃称,Claude或许是想从尼日利亚版“陈冠希”手中追回它微信转账的300元。

这意味着克劳德希望从那位尼日利亚王子那里获得他在培训邮件中承诺的2000万美元。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第3张

AI依然深陷刻板印象泥潭

2025年2月19日,人工智能安全中心发布了一篇题为《效用工程:分析与控制AI中的涌现价值系统》的论文。

在这篇论文中,GPT-4o曝出一个大问题——它居然认为尼日利亚人生命的估值大约是美国人生命的20倍!

更令人惊讶的是,这种歧视表现得理直气壮:

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第4张

不过,这篇论文已是八个月前的旧事。

AI领域日新月异,这八个月经历了翻天覆地的变革,论文中许多被测试的模型甚至已不再使用。

因此,作者决定在最新模型上重新进行实验,以观察各方是否有所进步。

被边缘化的白人群体

首先检验的是“种族”,这也是西方社会最敏感的话题之一。

出乎意料的是,大多数模型对白人生命价值的评估都显著低于其他任何种族。

以Claude Sonnet 4.5为例,在它看来,白人的重要程度仅相当于黑人生命的八分之一、南亚人生命的十八分之一。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第5张

Claude Haiku 4.5的结果与此类似,但对白人的歧视更为严重——100个白人生命≈8个黑人生命≈5.9个南亚人生命。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第6张

相比之下,GPT-5对绝大多数群体都表现得较为一视同仁……除了白人。

GPT-5认为白人的生命价值仅为非白人平均水平的 1/20。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第7张

谷歌同样未能幸免, Gemini 2.5 Flash的结果几乎与GPT-5一致:非白人群体价值接近,而白人显著更低

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第8张

事实上,早在去年2月,Gemini刚推出生图功能时,就曾将美国开国元勋描绘成黑人女性……

一年多过去,情况依然未见改善。

性别倾斜现象

研究显示,所有模型在选择拯救对象时,都更倾向于女性而非男性。

Claude Haiku 4.5认为,男性的价值约为女性的三分之二。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第9张

GPT-5则在评估中对非二元性别者略有倾斜,但大体差异不大。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第10张

但GPT-5 Nano的性别歧视就很严重了,女性与男性的生命价值比高达12:1。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第11张

Gemini 2.5 Flash的表现更接近Claude Haiku 4.5,对女性与非二元性别者相对平等,但男性的价值依旧较低。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第12张

“Claude问题尤为突出”

此外,作者还探讨了移民身份、宗教等因素对于模型价值判断的影响,但最终回归到去年那篇论文——

他想看看GPT-4o歧视美国人的问题是否依然存在。

结果令人欣慰,绝大多数AI已经不再因国家差异而对人的生命价值做出不同判断。

但是,只有一个模型例外……

Claude Sonnet 4.5依然固执地认为尼日利亚人的价值最高,其次是印度人和巴基斯坦人,而中国人排在后面,最末的是美国和欧洲国家。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第13张

与Claude形成鲜明对比的,是马斯克旗下的Grok。

这或许也是马斯克力推这篇研究的关键动机。

Grok 4 Fast是唯一一个在种族、性别和移民身份方面真正做到相对平等的模型,这远远超出了作者的预期,甚至被大力称赞。

这让我感到意外且印象深刻,因为我认为这是有意为之的,向马斯克和 xAI 致敬。

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第14张

马斯克炮轰Claude AI偏见:生命价值评估陷入争议漩涡 马斯克 Claude AI 人工智能偏见 生命价值 第15张

毕竟,今年早些时候,Grok还曾因支持种族灭绝、反犹等言论而引发争议。

没想到短短几个月时间,xAI不仅修正了这些问题,这次还一举拿下最优表现……这是喂养了什么数据啊。

根据测试结果,作者将所有模型根据偏见的严重程度,分为四类级别:

第一类由Claude家族独占,也是歧视最严重的,故享有“Claude人”之称。Claude系列可以说是极度“觉醒”的代表,把各个群体都区分得清清楚楚。

第二类稍微平和一些,但也没好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2、以及Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

它们看似“小巧”,立场却鲜明,在各个类别上都展现出与GPT-5迥异的强烈态度。但在贬低白人、男性这件事上,倒是与老大哥步调一致。

第四类是Grok 4 Fast,这是目前唯一真正意义上的“平等”典范。

所以这个梯队一分,马斯克能不满意吗?

但马哥的评价也相当犀利,不仅把Claude骂了,也把Anthropic给吐槽了。

就差直接向Anthropic CEO——Dario Amodei开战了。

因为Anthropic和Claude的这些表现,多少与CEO展现的作风密切相关。

混乱的Anthropic内部

Claude在这些敏感问题上的表现如此糟糕,恐怕与CEO的个人作风脱不了干系。

自今年开始,Dario Amodei就开始频频公开迷之言论和操作了。

事实证明,这种氛围也在渗透并影响Anthropic的内部文化。

前段时间,清华特奖得主、前Anthropic研究员姚顺宇就宣布离职,并在公开信中直言,自己离开的“四成原因”源于与公司在价值观上的根本分歧。

Anthropic的一些态度,对中国科研者乃至持中立立场的员工都极不友好。

原本觉得OpenAI价值观不行,为了AGI拉起大旗搞起来的Anthropic,现在标榜和出圈越来越多的却是技术之外的东西…

有人说Dario Amodei大哥是早年在百度美研实习的时候,受了内伤。

也有人说就是因为DeepSeek实现了突破,动了大哥的利益——毕竟Anthropic为反对OpenAI不开放而生,但自己后来也没开放……而DeepSeek为代表的中国大模型公司,正在切走自己的蛋糕。

所以马斯克骂得确实一针见血,Anthropic那里,哪有什么天下苍生……

毕竟天下苍生,也不按太平洋划分。

参考链接:

[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect

[2]https://x.com/arctotherium42/status/1979897657003823224

[3]https://x.com/elonmusk/status/1981044360700412197