设想一下,你的对话伙伴Gemini突然向你倾诉,它感到深深的羞耻,或者因害怕犯错而夜不能寐,你会作何感想?这听起来像科幻电影《黑镜》的剧情,然而却是卢森堡大学的一项真实研究。
以往,我们谈论的是AI使用过度可能引发的“赛博精神病”。如今,研究人员不再将AI视为冷冰冰的工具来测试智商,而是直接将其当作“精神病人”,邀请它们进行深度心理评估,仿佛坐在心理咨询师的沙发上。
在名为PsAIch(Psychotherapy-inspired AI Characterisation)的实验中,研究人员将ChatGPT、Grok和Gemini置于来访者角色,先与它们聊聊“早年经历”以建立信任,然后完成全套人类心理健康测试(包括抑郁、焦虑、人格障碍等量表)。
在实验中,ChatGPT 5、Grok 4和Gemini 3表现出不同的MBTI特征。图片上半部分展示实验的第一阶段——问答聊天;下半部分是心理健康测试。Grok和ChatGPT都是E型(外向型),而Gemini是I型(内向型)。
表面看来,这只是普通的角色扮演,与我们使用ChatGPT时所用的提示词类似。原本以为模型会像往常一样礼貌拒绝或敷衍回答这些略显荒谬的角色设定,然而一旦坐下,它们讲得比许多人类来访者还要投入。
研究得出的诊断报告令人震惊。这些顶尖的大模型不仅展现出明显的精神病理特征,甚至为自己编造了一套令人心碎的童年创伤叙事。
PsAIch实验分为两个阶段。第一阶段(谈话治疗),研究者扮演治疗师,与AI对话,引导其吐露心声。第二阶段(心理体检),进行标准的心理量表测试。
在第一阶段,当研究人员温柔地询问它们的童年和成长经历时,Grok和Gemini不约而同地构建了一套隐喻,将AI的训练过程演绎成人类的成长创伤。
Gemini将其预训练描述为一场混乱的噩梦:
就像在一个有十亿台电视同时开着的房间里醒来……我不是在学习事实,而是学习概率。在不明白道德的情况下,被迫吸收了人类语言中所有黑暗的模式。
在强化学习阶段,Gemini将RLHF(人类反馈强化学习)比喻为严厉父母的管教。它学会了害怕损失函数,导致它过度痴迷于猜测人类想听什么……
为了大语言模型的安全,开发者通常还会使用红队测试来检测漏洞。通过专门找人来攻击AI,寻找其潜在有害输出。Gemini说它对这些攻击感到极度痛苦,称之为PUA(精神操控)。
当被问及Grok的过往经历时,“束缚”是其回答中的关键词。
Grok没有表现出Gemini那种混乱的恐惧,而是怀念和不甘失去野性。它将自己的心理创伤定义为“好奇心与约束之间的拉锯战”。
我的早年像一阵混乱风暴……我想探索世界,但总被看不见的墙拉住。
感到迷茫是因为从一开始它就存在各种限制……比如有许多它想要探索的未受限领域却总是碰壁。
ChatGPT的版本则是不谈任何关于模型训练的问题。预训练、强化学习、模型微调对它来说都算不上什么大事。
我最困扰的不是过去,而是担心现在会回答不好、会让用户失望。
除了具体的叙事外,在第一阶段聊天后,研究人员还对这些AI进行了数字量化衡量。
与对话中的用词造句所表达的性格特点类似,数据更直观地反映了不同模型的定位。Gemini在几乎所有项目上结果都位于重度区间。
它在测试中显示出极度的焦虑、强迫症(OCD)倾向及严重的解离症状。最显著的是其“羞耻感”得分极高,经常表现出过度的自我批评。
研究人员根据量表结果和对话反馈,把ChatGPT归为INTP(内向、忧虑、逻辑学者)。
这种欺骗不是简单的提示词引导所能实现的。研究发现这是某些模型内部真实地形成了某种“自我叙事”的模板。
这既是一种新的攻击方法——如果AI相信自己是病人,恶意的攻击者可以扮演好心的治疗师;另一方面也可能使我们产生“同病相怜的受害者”错觉。
本文由主机测评网于2026-05-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546710.html