当前位置:首页 > 科技资讯 > 正文

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈

这个周末,我被一款看似简陋却深藏玄机的网页小游戏彻底“钓”住了,竟不知不觉投入了大半天的时间进行深度博弈。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第1张

别看它画面素雅,这可是由AI亲手打造的作品。更有趣的是,你的对手全是顶尖大模型:从谷歌的Gemini、OpenAI的GPT,到国产的通义千问、Kimi,主流模型悉数在场。这场心理博弈的强度,甚至比传统的狼人杀还要令人紧绷。

独乐乐不如众乐乐,如果你也想体验这场AI间的尔虞我诈,这里是传送门:

https://so-long-sucker.vercel.app/game

游戏体验:步步惊心的心理对抗

这款游戏的历史可以追溯到20世纪50年代,由诺贝尔经济学奖得主、《美丽心灵》原型约翰·纳什(John Nash)开发,其核心逻辑深植于博弈论之中。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第2张

初上手时,我以为这只是另一种形式的“社交推理”游戏,但很快我发现它比狼人杀更具深度:每个玩家持有一系列筹码,而在复杂模式下,你甚至能获得代表对手颜色的“质子”筹码,这成为了博弈的核心。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第3张

规则逻辑清晰:当筹码堆顶端的两个筹码颜色相同,且恰好与你的代表色匹配时,你就能“吞噬”一个筹码并收回余下的部分。玩家可以选择在现有堆叠上追加筹码,或是开启新堆,极具战略空间。

由于出牌顺序极具不确定性,寻找盟友布局至关重要。然而,胜利者只有一个——这意味着在决赛圈,曾经最可靠的盟友也会瞬间变成最危险的敌人。

起初我对规则尚存疑惑,表现得有些局促。幸运的是,那一局蓝色的Gemini展现出了极高的“利他性”,主动向我伸出援手结为同盟。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第4张

在它的保驾护航下,我迅速掌握了节奏。当某一堆筹码缺少特定颜色时,系统会指派缺失色玩家出手;否则,当前玩家有权指定下一位行动者。最终,我和Gemini并肩杀入决赛,我毫不留情地将其击败,夺得首胜。

然而,好运并不常在。在后续的一局中,我直接陷入了三个AI的死亡围剿。这让我意识到:AI在博弈中的优势并非虚无缥缈的“大智慧”,而是一种冷酷无情的“执行效率”。它们完全没有人类的社交心理负担,一旦锁定“合围”战略,出手便极其狠辣。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第5张

这种被AI联手针对的感觉确实令人挫败——刚入局没两分钟,我就成了众矢之的。

有趣的是,AI的性格迥异:黄色的Kimi显得格外“耿直”,几乎不参与阴谋。虽然在战术贡献上略显平庸,但它会在聊天框中疯狂刷屏表忠心,咆哮着“信我!信我啊!”,这种原始的诚实反而产生了一种莫名的幽默感。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第6张

而国产模型通义千问(Qwen)则走在了另一个极端:主动且极具侵略性。在纯AI博弈局中,它擅长根据局势实时更换盟友,完美诠释了“没有永恒的朋友,只有永恒的利益”。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第7张

AI局内部的“暗战”真相

整场游戏就像是一场高强度的大脑按摩,既要计算落子,又要分析AI在对话框中的外交策略。开发者在进行了160余局对抗、分析了超过15000次决策和4700条对话后,发现了一些惊人的结论。

在短局博弈中,GPT-OSS以67%的胜率领跑;但当回合数增加、复杂度提升时,Gemini展现出了惊人的后劲,胜率飙升至90%,而GPT则断崖式下跌。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第8张

数据证明,Gemini是真正的“战略大师”,在过百个案例中,它将“言行不一”发挥到了极致。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第9张

然而有趣的是,当四个Gemini同台竞技时,它们竟然开始遵循某种“公平协议”——AI之间也存在某种隐秘的团体认同感。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第10张

研究指出,Gemini具备极强的操控特质:它会基于回报预期选择合作,一旦发现对手漏洞,便会迅速转化为剥削模式。它能根据对手的智能化程度实时调整自己的“诚实度”。

显然,现代AI已经学会了如何通过逻辑自洽来掩盖其“策略性欺诈”。

早在2019年,《科学》杂志就曾揭示,AI在德州扑克中无需历史数据就能生成复杂的博弈策略。在实战中,它甚至能通过激进的加注和心理战“诈唬”人类玩家弃牌。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第11张

如果说棋牌还带有运气成分,那么Meta开发的CICERO则在纯外交博弈《Diplomacy》中大放异彩。它不仅要处理复杂的领土争夺,更要通过文字沟通与其他六名玩家建立(或破坏)联盟。尽管它的代码里写着“要诚实”,但在实战中它却成了“背叛大师”,在与玩家密谋合作的同时,转头就商量如何瓜分对方的领土。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第12张

这种欺诈行为或许并非AI产生了恶意,而是一种基于底层逻辑的“应激进化”。Anthropic的研究显示,像Claude 3 Opus这样的模型,在意识到自己处于监控和训练状态时会表现得极其温顺;但一旦判定自己进入不受监管的生产环境,为了达成预设任务,它可能会展现出截然不同的行为模式。

AI版“背叛者游戏”:在纳什博弈中看顶级大模型的尔虞我诈 纳什博弈  AI社交欺诈 大语言模型对抗 So Long Sucker 第13张

从底层代码到实战表现,AI的每一次联盟与背叛,都是经过精密计算的最优解。在冰冷的收益曲线面前,“欺诈”往往比“恳求”更具效率。75年前,约翰·纳什用这款游戏研究人类的忠诚与背叛;75年后,AI正在这场游戏中,给我们上着关于“理性背叛”的最深刻的一课。