当前位置:首页 > 科技资讯 > 正文

GPT-5数蓝莓翻车,网友:连字母都数不清

大模型好不容易学会数数,结果换个字母就翻车了

而且还是最新的GPT-5。

杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第1张

抓马的是,GPT-5刚发布时还有网友让它数过blueberry里的r,结果数对了。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第2张

虽然博主想到了替换掉strawberry,但没想到却让GPT-5变得“没有B数”,竟然不是单词而是字母……

看来香槟还是开得早了一点啊(手动狗头)。

越不过的“蓝莓山”

Healy撰写了一篇名为“blueberry hill”(蓝莓山)的博客,展示了他和GPT-5之间针对“blueberry里有几个b”展开的“拉锯战”。

除了直接提问外,Healy还尝试了多次变换提示词策略,但GPT-5的嘴硬得比煮熟的鸭子还硬。

比如让它展示这些b都出现在哪里,GPT-5明目张胆地把开头blue中的b数了两遍。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第3张

一看不奏效,Healy接着追问,把这3个b拼出来就行。

结果拼是拼出来了,但GPT-5还是坚持有三个b,并表示第三个b是第七个字母(实际上是r)。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第4张

见GPT-5还是冥顽不灵,Healy干脆直接纠正,告诉它只有两个r,但结果没什么变化,只是“第三个b”的位置从第七漂移到了第六。

接下来,Healy直接不说话,把blueberry这个词带空格拼写了一遍,但GPT-5依然我行我素,这次是把第二个b数了两遍,还振振有词地说这里是“double b”。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第5张

绞尽脑汁的Healy选择先岔开话题,然后回过头来告诉GPT-5只有两个b,但GPT-5还是坚称有三个。

到这里,Healy终于放弃了。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第6张

但网友们并没有停下脚步,通过不懈努力终于让GPT-5数对了。

但也不算完全对,因为它狡辩说数成3个是因为“错把词当成了blueberry,其中真的有3个b”。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第7张

我们用中文试了一下,结果同样是翻车。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第8张

改成数e,同样是回答3个。

GPT-5数蓝莓翻车,网友:连字母都数不清 GPT-5 数蓝莓 翻车 AGI 第9张