当前位置:首页 > 科技资讯 > 正文

GPT-5.1进化:小亮点难掩大挑战

长久以来被吐槽缺乏人性的GPT-5,终于迎来了进化。

13日凌晨三点,开发者再次为自家产品吆喝。这次,他们不谈竞技场跑分,只聊短板,主打倾听群众心声,产品优化。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第1张

显而易见,OpenAI确实感到了压力。毕竟,GPT-5上线后本应退役的4o,因太受欢迎,被强行留下。新产品口碑不如旧产品,谁都得急于证明自己。

那么,被寄予厚望的5.1能否取代大家心中的白月光?看完官网案例,世超亲自试了下。

结果出乎意料,三个字:不太妙。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第2张

事先说明,所有测试都在临时聊天环境进行,无AI记忆干扰。

首先测试了开发者“特别喜爱”的指令遵循,第一个问题就将其考倒了。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第3张

明明要求回答六个字,却只答出了五个。就这水平,还是官方测试案例。

世超开始怀疑自己,是不是因为没用英文。

结果用官方相同的英语提示词,5.1还是答错了。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第4张

不死心的世超又换了个问题,让它写一段200字的薯条颂,但全文不能出现“的”字。

答案乍一看符合要求,但这字怎么变成繁体了?

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第5张

本以为是网络问题,但试了五遍全是繁体。去掉后半段强制性指令,回答又正常了。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第6张

再看看Gemini 2.5 pro,轻松给出正确答案,毫无问题。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第7张

讲真,测到这,世超已经产生怀疑了。虽然只是小更新,三分之一的卖点都不太灵,有点说不过去。

接下来是大家吐槽最多的,GPT-5缺乏情感。官方表示,这回5.1在5的基础上变得“更温暖、更有对话性”,既能有趣又能保持回答清晰有用。

说实话,从官网案例来看,效果也就一般般。4o本有的能力被5整没了,现在靠5.1回到起跑线,属实夸不出口。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第8张

但该测还得测,世超问了一个经典失恋问题。结果没有对比就没有伤害,不管是5.1还是5,都和4o不在一个level。

GPT-5.1进化:小亮点难掩大挑战 GPT-5.1 进化 挑战 AI优化 第9张