长久以来被吐槽缺乏人性的GPT-5,终于迎来了进化。
13日凌晨三点,开发者再次为自家产品吆喝。这次,他们不谈竞技场跑分,只聊短板,主打倾听群众心声,产品优化。
显而易见,OpenAI确实感到了压力。毕竟,GPT-5上线后本应退役的4o,因太受欢迎,被强行留下。新产品口碑不如旧产品,谁都得急于证明自己。
那么,被寄予厚望的5.1能否取代大家心中的白月光?看完官网案例,世超亲自试了下。
结果出乎意料,三个字:不太妙。
事先说明,所有测试都在临时聊天环境进行,无AI记忆干扰。
首先测试了开发者“特别喜爱”的指令遵循,第一个问题就将其考倒了。
明明要求回答六个字,却只答出了五个。就这水平,还是官方测试案例。
世超开始怀疑自己,是不是因为没用英文。
结果用官方相同的英语提示词,5.1还是答错了。
不死心的世超又换了个问题,让它写一段200字的薯条颂,但全文不能出现“的”字。
答案乍一看符合要求,但这字怎么变成繁体了?
本以为是网络问题,但试了五遍全是繁体。去掉后半段强制性指令,回答又正常了。
再看看Gemini 2.5 pro,轻松给出正确答案,毫无问题。
讲真,测到这,世超已经产生怀疑了。虽然只是小更新,三分之一的卖点都不太灵,有点说不过去。
接下来是大家吐槽最多的,GPT-5缺乏情感。官方表示,这回5.1在5的基础上变得“更温暖、更有对话性”,既能有趣又能保持回答清晰有用。
说实话,从官网案例来看,效果也就一般般。4o本有的能力被5整没了,现在靠5.1回到起跑线,属实夸不出口。
但该测还得测,世超问了一个经典失恋问题。结果没有对比就没有伤害,不管是5.1还是5,都和4o不在一个level。
本文由主机测评网于2026-05-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544464.html