年终AI对决,OpenAI败北谷歌?GPT-5.2上线48小时,全网吐槽声一片。第三方数据揭示,Gemini 3 Pro才是真王者。
OpenAI携GPT-5.2这张「年度王牌」登场,却未能击败谷歌...
据Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分为152,仅次于Gemini 3 Pro。
在多项基准测试中,GPT-5.2并未「全线霸榜」。
在陶哲轩与百位数学家共同设计的考题FrontierMath中,GPT-5.2仅在T1-3级中领先,T4级仍被Gemini 3占据。
此外,在国际象棋Chess Puzzles中,GPT-5.2夺得榜首。
唯独在SimpleQA Verified上,GPT-5.2表现不如GPT-5.1,可信度有所下降。
不仅如此,多个第三方基准评测显示,GPT-5.2表现远不及预期,未能击败Gemini 3。
在OCR-Arena、simple-bench、Live-Bench等测试中,GPT-5.2甚至排在Claude Opus 4.5之后。
发布仅两天,GPT-5.2反响平平,圈内开发者吐槽不断。
为扭转局势,OpenAI已拉响「红色警报」,将改进ChatGPT事项提升至优先级。
更甚者,内部直接暂停了AGI的研发及Sora项目八周,决心背水一战。
然而,在业界看来,OpenAI仍处于被动局面。
GPT-5重度用户发声,「GPT-5.2几乎沦为平庸」。
三年前,谷歌因犹豫错失先机,被OpenAI ChatGPT抢尽风头。
近日,谷歌创始人谢尔盖·布林在斯坦福演讲时公开承认曾经的「最大失误」:
我们失策了——因怕AI出错而错失一个时代。
如今,凭借Gemini 3 Pro+Nano Banana Pro,谷歌重返AI巅峰。
风水轮流转。这一次,轮到OpenAI在关键战役中自乱阵脚。
上线首日,奥特曼宣称API调用量已超过万亿token,且增长迅速。
此前Information爆料称,GPT-5.2代号大蒜(Garlic),原计划在明年初发布。
硅谷传言称,《OpenAI预训练时代终结》,甚至GPT-5.1可能基于Post 4o进行后训练,因此提升有限。
确实如此,在预训练上,OpenAI遇到Scaling瓶颈。
关于GPT-5.2(大蒜)的研发,原爆料称OpenAI解决了预训练环节的一些关键问题——
改进了之前「最佳」且「体积更大」的预训练模型。
内部整合了在开发「Shallotpeat」期间修复的Bug,积累了预训练经验。
Information指出,最关键的突破发生在「预训练阶段」。
但以上信息均为新闻报道。OpenAI是否在预训练上实现重大突破尚不得而知。
但从官方全线击败Gemini 3的基准测试来看,GPT-5.2在预训练方面或许有所改进。
。|图片无法上传|
本文由主机测评网于2026-05-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546251.html