当前位置:首页 > 科技资讯 > 正文

AI年终大战:OpenAI败北谷歌Gemini 3 Pro?

年终AI对决,OpenAI败北谷歌?GPT-5.2上线48小时,全网吐槽声一片。第三方数据揭示,Gemini 3 Pro才是真王者。

OpenAI携GPT-5.2这张「年度王牌」登场,却未能击败谷歌...

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第1张

据Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分为152,仅次于Gemini 3 Pro。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第2张

在多项基准测试中,GPT-5.2并未「全线霸榜」。

在陶哲轩与百位数学家共同设计的考题FrontierMath中,GPT-5.2仅在T1-3级中领先,T4级仍被Gemini 3占据。

此外,在国际象棋Chess Puzzles中,GPT-5.2夺得榜首。

唯独在SimpleQA Verified上,GPT-5.2表现不如GPT-5.1,可信度有所下降。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第3张

不仅如此,多个第三方基准评测显示,GPT-5.2表现远不及预期,未能击败Gemini 3。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第4张

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第5张

在OCR-Arena、simple-bench、Live-Bench等测试中,GPT-5.2甚至排在Claude Opus 4.5之后。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第6张

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第7张

发布仅两天,GPT-5.2反响平平,圈内开发者吐槽不断。

为扭转局势,OpenAI已拉响「红色警报」,将改进ChatGPT事项提升至优先级。

更甚者,内部直接暂停了AGI的研发及Sora项目八周,决心背水一战。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第8张

然而,在业界看来,OpenAI仍处于被动局面。

GPT-5重度用户发声,「GPT-5.2几乎沦为平庸」。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第9张

年终之战,OpenAI败退?

三年前,谷歌因犹豫错失先机,被OpenAI ChatGPT抢尽风头。

近日,谷歌创始人谢尔盖·布林在斯坦福演讲时公开承认曾经的「最大失误」:

我们失策了——因怕AI出错而错失一个时代。

如今,凭借Gemini 3 Pro+Nano Banana Pro,谷歌重返AI巅峰。

风水轮流转。这一次,轮到OpenAI在关键战役中自乱阵脚。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第10张

上线首日,奥特曼宣称API调用量已超过万亿token,且增长迅速。

此前Information爆料称,GPT-5.2代号大蒜(Garlic),原计划在明年初发布。

硅谷传言称,《OpenAI预训练时代终结》,甚至GPT-5.1可能基于Post 4o进行后训练,因此提升有限。

确实如此,在预训练上,OpenAI遇到Scaling瓶颈。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第11张

预训练Scaling或成瓶颈

关于GPT-5.2(大蒜)的研发,原爆料称OpenAI解决了预训练环节的一些关键问题——

改进了之前「最佳」且「体积更大」的预训练模型。

内部整合了在开发「Shallotpeat」期间修复的Bug,积累了预训练经验。

Information指出,最关键的突破发生在「预训练阶段」。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第12张

但以上信息均为新闻报道。OpenAI是否在预训练上实现重大突破尚不得而知。

但从官方全线击败Gemini 3的基准测试来看,GPT-5.2在预训练方面或许有所改进。

AI年终大战:OpenAI败北谷歌Gemini 3 Pro? OpenAI GPT-5.2 谷歌Gemini Pro AI竞赛 第13张。|图片无法上传|