当前位置:首页 > 科技资讯 > 正文

OpenAI vs Google: 谁是IMO金牌的幕后赢家?

OpenAI与谷歌的竞赛!谁是IMO金牌背后的先行者?

令人惊讶的是,OpenAI再次抢占了谷歌的风头!

传闻称,谷歌DeepMind的AI模型早在本周五,即两天前,便拿下了IMO金牌。

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第1张

OpenAI抓住了机会,用全新的通用推理模型在IMO竞赛中迅速公布了结果。

昨天,全网几乎都被OpenAI拿下IMO金牌的消息刷屏。自家研究员纷纷现身,宣传OpenAI神秘模型的强大。

现在看来,这一切似乎都是精心策划的。

谷歌DeepMind研究员Archit Sharma调侃道,「恭喜!居然比我们先官宣了——现在P6是新标杆了吗」?

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第2张

OpenAI夺取IMO金牌,GPT-5即将问世

为何通用推理模型拿下IMO金牌会引发如此关注?

简而言之,OpenAI这次的通用推理模型在「通用强化学习和测试时计算扩展方面开创了新篇章。」

这个通用推理模型有何独特之处?

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第3张

OpenAI推理研究员Noam Brown指出,这个模型并非专为国际数学奥林匹克竞赛(IMO)设计。

它是一个融合了最新实验性通用技术的推理LLM,使其在复杂且难以验证的任务上表现更佳。

IMO问题正是这一挑战的完美体现:证明过程长达数页,专家需花费数小时评分。

相比之下,AIME的答案只是一个0到999之间的整数。

与过去的基准相比,IMO问题需要更高层次的持续创造性思维。

这次的通用推理模型在推理时间跨度上实现了逐步进步:从GSM8K(顶尖人类约 0.1 分钟)→ MATH基准(约1分钟)→ AIME(约10分钟)→ IMO(约100 分钟)。

「重要的是,它的思考效率也更高。而且在测试时计算能力和效率方面还有很大的提升空间。」

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第4张

其次,IMO的参赛作品是复杂且难以验证的多页证明。

在这方面的进展需要超越明确、可验证奖励的强化学习范式。

通过这样做,就可以获得一个能够像人类数学家一样,构建复杂且无懈可击论证的模型。

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第5张

参考链接

这项成果到底意味着什么?

Noam Brown给出了答案:

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第6张

可能因这次IMO事件,奥特曼也出来公开发声。

他称,OpenAI拿下IMO金牌这事,需要强调的是,「这是一个LLM在做数学题,而不是一个特定的形式化数学系统这是朝着AGI迈进的主要部分。」

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第7张

其实,奥特曼之所以这么「积极主动」,也不难发现是在为GPT-5发布提前铺路呢!

当下这个节点对OpenAI至关重要,令人期待的GPT-5即将面世。

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第8张

他们估计想在这个重要节点上,利用OpenAI拿下IMO金牌这事,为GPT-5来波神助攻。

但奥特曼也稍显谨慎,调低各位对GPT-5的预期。

他指出,GPT-5是一个实验性模型,用了一些将在未来模型中使用的新研究技术。

「在数月内,不会发布具备IMO金牌水平能力的模型。」

陶哲轩点评IMO

针对IMO金牌得主背后的争议,数学界权威陶哲轩也公开表达了自己的看法。

“不会评论任何未预先公开测试方法的AI竞赛成绩报告。”

陶哲轩简明扼要地指出,在缺乏受控测试环境的情况下,AI的数学能力难以准确评估。

他指出,很多人对AI有误解,将其能力视为「行」或「不行」两个极端。

但实际上,它的能力是一个巨大的范围。你提供的计算资源、指令质量以及输出要求都会影响最终效果。

OpenAI vs Google: 谁是IMO金牌的幕后赢家? IMO金牌 GPT-5 陶哲轩 第9张