当前位置:首页 > 科技资讯 > 正文

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金

刚刚,OpenAI宣布了一个惊人的消息:IOI金牌已被其收入囊中

在今年IOI线上竞赛中,其推理模型的表现刷新了纪录:

总分为533.29,在全球330名人类选手中排名第六;而在所有AI参赛者中,稳居第一

值得一提的是,未参与比拼的五名选手中,有三位是中国选手,分别是刘恒熙(宁波市镇海中学)、范斯喆(浙江省诸暨市海亮高级中学)、陈昕阳(杭州第二中学)。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第1张

有趣的是,OpenAI表示,此次并未为IOI训练新的参赛模型,而是集成了多个通用推理模型参赛。

并且这个夺金系统和之前OpenAI自称在IMO中夺金的系统,是同一个。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第2张

从成绩上看,此AI推理系统相比去年模型在IOI上的表现有了显著提升。

在IOI 2024中,OpenAI还专门在o1基础上进行针对性训练,得到的o1-ioi在严格的比赛规则下仅拿到213分

今年靠通用模型直接夺金,排名大跃升,令网友直呼震撼。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第3张

不过,前段时间OpenAI自称模型拿下IMO金牌一事引发不少争议。这次面对IOI的成绩,网友们明显谨慎了许多:

到底是真的很了不起的成就,还是又一个营销噱头……

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第4张

与此同时,还有不少网友喊话“还我4o”。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第5张

更有意思的是,马斯克突然发布了IOI Benchmark排名,结果显示Grok 4在编码方面超越GPT-5获得第一(doge)。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第6张

让我们来看看这次OpenAI推理系统夺金的细节。

和人类一样,5小时、50次限制

IOI(国际信息学奥林匹克竞赛)是全球中学生计算机科学领域的最高级别赛事,拥有严苛且标准化的赛制:

参赛学生需历经2天赛程,每天在5小时内独立解决3道高难度算法题,全程断网且无法借助外部资料,最终提交C++代码方案,由隐藏测试用例自动评分。

IOI 2025共有来自84个国家的330名参赛者参赛。满分600分,金牌分数线是438.30分,最终只有28名参赛者获得金牌

OpenAI表示他们正式参加了IOI的线上AI赛道,规则和人类参赛者一样,有5小时的时间限制50次的提交次数限制

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第7张

并且AI系统在竞赛过程中全程未使用互联网或检索增强生成(RAG)技术,仅能使用基础的终端工具。

具体来说,他们整合了几个强大的推理模型,生成候选程序,运行这些程序,然后提交最优解。唯一的辅助工作是:挑选要提交的尝试内容,并与竞赛API交互。

在IOI线上AI赛道中,通过API获取题目并提交解答,不会接受竞赛组织者的直接监督。

OpenAI AI模型在国际信息学奥林匹克竞赛中夺金 IOI AI竞赛 夺金 第8张

OpenAI最新AI推理系统的表现超越98%的参赛者,不论是成绩还是方法上都和去年形成鲜明对比。

One More Thing

谢赛宁团队前段时间推出了一个包含来自IOI、Codeforces和ICPC的竞赛级编程问题的实时基准测试——LiveCodeBench Pro。

参考链接

  • [https://x.com/OpenAI/status/1954969035713687975](https://x.com/OpenAI/status/1954969035713687975)
  • [https://x.com/rohanpaul_ai/status/1954992741101998099](https://x.com/rohanpaul_ai/status/1954992741101998099)
  • [https://x.com/wenhaocha1/status/1954751124050989213](https://x.com/wenhaocha1/status/1954751124050989213)
  • [https://x.com/elonmusk/status/1955047197487272362](https://x.com/elonmusk/status/1955047197487272362)