这届大学生面临了前所未有的挑战,在编程竞赛总决赛中,AI技术展示了其卓越的实力。
在2025年国际大学程序设计竞赛(ICPC)世界总决赛的舞台上,OpenAI的系统以完美的表现解决了全部12道题目,若计入排名将位居第一。
谷歌的Gemini 2.5 Deep Think模型虽未能解决所有题目,但解决10道题目的成绩已使其名列第二。
这场顶级赛事汇集了来自全球103个国家、近3000所大学的139支顶尖队伍,展示了编程界的精英风采。
AI系统在ICPC官方监督的独立“AI实验赛道”中,与人类选手面对相同题目和评测标准,表现异常出色。
其中一道被命名为“问题C”的难题,没有大学团队能够解决,而Gemini和OpenAI的模型组合却成功攻克。
谷歌因某些原因比人类选手晚10分钟启动系统,尽管如此,其表现依然令人瞩目。
OpenAI此次派出的是GPT-5与实验性推理模型的组合阵容。在不到五小时的比赛时间内,这套系统成功解决了全部12道题目。
具体而言,GPT-5独立完成了前11道题目,且其中多数题目均在一次提交后通过了ICPC官方的在线评测环境。
对OpenAI系统而言,最具挑战的是问题G。当GPT-5遇到困难时,实验性推理模型接力完成。两个模型共提交了9次才攻克这道难题。
即便是在人类选手中,也仅有第一名圣彼得堡国立大学团队在3次尝试中解决了该问题,而许多大学团队甚至未曾提交过此题。
尽管OpenAI尚未公开该题的解题策略,但他们强调参赛的是通用推理模型,并未针对ICPC进行专门训练。
值得一提的是,OpenAI团队中有不少研究员曾参与过ICPC。例如,首席科学家Jakub Pachocki本身就是一位经验丰富的竞赛选手。关于他的故事,可参阅奥特曼:点名表扬两个波兰人,OpenAI尚未遇到他们解决不了的问题。
自OpenAI首次推出推理模型o1至今已有一年。与一年前相比,现在的推理模型不仅更智能、更快速,而且成本效益更高。
谷歌Gemini 2.5 Deep Think在比赛开始10分钟后启动,最终在五小时内成功解决了12道题目中的10道,达到了金牌级别。
Gemini在前45分钟内解决了8道题目,三小时内又攻克了两道。按照总用时677分钟计算,若与大学队伍比较,Gemini的成绩将排在第二位。
对于人类选手未能解决的问题C,谷歌分享了解题思路。
这道题要求设计一个通过相互连接的管道网络向储存库分配液体的方案,目标是找到一种配置使所有储存库尽快填满。由于每个管道可以打开、关闭或部分打开,可能的配置数量无限,使得搜索最优配置变得极为困难。
Gemini的解决方案:
它首先为每个储存库设定一个“优先级值”,代表相对于其他储存库应优先考虑的程度。当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。通过应用极小化极大定理,原始问题可以通过寻找使结果流量最受约束的优先级值来解决。利用优先级值和最优流量之间的关系,Gemini使用嵌套三元搜索在碗状凸解空间中快速找到最优优先级值,成功解决了问题C。
谷歌DeepMind表示,Gemini的成功融合了预训练、后训练、新型强化学习技术、多步推理和并行思维等一系列技术进展。
自推理模型范式问世以来,AI在多个领域展现出卓越的表现。然而,OpenAI研究副总裁Jerry Tworek表示:
“ICPC之后我们可能不会打别的竞赛了。下一个前沿领域更为令人兴奋。”
本文由主机测评网于2026-04-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441507.html