当前位置:首页 > 科技资讯 > 正文

AI算法竞赛破局:GPT-5与Gemini 2.5 DeepThink展现惊人实力

在过去的几十年里,国际大学生程序设计竞赛(ICPC)一直被视为计算机程序设计领域的巅峰赛事。然而,今年的赛场上,两位“非人类”选手——OpenAI的GPT-5和Google DeepMind的Gemini 2.5 DeepThink——却抢走了风头。

作为参赛模型,GPT-5和Gemini 2.5 DeepThink在ICPC官方规则监督下,参与了与人类选手相同的解题环节。尽管它们并非与学生团队直接竞争,但它们的答卷却令人惊艳:

● GPT-5以满分成绩完成了全部12道题目,展现了“金牌”级别的实力。

● Gemini 2.5 DeepThink在677分钟内解决了12道题中的10道,同样达到了金牌级别。据谷歌称,这样的成绩在人类排名中将是全球第二。

要知道,本届ICPC的人类金牌队伍来自圣彼得堡国立大学、东京大学、北京交通大学和清华大学。然而,即便是这些顶尖学府的强队,也没有任何一支能够全部答对(最好成绩是11/12)。换句话说,这是AI第一次在这类算法竞赛中实现“超车”。

ICPC:程序员的‘奥林匹克’

ICPC是全球最顶尖的大学生编程赛事,自1970年代起,就汇聚了全球高校最顶尖的算法天才。今年,ICPC总决赛共有来自103个国家、139所高校的战队参赛,大赛规则看似简单:

● 每支队伍由三名大学生组成;

● 5小时内解答12道算法题;

● 排名取决于解题数和用时。

但背后的难度远超一般编程比赛。据悉,ICPC的题目常涉及图论、数论、动态规划、组合优化、网络流等前沿算法。既考察编码速度,也考察数学功底与团队合作。历年来,能在ICPC拿到金牌的队伍,几乎都成为了全球科技公司的核心技术人才。

也正因为ICPC的权威与挑战性,本届AI的入局显得尤为标志性:这是把AI直接推上了最严苛的算法竞技场。

GPT-5完美解答,Gemini 2.5解决人类未解之谜C

根据OpenAI官方披露,GPT-5参赛时并未针对ICPC进行特别训练,也没有使用任何“外挂”工具。它像其他人类队伍一样:直接拿到同样的PDF赛题、通过官方判题系统提交答案、在5小时内完成所有解答。

结果令人惊叹:有11道题都是一遍过,唯一的难题在第9次提交时才解出,最终达成12/12满分——要知道,今年人类最强队伍的成绩是11/12,而GPT-5直接拿下满分,这在ICPC的历史上极为罕见。

基于此,OpenAI也在X平台分享了GPT-5的成绩:

“我们在ICPC的AI赛道正式参赛,同样是5小时解12道题,答案由ICPC评测系统实时判定。结果显示,12道题中有11道题一次提交就通过,最难的一题则是在第9次提交时才解出。最终,GPT-5完成了全部12道题,而最好的人类队伍只解出11道。”

与此同时,Google也公布了Gemini 2.5 DeepThink的比赛细节:45分钟内解出8题;3小时内解出10题;更令人震惊的是,Gemini在比赛前半小时内,就成功解决了问题C——一道没有任何大学队伍解出的难题。

AI算法竞赛破局:GPT-5与Gemini 2.5 DeepThink展现惊人实力 GPT-5 Gemini DeepThink ICPC AI竞赛 第1张据悉,这道题目要求:在由多个水库和管道组成的复杂网络中,找到一种管道开关配置,使所有水库在最短时间内被注满。每条管道可以开、关或部分开启,组合几乎无限,导致搜索最优解极其困难。

面对这道题,Gemini 2.5 DeepThink的解题思路堪称“巧妙”:

1、先为每个水库设定一个“优先级值”,表示它相对于其他水库应被分配的程度;

2、在给定优先级值后,通过动态规划找到最优管道配置;

3、进一步应用极小化极大定理,将问题转化为寻找“最受约束”的优先级组合;

4、最后在凸优化空间中,利用嵌套三分搜索快速收敛到最优解。

这一思路并非赛题官方题解的“标准做法”,而是模型自己推演出的路径。换句话说,Gemini在赛场上展示了超越记忆的原创性算法思维。为此Google也在博客中强调,这不仅是一次正确解答,更是一次“创造性突破”。

为何这次意义非凡?

其实,大模型在各种考试、基准测试中的高分表现早已不是新闻:

● ChatGPT、Gemini等LLM在SAT、律师资格考试、托福等人类考试中屡屡高分;

● 今年7月,Gemini在国际数学奥林匹克(IMO)拿到金牌;

● 在各种NLP、逻辑推理benchmark上,LLM也早已“刷榜”。

但这些成绩往往被质疑为“靠记忆训练数据”或“靠海量算力暴力搜索”。而ICPC这种现场算法竞赛不同:首先题目新颖,几乎不可能出现在训练语料中;其次需要综合运用数学建模、推理和代码实现;最为重要的是,必须在有限时间内找到解法,而不是离线慢慢思考。

此次GPT-5与Gemini 2.5 DeepThink在ICPC中的表现,证明了它们已经具备临场推理、抽象建模、创造性解题的能力,这比在标准化考试中得高分更能说明问题。为此在社交媒体上,许多AI工程师感叹:“过去我们担心AI只是会背题库;现在它在现场比赛里击败人类冠军。这感觉像是见证了‘人机智力平权’的时刻。”

这不是终点,而是一个开始。接下来,AI是否会把这种能力扩展到更复杂的现实问题中还有待考验,但可以确定的是:如今,AI不再只是“会写代码的助手”,而是真正具备了与人类智力正面对抗的实力。