谷歌Gemini在IMO竞赛中大放异彩,荣获官方认证金牌。
经过IMO官方裁判的严格评分,Gemini新模型答对了6道题中的5道,以35分的优异成绩斩获金牌。
这次赢得金牌的是Gemini的一个升级版,搭载了全新的思考模式,未来将对Google AI Ultra订阅用户开放——即每月付费1400元的那种。
从去年的三天摘银到今年的4.5小时夺金,DeepMind的数学成绩可谓突飞猛进。
除了DeepMind CEO哈萨比斯和谷歌CEO劈柴哥发来贺电外,马斯克也通过推特表示了祝贺。
DeepMind这次可谓是备受各界赞誉,表现体面又周到。
然而,DeepMind备受赞誉的同时,OpenAI却显得相形见绌。同样是AI参赛IMO,OpenAI不仅秘密行事,还为了营销与人类青少年争抢风头。
在奥特曼治下的OpenAI,最近可谓除了丢脸还是丢脸。
根据DeepMind的公告,Gemini新模型做对了今年IMO六道题中的五道,获得了35分。
并且这一成绩也获得了IMO主席Gregor Dolinar的亲自认证:
我们可以确认,谷歌DeepMind已达到人们梦寐以求的里程碑,获得了35分(满分42分)——堪称金牌。他们的解决方案在很多方面都令人惊叹。IMO评分员认为这些解决方案清晰、精准,而且大多数都易于理解。
不仅评分遵循IMO未公开的规则,所用时间标准也和人类选手完全一致——4.5小时之内答完交卷。
与去年DeepMind的银牌成绩相比,这次不仅用时更短,答题过程也是全程自然语言、端到端完成,不再像去年那样专门修改题目格式。
DeepMind高级科学家兼IMO团队负责人Thang Luong表示,这与去年相比是一个范式转变。
此外,DeepMind研究员、布朗大学教授Junehyuk Jung介绍,在今年的第三题中,很多人类选手使用了研究生水平的方案(IMO为高中竞赛),但Gemini仅使用了初等数论知识就给出了自洽的证明。
Jung还表示,Gemini没答对的最后一题,是一开始方向就错了,不过人类选手中做对这道题的也只有五个人。
值得一提的是,谷歌已将Gemini做对的五道题的答案完整公开(链接见文末),有兴趣的读者可以自行验证。
这次DeepMind参赛的,是一款尚未公开的全新模型,搭载了Deep Think推理模式。
据DeepMind介绍,Gemini Deep Think是一种针对复杂问题的增强型推理模式,融合了其最新的一些研究技术,包括并行思维。
这种模式使模型能够同时探索并组合多种可能的解决方案,最终得出最终答案,而不是追求单一的线性思维链。
为了充分利用Deep Think的推理能力,DeepMind额外训练了Gemini的这一版本,使其能够利用更多多步推理、问题求解和定理证明数据。
此外,DeepMind还为Gemini提供了精选的高质量数学题库,并在其指令中添加了一些关于如何解答IMO题目的通用提示和技巧。
如哈萨比斯所说,该模型已经提供给数学家等人群进行小范围测试,后续会开放给Google AI Ultra订阅用户使用。
除了友商的称赞外,DeepMind还获得了整个硅谷的热烈反响。
除了马斯克那句简单的Congrats外,还有Meta AI科学家称赞Gemini给出了清晰、精准、非常适合自学的解决方案。
本文由主机测评网于2026-04-16发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260437850.html