谷歌DeepMind再度夺冠,IMO金牌认证!新模型Gemini Deep Think凭借自然语言,4.5小时内攻克5题,斩获35分。这次,具体解题过程也首次公开。
今日,谷歌DeepMind正式宣布夺得IMO金牌!
他们通过Gemini Deep Think(高阶版),一个通用模型,成功破解前5题,获得35分(满分42分)。
AI在极限4.5小时之内,就达到了IMO金牌标准。
最重要的是,Gemini仅用纯自然语言——英语完成了解题。
与OpenAI不同,这一结果得到了IMO组委会官方认证。
Demis Hassabis连发两弹,一再强调「谷歌模型是首个获得官方金牌级别认可的AI系统」。
作为数学界的奥林匹克,IMO自1959年以来每年举办一次,吸引了全球优秀学生参与。
参赛者需在4.5小时内解决6道深度数学问题,涵盖代数、几何等。只有排名前8%的选手才能摘得金牌。
近年来,IMO成为AI能力的试炼场。数学问题考验逻辑推理、创造性思维和严谨性。
去年,AlphaProof和AlphaGeometry 2破解了6题中的4题,获得银牌水平。
今年,Gemini Deep Think再创里程碑,完美破解5道题,跻身金牌行列。
AlphaProof和AlphaGeometry 2需专家将问题翻译为形式语言。今年,Gemini Deep Think完全以自然语言端到端运行。
让我们来看看这次谷歌Gemini Deep Think的解题过程吧。
官方报告:https://storage.googleapis.com/deepmind-media/gemini/IMO_...
本文由主机测评网于2026-04-16发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260437827.html