当前位置:首页 > 科技资讯 > 正文

谷歌DeepMind再破纪录,IMO金牌认证!

谷歌DeepMind再度夺冠,IMO金牌认证!新模型Gemini Deep Think凭借自然语言,4.5小时内攻克5题,斩获35分。这次,具体解题过程也首次公开。

今日,谷歌DeepMind正式宣布夺得IMO金牌!

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第1张

他们通过Gemini Deep Think(高阶版),一个通用模型,成功破解前5题,获得35分(满分42分)。

AI在极限4.5小时之内,就达到了IMO金牌标准。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第2张

最重要的是,Gemini仅用纯自然语言——英语完成了解题。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第3张

与OpenAI不同,这一结果得到了IMO组委会官方认证。

Demis Hassabis连发两弹,一再强调「谷歌模型是首个获得官方金牌级别认可的AI系统」。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第4张

谷歌DeepMind,正式摘金

作为数学界的奥林匹克,IMO自1959年以来每年举办一次,吸引了全球优秀学生参与。

参赛者需在4.5小时内解决6道深度数学问题,涵盖代数、几何等。只有排名前8%的选手才能摘得金牌。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第5张

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第6张

近年来,IMO成为AI能力的试炼场。数学问题考验逻辑推理、创造性思维和严谨性。

去年,AlphaProof和AlphaGeometry 2破解了6题中的4题,获得银牌水平。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第7张

今年,Gemini Deep Think再创里程碑,完美破解5道题,跻身金牌行列。

自然语言解题,端到端推理

AlphaProof和AlphaGeometry 2需专家将问题翻译为形式语言。今年,Gemini Deep Think完全以自然语言端到端运行。

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第8张

解题过程

让我们来看看这次谷歌Gemini Deep Think的解题过程吧。

官方报告:https://storage.googleapis.com/deepmind-media/gemini/IMO_...

团队介绍

Thang Luong

谷歌DeepMind再破纪录,IMO金牌认证! DeepMind IMO金牌 Gemini Deep Think 自然语言解题 第9张