当前位置:首页 > 科技资讯 > 正文

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元

震撼性消息传来!

仅在短短半个月内,谷歌DeepMind便正式推出了IMO最强金牌模型——Gemini 3 Deep Think。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第1张

回顾今年夏季,Gemini 2.5 Deep Think已在IMO和ICPC国际竞赛中斩获金牌佳绩。

此次,谷歌为其注入全新动力——Gemini 3。

依托「并行思考」能力,Gemini 3 Deep Think能够攻克极高难度的数学、科学挑战!

在基准测试中,Deep Think全面超越Gemini 3 Pro,特别是在HLE上,无需工具辅助即取得41%的高分。

同时在ARC-AGI-2评估中,以45.1%的成绩全球领先。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第2张

以下示例中,同一指令要求Gemini 3 Pro和Deep Think版基于博物馆展馆屋顶草图,构建精确交互式3D场景。

明显,后者在还原度上几乎与原图1:1一致,且交互光影变化符合物理规律。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第3张

目前,Gemini 3 Deep Think已在Gemini App上线,所有Ultra用户可立即体验。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第4张

最强IMO金牌模型降临

Gemini 3 Deep Think正式开启「深度思考」新时代,推动智能边界持续扩展。

该模型基于前代Gemini 2.5 Deep Think迭代升级,在推理能力上实现飞跃。

它专为应对当今顶尖模型都难以处理的复杂数学、科学及逻辑问题而设计。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第5张

在多项基准测试中,Gemini 3 Deep Think均取得行业领先成果。

在Humanity’s Last Exam(无工具辅助)中得分41%,并在ARC-AGI-2(配合代码执行)创下45.1%的新纪录。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第6张

在ARC-AGI-1和ARC-AGI-2上,Gemini 3 Deep Think实力堪称无可匹敌。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第7张

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第8张

其强大性能源于「并行推理」机制,可同时探索多种假设进行思考。

从谷歌DeepMind发布的更多演示中,可见Gemini 3 Deep Think的卓越能力。

例如,让它设计一款3D多米诺骨牌游戏。在关卡设置中,Deep Think展现创意与惊喜,并模拟真实碰撞物理效果。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第9张

另一示例要求Gemini 3 Pro和Deep Think在单个HTML文件中创建程序化生成的地球类行星。

左右对比清晰显示,Deep Think版本更具创造力。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第10张

开发者实测后惊叹,Gemini 3 Deep Think具备惊人潜力。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第11张

上传玻璃瓶照片,它能生成软橡胶同款掉落地的3D动画。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第12张

有网友兴奋表示,照此速度,2026年或将真正实现AGI!

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第13张

华人科学家领军,AGI精英团队加速推进

同日,谷歌DeepMind宣布在新加坡组建全新精英团队。

该团队由华人科学家Yi Tay带领,专注于高级推理、LLM/RL,并推动Gemini、Gemini Deep Think等前沿SOTA模型发展。

Yi Tay将向位于山景城、由Quoc Le(谷歌Fellow级专家)领导的团队汇报。

巧合的是,此团队正是Gemini Deep Think在国际竞赛中夺得金牌的核心力量之一,同时在Gemini项目上取得关键进展。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第14张

Yi Tay表示,团队将从规模小但实力强的核心组起步。

因为在大模型时代,「人才密度」至关重要。

关键的是,该团队能与AI领域传奇人物协作研究,包括「推理之王」Denny Zhou、「香蕉」背后的Mostafa Dehghani、AI界「GOAT」Noam Shazeer。

同时,多位「神仙队友」加入研究,如生成式检索发明人Vinh Q. Tran、IMO金牌项目负责人Thang Luong、思维链开创者Xuezhi、日本顶尖AI专家Shane Gu等。

过去数月,谷歌DeepMind已秘密招募全球顶尖人才。

该项目获得Demis Hassabis、Jeff Dean等内部高层的强力支持。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第15张

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第16张

如今,他们继续发布英雄招募令,提供踏上AGI关键赛道的机会。

不久后,这支新加坡团队有望成长为战斗力极强的队伍。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第17张

Gemini 3流量激增15%

随着Gemini 3 Pro的强势发布,其网页端市占率创新高,突破15%。

同时,Grok凭借4.1版本发布持续增长。

ChatGPT在流量上仍保持断崖式领先,但份额持续下滑。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第18张

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第19张

Gemini延续增长趋势,访问量达13.51亿次,较10月增长14.3%。ChatGPT跌破60亿次大关,网站访问量降至58.44亿次。

这是继7月后,ChatGPT在2025年第二次出现环比下降。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第20张

尽管在11月18日(Cloudflare宕机当天),ChatGPT创下单日2.33亿次访问的历史记录,但未能扭转整体流量下跌趋势。

此外,Grok网站访问量达2.344亿次,创历史新高,较10月增长14.7%。

这也是该网站自启用当前域名以来,首次实现连续两月流量增长。

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第21张

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第22张

谷歌DeepMind推出Gemini 3 Deep Think:突破性推理模型引领AGI新纪元 Gemini Think  并行推理 IMO金牌 AGI发展 第23张

参考资料:

https://x.com/GoogleDeepMind/status/1996658401233842624?s=20

https://x.com/YiTayML/status/1996640869584445882?s=20

https://x.com/Similarweb/status/1995792272785310186