
Gemini 3,引领AI新时代的最强模型。
与以往相比,它究竟带来了哪些变革?是性能再攀新高,还是AI本质的蜕变?
11月22日,Jeff Dean在斯坦福大学的演讲中,系统回顾了15年AI演进,从神经网络、TPU、Transformer到稀疏模型和蒸馏技术,最终揭示了Gemini 3的独特魅力。
Jeff Dean在演讲中并未过多聚焦于benchmark数字或产品宣传。他提出的是:
为何AI应如大脑般运作?
为何AI要从回答转变为行动?
为何下一代AI比拼的是效率而非参数?
在Jeff Dean的视野里,Gemini 3不仅是模型的扩容,更是AI应用方式的根本变革。
演讲开篇,Jeff Dean直指传统AI模型的浪费现象。
“在传统神经网络中,你为每个例子激活整个模型,这极为浪费。更优化的方式是:拥有一个大模型,但每次仅激活其1%至5%。”
假设你拥有一款全能模型,涵盖图像、语言、数学、代码等能力。传统操作是无论问题如何,整个模型均需参与。而Jeff Dean的构想是:依据任务类型,仅运行所需部分。处理图像时,仅用视觉模块;编写代码时,仅用编程模块。
他以大脑为喻:在英语课上,大脑启用语言处理区;开车时,则关闭该区域,专注驾驶。AI模型也应如此运作。
此想法并非专为Gemini 3而提。
几年前,Jeff Dean便引领团队朝此方向研究,并命名为Pathways架构。其核心目标为构建超大模型同时保持高效,使每次推理仅激活少量路径。
Google通过“专家混合”(MoE)技术实现:
模型内有多位专家模块
有的擅长图像,有的擅长语言,有的负责信息融合
输入数据后,系统自动选择调用哪些专家
效果惊人:相同计算预算下,MoE架构可训练效果提升8倍的模型。
而Gemini 3正是这一理念的最新实践。
它不再一次性加载全部权重,而是按需调用专家模块。
结果是:性能更强,成本更低,还能同时处理多项任务。正如你的大脑:处理复杂问题时多区域协同工作,简单事情则只需小部分参与。
如果说第一节讲述模型如何变聪明,第二节则展示:它开始为你做事了。
Jeff Dean现场演示:一位用户拥有大量家族食谱,有韩语手写和英文版本,均为老照片且带折痕和油渍。
用户需求简单:创建一个双语食谱网站。
Gemini 3的运作步骤:第一步,扫描并识别照片中文字;第二步,翻译成双语版本;第三步,自动生成网站布局;第四步,为每个食谱配AI生成配图。
整个过程用户仅一句话。
这是传统助手与智能Agent的区别。助手是问什么答什么,而Agent是明确目标后自行拆解任务、调用工具、完成操作链。
AI不仅是回答你,而是具备行动能力。
如果说Pathways架构让模型变聪明,Agent系统让模型能行动,那么第三个信号虽不起眼却最为关键:让AI真正用得起。
1. TPU:为效率而生的硬件
2015年,第一代TPU投入使用。它专为机器学习设计,专注于低精度线性代数运算的极致表现。
2. 蒸馏:让小模型学会大模型的能力
3. 真正的门槛:能否在现实约束下落地
从性能数据看是一次模型升级;从Jeff Dean的思路看是一次范式转变。
本文由主机测评网于2026-05-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544998.html