当前位置:首页 > 科技资讯 > 正文

谷歌发布Gemini 3 Flash:高效低成本,智能水平再升级

智东西12月18日报道,近日,谷歌推出了Gemini 3 Flash,旨在以更低的成本提供前沿的智能体验。

具体来说,它每百万token的价格仅为Claude Sonnet 4.5的20%GPT-5.2的21%,但能在基准测试中达到甚至超越这些旗舰级模型的水平。

即使与Gemini 3 Pro相比,Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%,但在MMMU-Pro、SWE-bench Verified等核心基准测试中,超越了Pro版本的模型。

谷歌发布Gemini 3 Flash:高效低成本,智能水平再升级 Gemini Flash 智能模型 高效成本 多模态推理 第1张

此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面展现优势,Gemini 3 Flash保留了这一基础,将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。

谷歌首席科学家Jeff Dean表示,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也快3倍,而且价格仅为后者的几分之一。以下是并排演示:

Gemini 3 Flash目前已全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户可通过Gemini应用程序和谷歌搜索中的AI模式使用。

01.专为迭代开发打造,低延迟高智能

Gemini 3 Flash能做什么?谷歌称,这是一款专为迭代开发打造的模型,能以低延迟提供接近Gemini 3 Pro级别的编程性能。

谷歌分享了多个案例。例如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,提供近乎实时的AI辅助。

它还能近乎实时地构建和A/B测试新的加载动画设计,简化了从设计到代码的流程。

使用多模态推理,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成字幕,最终将静态图像转化为交互式体验。

凭借在推理、工具使用和多模态能力方面的出色表现,Gemini 3 Flash特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。

02.多领域性能超越Pro级模型

Gemini 3 Flash在博士级推理和知识基准测试(如GPQA Diamond 90.4%和Humanity's Last Exam不使用工具时为33.7%)中表现优异,与更大前沿模型相媲美,并在多项基准测试中显著优于Gemini 2.5 Pro。

在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越2.5系列,也超过Gemini 3 Pro。

谷歌发布Gemini 3 Flash:高效低成本,智能水平再升级 Gemini Flash 智能模型 高效成本 多模态推理 第2张

在下图中展示的基准测试中,Gemini 3 Flash在几乎所有基准测试中都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

03.结语:补全Gemini 3模型版图

自发布以来,Gemini 3系列模型广受好评。但高昂成本让不少用户望而却步。Gemini 3 Flash补全了家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境中的诉求。

从迭代开发、Vibe Coding到多模态应用、实时交互和智能体系统,Gemini 3 Flash展现的更高性价比有望帮助智能更广泛地嵌入日常应用和商业系统之中。