当前位置：首页 > 科技资讯 > 正文

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局

主机测评网
科技资讯
2026-02-10
470

在12月17日，Google隆重推出了Gemini 3 Flash。这款定价仅为Claude的1/5和GPT的1/4的轻量级模型，在编码任务上超越了Claude Sonnet 4.5，在推理和多模态领域表现卓越，甚至与GPT-5.2旗鼓相当。

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第1张

MMMU-Pro多模态评估结果展示：

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第2张

更令人惊叹的是，它甚至超越了自家旗舰：在SWE-bench测试中，Gemini 3 Flash达到78%，而Gemini 3 Pro为76.2%，这是Flash系列首次超越同代Pro模型。

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第3张

数据或许不够直观，让我们看看它的实际应用：

Gemini 3 Flash能够单次生成完整的动画3D程序化房间

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第4张

使用Gemini 3 Flash一句话即可生成可玩游戏

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第5张

Resemble AI利用Gemini 3 Flash实时分析deepfake视频：他们的产品需要将复杂的音视频取证数据即时转化为普通人能理解的分析结果。测试中，3 Flash的多模态分析速度比2.5 Pro快了4倍，能够在不拖慢关键工作流的情况下处理原始技术输出数据。

一个月前，Gemini 3 Pro和Deep Think的发布让Google重新站回AI第一梯队，Gemini 3 Pro登顶LMArena，Deep Think在ARC-AGI上取得其他模型三倍的成绩。发布以来，Gemini API日均处理量突破1万亿tokens。如今，Flash的到来补齐了Gemini 3家族的最后一块拼图。

但这次的Gemini 3 Flash与以往不同。过去我们对Flash的认知很清晰：快速、便宜但能力有限。追求速度，就得在智能上妥协。然而Gemini 3 Flash打破了这个惯例，它以轻量模型的价格，提供了旗舰级的能力。

1/5的价格，为何能挑战旗舰？

首先与其他竞争对手对比。

在博士级科学推理基准GPQA Diamond上，Gemini 3 Flash获得90.4%，大幅领先Claude Sonnet 4.5的83.4%，接近GPT-5.2的92.4%。在多模态理解基准MMMU-Pro上，Flash达到81.2%，超过GPT-5.2的79.5%，更甩开Claude Sonnet 4.5十几个百分点。

在人类最后考试Humanity"s Last Exam上（无工具），Gemini 3 Flash为33.7%，Claude Sonnet 4.5仅为13.7%——差距近20个百分点。

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第6张

编码能力同样亮眼。在SWE-bench Verified上，Gemini 3 Flash为78%，超过了Claude Sonnet 4.5的77.2%，首次超越自家3 Pro的76.2%。

加入价格因素后更夸张：Flash价格约为Claude的1/5、GPT的1/4，但在多项指标上打平甚至领先。如果说以前选Flash是快、省钱但有妥协，现在选Flash是省钱还省心。

那么一个问题自然出现：Gemini 3 Pro还有什么用？

极限推理场景。GPQA Diamond上Pro为91.9% vs Flash 90.4%，Humanity"s Last Exam上Pro为37.5% vs Flash 33.7%，加上只有Gemini 3 Pro才有的Deep Think模式。Pro适合极限推理，Flash适合高频代理任务，这是Google给出的新分工。

但对大多数场景，Flash不仅够用，而且性价比极高。

效率层面同样显著。根据Artificial Analysis测试，Gemini 3 Flash比2.5 Pro快3倍，处理日常任务平均节省30% token消耗。定价上，输入$0.50/百万tokens，输出$3/百万tokens，只有3 Pro的四分之一。

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第7张

Gemini 3 Flash在性能、成本与速度的权衡上推进了最优边界。

Google官方表示：“速度和规模，不必以牺牲智能为代价。”对以往Flash可能是口号，但这次数据确实验证了这一点。

免费用户，旗舰体验

Gemini 3 Flash的发布不只是API层面，它将直接改变普通用户的日常体验。

在Gemini App里，Gemini 3 Flash会替代原来的2.5 Flash，成为新默认模型。这意味着全球所有Gemini用户，包括免费用户，都将自动升级到Gemini 3级别体验，无需付费或设置。

升级后的App提供三种模式：

Fast（极速）：默认由Gemini 3 Flash驱动，秒回日常问题。
Thinking（思考）：同样由Flash 3驱动，但激活“深度思考”能力，处理复杂逻辑。
Pro（专业）：继续保留Gemini 3 Pro，作为高难度数学和代码问题首选。

Google发布Gemini 3 Flash：轻量模型重塑AI性价比格局 Gemini Flash AI模型多模态性价比第8张

在Google Search里，AI Mode的默认模型也将在全球升级到3 Flash。Google表示，得益于3 Flash强大的推理和多模态能力，AI Mode现在能更精准理解用户意图，处理更复杂、有多重约束的问题，同时生成结构清晰、易于消化的回答。

对美国用户，Google还开放更多选项，可在AI Mode里选择“Thinking with 3 Pro”获得深度帮助，图像生成模型Nano Banana Pro也向更多美国用户开放。

对普通用户，这可能是感知最明显的升级。打开Gemini，它已是前沿模型；在Google搜索问复杂问题，背后是融入顶级大模型能力的引擎。换言之，免费用户用的默认模型，能力已不输其他家付费旗舰。

开发者：省钱还赚到

以前做代理应用，想用旗舰模型就得付旗舰价格。Gemini 3 Flash改变了局面。

过去开发者面临两难：要么用快但笨的小模型，牺牲任务质量；要么用聪明但慢且贵的大模型，面对延迟和成本压力。尤其在需要多轮调用、高频迭代的代理场景，取舍几乎是绑定的。Gemini 3 Flash提供新选项：足够快、足够聪明、成本可控。SWE-bench上78%的成绩说明它能处理复杂编码任务，3倍于2.5 Pro的速度胜任延迟敏感实时场景，1/5于竞品的价格让大规模部署可能。

目前，Gemini 3 Flash已在以下平台上线（预览）：

Google AI Studio和Gemini API
Gemini CLI
Android Studio
Vertex AI（面向企业）
Google Antigravity：这是Google新推出的代理开发平台，专为AI主导的软件开发流程设计，让AI Agent直接操作编辑器、终端和浏览器

在高频调用场景，Google还提供配套成本优化方案。Context Caching功能可在重复token使用达阈值时降90%成本；Batch API支持异步批量处理，成本再降50%，同时提供更高调用配额。对需在生产环境大规模跑代理任务的团队，这套组合拳相当有吸引力。

Flash的含义变了

Gemini 3 Flash的发布，重新定义了“Flash”品类的含义。

Flash，终于不只是快速和效率了。

过去，Flash或轻量级模型定位明确：用能力换速度和成本优势。选Flash就意味着接受智能折扣。但Gemini 3 Flash证明了另一种可能：当底层基础模型足够强大，轻量版本不一定做太多能力阉割，它可以只是“更高效的满配版”。

Google在博客提到，Gemini 3 Flash的核心模型能力已强到一定程度：在很多任务上，关掉思考模式的3 Flash，比开着思考模式的2.5版本表现还好。以前需牺牲速度换准确，现在不用了。

这次发布也让Gemini 3家族阵容正式成型：Gemini 3 Pro、Gemini 3 Deep Think、Gemini 3 Flash三个版本，覆盖从轻度用户到硬核开发者的完整需求谱系。想要极致推理深度，用Deep Think；想要最强综合能力，用Pro；想要又快又好还便宜，用Flash。各取所需，不再是单选题。

从数据看，Google在AI产品化路上跑得稳。Gemini App月活突破6.5亿，开发者数量达1300万，API调用量同比增长3倍。上季度到这季度，用户数从4.5亿猛增到6.5亿。

目前，普通用户可直接在Gemini App和Google Search的AI Mode中体验新模型；开发者可通过Google AI Studio和Gemini API开始构建应用。

当Google用Flash模型1/5的价格打出旗舰级能力，Flash品类的想象空间被彻底打开。