圣诞佳节临近,全球科技圈洋溢着如同欢庆中国新年般的喜悦氛围。
然而,谷歌却在此刻出其不意,似乎不想让大家平静度过这个西方节日。
昨日,谷歌在毫无预兆的情况下,突然推出了Gemini 3 Flash模型。此次升级距离Gemini 3 Pro发布仅一月之隔,离2.5 Pro Flash亮相也才半年时间。
Gemini团队宣称,这是他们迄今最为重大的升级举措。
平心而论,自Gemini 2.5 Pro问世以来,日常使用体验已显著提升,许多用户养成了“GG一下,你就知道”的习惯。
Gemini 3发布后,我们明显感受到了模型升级带来的红利。
但Gemini此前也存在一些体验问题,例如倾向于过度思考,即使面对简单问题也要反复斟酌。
针对这一痛点,推出Flash版本无疑是最佳解决方案。
谷歌此次没有让人失望,3 Flash的表现备受赞誉。
借用国内新能源厂商流行的一句话:“入门即旗舰,标配即顶配”。
以往我们对Flash系列的印象是什么?
速度快、成本低,但智能水平有限,处理长文档摘要尚可,一旦涉及复杂编码或逻辑推理,往往漏洞百出。
但这次的Gemini 3 Flash,谷歌竟声称其智力水平并未降低,同时在速度和效率上实现双重提升,全面超越了上一代旗舰模型Gemini 2.5 Pro。
更令人惊叹的是,这并非谷歌自卖自夸。在多项测试中,它与规模更大的顶尖模型打得难解难分。
在MMMU Pro测试中,Gemini 3 Flash取得了81.2%的得分,与自家全新旗舰模型3 Pro持平。
最为惊人的是,在极端情况下,3 Flash甚至能超越Gemini 3 Pro。
在SWE-bench编码基准测试中,Gemini 3 Flash获得78%的分数,仅次于GPT-5.2,超过了3 Pro。
更让其他大模型厂商焦虑的是,如此卓越的Gemini 3 Flash定价极为亲民。
数据显示,其Token价格仅为输入0.5美元/百万Token,输出3美元/百万Token。
这是什么概念?同一任务,其成本比2.5 Pro降低三成,速度却提升三倍。
因此,谷歌方面表示,3 Flash的发布将助力众多企业高效处理批量任务,实质上是为这些公司降本增效。
尽管听起来颇为震撼,但在我们简单体验一天后发现,在速度上,3 Flash确实优势明显,但若论任务处理的准确性,要与3 Pro一较高下,似乎仍有夸大之嫌。
例如,我们让3 Flash编写一个“WebRTC的纯前端投屏”代码,结果生成的页面无法正常使用,即使多次调试也未能解决问题。
但当我们将代码交给3 Pro时,这位“老大哥”迅速定位了问题所在。
并顺手提供了一份修正版的代码。
类似案例不胜枚举,在此不再赘述。
就目前而言,3 Flash的优势在于快速响应和低成本,若涉及长链条思考或高难度任务,还是建议使用Pro版本。
但如果与其他厂商的轻量级模型对比,3 Flash足以让对手感叹:你还是回高端局去吧。
当然,谷歌此时推出3 Flash,绝非单纯依靠模型能力取胜。在我们看来,其目的是凭借生态优势碾压竞争对手。
例如,此次3 Flash直接集成到谷歌搜索的AI模式中。相比之前略显鸡肋的状态,全新升级的谷歌AI搜索能更精准理解问题细节,从全网抓取的信息和链接质量远超以往。
在可见的未来,YouTube、Gmail、谷歌地图等全家桶服务都将内置Gemini 3 Flash。
面对这种局面,即便是奥特曼,还能安然入睡吗?
有趣的是,Gemini 3的发布已让奥特曼在OpenAI内部拉响红色警报。
上周,他在受访时表示,谷歌Gemini 3模型对公司业绩的影响并未如最初担忧那般严重,并放话称计划在明年1月解除红色警报状态。
如今情况有变,或许到1月时,红色警报虽已解除,但可能升级为更严峻的黑色警报。
因此,Gemini 3 Flash或许只是开胃菜。当谷歌生态中的各类网页和应用程序能像水电一样廉价普及AI时,单纯比拼模型参数的时代可能就此终结。
毕竟在生态竞争中,留给OpenAI等对手的时间确实不多了。
本文由主机测评网于2026-02-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224719.html