智东西12月18日消息,谷歌于近日晚间正式推出了Gemini 3 Flash人工智能模型,其目标是在大幅降低使用成本的同时,提供行业领先的智能水平。
具体而言,该模型每百万token的输出成本仅为Claude Sonnet 4.5的20%和GPT-5.2的21%,但在多项基准测试中,其性能却媲美甚至超越了这些旗舰级模型。
即便是与Gemini 3 Pro相比,Gemini 3 Flash也展现出极高的性价比。Flash的价格仅为Pro版本的25%,却在MMMU-Pro、SWE-bench Verified等核心基准测试上,实现了对Pro模型的超越。
此前发布的Gemini 3系列模型在复杂推理、多模态视觉理解、智能体及Vibe Coding任务方面均表现出色,Gemini 3 Flash继承了这些优势,将Gemini 3 Pro级别的推理能力与Flash系列的低延迟、高效率和低成本特性完美结合。
谷歌首席科学家Jeff Dean表示,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也提升3倍,而且价格仅为后者的几分之一。以下是并排演示:
Gemini 3 Flash目前已全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity进行使用。普通用户则能通过Gemini应用程序和谷歌搜索中的AI模式体验其功能。
Gemini 3 Flash究竟有哪些应用?谷歌指出,这是一款专为迭代式开发设计的模型,能够以低延迟提供接近Gemini 3 Pro级别的编程性能。
谷歌分享了多个实际案例。例如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,为用户提供近乎实时的AI辅助。
它还能近乎实时地构建和A/B测试新的加载动画设计,从而简化从设计到代码的转换流程。
利用多模态推理能力,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成相应字幕,最终将静态图像转化为交互式体验。
凭借在推理、工具使用和多模态能力方面的卓越表现,Gemini 3 Flash 特别适合那些希望进行更复杂视频分析、数据提取和视觉问答的开发者。
Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解各类信息。用户可要求Gemini解析视频和图像,并在几秒钟内将该内容转化为有用且可操作的计划。
在Gemini应用程序中,Gemini 3 Flash可以分析短视频内容并提供改进建议,比如如何优化高尔夫挥杆动作。
由于Gemini 3 Flash针对速度进行了优化,它能在用户绘图过程中实时“识别”并猜测所绘内容。
用户可以上传一段录音,Gemini 3 Flash将识别知识盲点,创建自定义测验,并对答案给出详细解释。
或者,尝试“用嘴编程”,仅通过语音输入从零开始构建有趣、实用的应用程序。Gemini 3 Flash能在几分钟内将非结构化的想法转化为功能正常的应用程序。
Gemini 3 Flash在基准测试中表现如何?它在GPQA Diamond(90.4%)和Humanity"s Last Exam(不使用工具时为33.7%)等博士级推理和知识基准测试中,可与更大型的前沿模型相媲美,并且在多项基准测试中显著优于Gemini 2.5 Pro。
在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越了2.5系列,也超过了Gemini 3 Pro。
它还在MMMU Pro上达到了81.2%的分数,与Gemini 3 Pro相当,实现了业界领先的性能。
在下图展示的基准测试中,Gemini 3 Flash在几乎所有测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。
除了前沿级别的推理和多模态能力外,Gemini 3 Flash的构建旨在实现高效率,推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系,其中一条线标出了穿过Gemini 3 Pro、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。
在思考预算最大化时,Gemini 3 Flash能够自动调节其思考量。对于更复杂的用例,它可能会思考更长时间。但根据典型流量测量,在以更高性能准确完成日常任务的前提下,它平均比2.5 Pro少使用30%的tokens。
Gemini 3系列模型自发布以来广受好评,但其高昂成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境中的需求。
从迭代式开发、Vibe Coding,到多模态应用、实时交互和智能体系统,Gemini 3 Flash所展现的更高性价比,有望帮助人工智能技术更广泛地嵌入日常应用和商业系统之中。
本文由主机测评网于2026-02-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224587.html