年底了,谷歌再次发力,挑战AI极限。
就在近日,Gemini 3 Flash 正式登场,直接对标 OpenAI 和 Anthropic 的旗舰模型。据官方介绍,其速度比2.5 Pro快3倍,价格更是降至3 Pro的四分之一,性能却有不俗表现。
用谷歌的话来说,这是「为速度而生的前沿智能」,意味着又快又便宜,同时保持高效运算能力。
然而,在实际体验中,Gemini 3 Flash 的性能表现与 Pro 相比略显不足,存在一定落差。欢迎各位分享使用体验。 尽管如此,谷歌的发布时机选择依然堪称「快、准、狠」。 继 Gemini 3 Pro 与 Deep Think 之后迅速推出 Flash,旨在不给竞争对手喘息之机。这也让我愈发期待 Sam Altman 的圣诞节反击了。 从今日起,Gemini 产品线将包含三种模型: Gemini 3 Flash (Fast):主打速度,适合追求效率、无需长链条思考的对话场景。 Gemini 3 Flash (Thinking):具备轻量化模型推理能力,通过模拟人类思考提升复杂难题的准确率。 Gemini 3 Pro:性能巅峰,处理极高难度任务的首选。 基准测试显示,Gemini 3 Flash 保留了 Pro 级别的推理能力,但延迟和成本降至 Flash 级别。 在 GPQA Diamond 测试中,它取得 90.4% 的成绩,与大型模型不相上下。在 Humanity's Last Exam 测试中,无工具辅助下取得 33.7% 的分数。 更惊人的是 MMMU Pro 测试,Gemini 3 Flash 取得 81.2%,达到业界最先进水平,与自家的 3 Pro 相匹敌。 以往,「质量-成本-速度」难以兼顾。现在,谷歌用 Gemini 3 Flash 证明,只要工程化能力优化到位,六边形战士是存在的。 数据显示,其 Token 消耗比 2.5 Pro 少三成,速度快三倍,价格更是低至输入 0.5 美元/百万 Token,输出 3 美元/百万 Token。 现在的 AI 新模型不仅要卷参数,还要卷性价比了。 此外,它还是个推理型模型,能根据任务复杂度灵活调整「思考」时间。即使在最低等级下,其表现也常超前代模型的高等级。这种自适应能力在应用中尤为宝贵。 对开发者而言,Gemini 3 Flash 的出现意味着不再需要在速度和智能之间二选一。 基准测试显示,其在 SWE-bench Verified 编码测试中取得 78% 的高分,不仅优于 2.5 系列,甚至超过自家的 3 Pro。 此外,其多模态能力使其能更快处理视觉、音频等输入,适合需要即时反馈的交互场景。 谷歌展示了几个有趣的应用场景: 如「投球解谜」游戏中实时辅助推理; 在交互 UI 设计流程中生成加载动画; 提供图片进行基础识别并结合上下文生成交互式注释。这些 Demo 共同强调实时性、迭代效率和能跑起来。 谷歌还将 Gemini 3 Flash 嵌入搜索的 AI 模式中,逐步向全球开放。 与之前的版本相比,它更能理解复杂问题中的细节,从全网抓取实时信息和有用链接。 与此同时,Gemini 3 Flash 正在成为 Google「全家桶」的默认底座。
震撼!Gemini 3 Flash 跑分超越 Pro
开发者福音:速度智能兼得
Gemini 3 Flash 快是真的快,但 ……
谷歌的双轨战略:既卷死对手,又普及 AI
本文由主机测评网于2026-05-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546523.html