小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略

主机测评网
科技资讯
2026-03-07
748

从年初传出接触雷军并离职的消息，至上个月正式官宣加入小米，再到本月出席小米“人车家全生态大会”，被誉为“天才少女”的罗福莉，在台前正式发布了新模型MiMo-V2-Flash。

刚刚涉足这一领域的小米，交出了一份颇为亮眼的成绩单。

作为一个参数达309B、激活参数15B的“大”模型（罗福莉本人也提到，这个尺寸小到她自己都不愿称之为大模型），在小米团队的规划中，该模型旨在作为Agent的基座进行训练。

因此，模型的优化更侧重于特定方向，核心是高性价比与快速响应：

例如，能够实现每秒150 tokens的生成速度、极低的成本，在保持高性价比的同时，还确保了模型的性能。

“它的代码能力和Agent能力在公开公正的世界级评估榜单上，已跻身全球开源模型Top 1-2行列。”罗福莉表示，“大部分评估基准已经超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型持平，而它的参数规模仅为后者的1/2到1/3。”

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略小米 AI模型 MiMo-V2-Flash 端侧部署第1张

发布的小米模型，也遭遇了两极分化的评价，有人盛赞其代码能力领先，有人则认为这是“刷分”之作。

无论如何，小米需要AI。

选择在12月18日的人车家全生态大会上发布，更凸显了AI对小米的战略意义。

落实到智能终端，小米面临两大任务：第一，打造轻量化模型，依托端侧部署，升级“超级小爱”和澎湃OS，将AI融入智能终端；第二，在智能驾驶方面，小米更需要大模型作为基座，借助模型提升智驾能力。

在AI领域，小米用实际行动表明自己“动真格”了。

压成本、提速度，小米押注Agent

实际上，小米做AI的目标，或许早在2023年雷军的年度演讲中就已明确——“轻量化+端侧部署”。

罗福莉在演讲中直言，当前模型学习的方向与生物智能的进化路径存在背离，单纯的“大力出奇迹”已难以催生更高阶的智能。

当Scaling Law带来的提升逐渐收窄，小米选择了一条更符合自身特点的路径：打造参数小、性能优且成本低的模型。

“Scaling的范式已逐步从预训练（Pre-train）转向后训练（Post-train），”罗福莉解释道，“如何激发后训练的潜力？这需要一个稳定的范式，以便在强化学习（RL）上投入更多算力。”

因此，作为Agent的底层模型，MiMo-V2-Flash的优化逻辑聚焦于三个关键问题：

高效沟通：强化代码能力和工具调用，这是智能体交互的基础。

加速带宽：通过极高的推理效率，解决智能体间信息传递的瓶颈。

发力后训练：借助稳定范式，激发强化学习的潜能。

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略小米 AI模型 MiMo-V2-Flash 端侧部署第2张

由此，小米推出了309B的大模型MiMo-V2-Flash，从指标来看，其最突出的亮点在于代码能力。

官方数据显示，在SWE-Bench Multilingual（软件工程基准测试多语言版本）中，该模型甚至超越了包括GPT-5在内的一系列闭源大模型。

尽管在其他指标上，该模型与DeepSeek V3.2、kimi k2 Thinging等开源模型相比尚有微小差距，但作为尺寸较小的模型，表现已相当亮眼。

更关键的是该模型在推理速度和价格上的优化：

以Claude Sonnet 4.5为对比，小米新模型的推理价格仅为后者的2.5%，生成速度却是其2倍。

MiMo-V2-Flash的API定价为：输入0.7元/百万tokens，输出2.1元/百万tokens。与国内模型相比，这也是一个极具竞争力的价格。

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略小米 AI模型 MiMo-V2-Flash 端侧部署第3张

为了优化成本、提升推理速度，小米披露了其背后的技术架构——混合注意力机制。

在混合注意力机制方面，月之暗面、MiniMax等独角兽也曾进行过类似探索。

小米的选择是采用5:1的滑动窗口注意力（Sliding Window Attention, SWA）与全局注意力（Global Attention, GA）混合结构。

官方实验表明，SWA在长文和推理能力上优于主流的线性注意力机制，且固定大小的KV Cache极易适配现有基础设施（Infra）。

不过，对小米而言，若要达到会上宣讲的效果，将模型接入车、手机等设备，300B的规模仍然偏大，距离端侧落地尚有差距。

最耐人寻味的，或许是罗福莉在演讲时的结语：

“AI进化的下一个起点，必须有一个能与真实环境交互的物理模型，”罗福莉说道，“我们要打造的本质上不是一个程序，而是一个具备物理一致性、时空连贯性的虚拟宇宙。”

从今年小米的模型发布动态来看，我们推测，小米未来的优化将拆分为两条线：一是死磕端侧，为智能终端加码；二是攻克物理模型，补足智驾方面的模型能力。

做端侧、做智驾，AI为小米全家桶奠基

无论外界对参数和架构的讨论多么热烈，对小米而言，AI的价值最终必须回归业务。

选择在12月18日的人车家全生态大会上发布模型，本身就说明了AI对小米的战略意义：

在智能终端侧，通过升级“超级小爱”和澎湃OS，使它们从指令执行者转变为真正的助理；在智能驾驶侧，则急需大模型作为基座，拓展智驾的上限。

回顾2025年，小米在MiMo系列上的发力呈现出急行军的态势，与两年前模型发布后的平静不同，今年小米显得高调许多。

4月：开源MiMo-7B系列，涵盖基础、指令微调及强化学习版。

5月：发布MiMo-VL-7B，突破多模态视觉理解。

11月：推出MiMo-Embodied具身智能大模型，整合自动驾驶与机器人技术。

12月：MiMo-V2-Flash压轴登场，主打极致效率与Agent能力。

这一系列动作背后，是巨额资金的投入。小米集团总裁卢伟冰在财报电话会上明确表示，AI是核心研发方向。2025年，小米研发投入预计超过300亿元，其中四分之一（约75亿元）将直接投向AI领域，并计划在未来五年投入超过2000亿元。

“在端侧，我们要追求轻量算力、低功耗和周期成本，这样才能普及端侧AI，”卢伟冰说道，“这一定是小米未来的大方向，也是小米的优势所在。”

组织层面的动作，同样印证了小米的决心：从2024年开始，小米搭建了自己的AI Infra平台，去年年底，界面新闻爆料，小米正在着手搭建自己的GPU万卡集群，将对AI大模型大力投入。据悉，其团队成立时已有6500张GPU资源。

为支撑这一战略，小米的人才拼图也在2025年逐步完善。

除负责基础大模型的罗福莉外，小米还挖来陈龙服务于智驾团队。这种“双核”配置在技术路线上已初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身（X-Embodied）基座模型MiMo-Embodied。

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略小米 AI模型 MiMo-V2-Flash 端侧部署第4张

该模型试图解决自动驾驶与机器人之间的知识迁移难题，意味着小米正尝试用一套通用的AI逻辑，驱动其庞大的硬件生态——从手中的手机，到智能家居，再到智驾。

雷军曾提到，小米的AI战略是“轻量化+本地部署”。可见，小米一定会利用其在全球连接超过10亿台设备的巨大存量优势，通过AI拓展业务。

对小米而言，MiMo-V2-Flash的发布不仅是为了在排行榜上占据一席之地，更是向资本市场和用户讲述一个新故事：

一家硬件公司，正通过掌握最高效的“大脑”（AI模型）和最广泛的“身体”（人车家生态），试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通，不仅取决于模型本身的好坏，更取决于这些技术能否真正跑通每一台小米设备，转化为用户可感知的体验。

免费服务器服务器教程

本文由主机测评网于2026-03-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260329273.html

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略

压成本、提速度，小米押注Agent

做端侧、做智驾，AI为小米全家桶奠基

新能源装机目标持续攀升，电网消纳与技术自主成能源强国关键

苹果未来两年产品线大扩张：折叠屏iPhone与20周年纪念版领衔

小米发布MiMo-V2-Flash模型，罗福莉领衔AI新战略

压成本、提速度，小米押注Agent

做端侧、做智驾，AI为小米全家桶奠基

新能源装机目标持续攀升，电网消纳与技术自主成能源强国关键

苹果未来两年产品线大扩张：折叠屏iPhone与20周年纪念版领衔

相关文章