当前位置:首页 > 科技资讯 > 正文

小米发布MiMo-V2-Flash模型,罗福莉领衔AI新战略

从年初传出接触雷军并离职的消息,至上个月正式官宣加入小米,再到本月出席小米“人车家全生态大会”,被誉为“天才少女”的罗福莉,在台前正式发布了新模型MiMo-V2-Flash。

刚刚涉足这一领域的小米,交出了一份颇为亮眼的成绩单。

作为一个参数达309B、激活参数15B的“大”模型(罗福莉本人也提到,这个尺寸小到她自己都不愿称之为大模型),在小米团队的规划中,该模型旨在作为Agent的基座进行训练。

因此,模型的优化更侧重于特定方向,核心是高性价比与快速响应:

例如,能够实现每秒150 tokens的生成速度、极低的成本,在保持高性价比的同时,还确保了模型的性能。

“它的代码能力和Agent能力在公开公正的世界级评估榜单上,已跻身全球开源模型Top 1-2行列。”罗福莉表示,“大部分评估基准已经超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型持平,而它的参数规模仅为后者的1/2到1/3。”

小米发布MiMo-V2-Flash模型,罗福莉领衔AI新战略 小米  AI模型 MiMo-V2-Flash 端侧部署 第1张

发布的小米模型,也遭遇了两极分化的评价,有人盛赞其代码能力领先,有人则认为这是“刷分”之作。

无论如何,小米需要AI。

选择在12月18日的人车家全生态大会上发布,更凸显了AI对小米的战略意义。

落实到智能终端,小米面临两大任务:第一,打造轻量化模型,依托端侧部署,升级“超级小爱”和澎湃OS,将AI融入智能终端;第二,在智能驾驶方面,小米更需要大模型作为基座,借助模型提升智驾能力。

在AI领域,小米用实际行动表明自己“动真格”了。

压成本、提速度,小米押注Agent

实际上,小米做AI的目标,或许早在2023年雷军的年度演讲中就已明确——“轻量化+端侧部署”。

罗福莉在演讲中直言,当前模型学习的方向与生物智能的进化路径存在背离,单纯的“大力出奇迹”已难以催生更高阶的智能。

当Scaling Law带来的提升逐渐收窄,小米选择了一条更符合自身特点的路径:打造参数小、性能优且成本低的模型。

“Scaling的范式已逐步从预训练(Pre-train)转向后训练(Post-train),”罗福莉解释道,“如何激发后训练的潜力?这需要一个稳定的范式,以便在强化学习(RL)上投入更多算力。”

因此,作为Agent的底层模型,MiMo-V2-Flash的优化逻辑聚焦于三个关键问题

高效沟通:强化代码能力和工具调用,这是智能体交互的基础。

加速带宽:通过极高的推理效率,解决智能体间信息传递的瓶颈。

发力后训练:借助稳定范式,激发强化学习的潜能。

小米发布MiMo-V2-Flash模型,罗福莉领衔AI新战略 小米  AI模型 MiMo-V2-Flash 端侧部署 第2张

由此,小米推出了309B的大模型MiMo-V2-Flash,从指标来看,其最突出的亮点在于代码能力。

官方数据显示,在SWE-Bench Multilingual(软件工程基准测试多语言版本)中,该模型甚至超越了包括GPT-5在内的一系列闭源大模型。

尽管在其他指标上,该模型与DeepSeek V3.2、kimi k2 Thinging等开源模型相比尚有微小差距,但作为尺寸较小的模型,表现已相当亮眼。

更关键的是该模型在推理速度和价格上的优化:

以Claude Sonnet 4.5为对比,小米新模型的推理价格仅为后者的2.5%,生成速度却是其2倍。

MiMo-V2-Flash的API定价为:输入0.7元/百万tokens,输出2.1元/百万tokens。与国内模型相比,这也是一个极具竞争力的价格。

小米发布MiMo-V2-Flash模型,罗福莉领衔AI新战略 小米  AI模型 MiMo-V2-Flash 端侧部署 第3张

为了优化成本、提升推理速度,小米披露了其背后的技术架构——混合注意力机制。

在混合注意力机制方面,月之暗面、MiniMax等独角兽也曾进行过类似探索。

小米的选择是采用5:1的滑动窗口注意力(Sliding Window Attention, SWA)与全局注意力(Global Attention, GA)混合结构。

官方实验表明,SWA在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有基础设施(Infra)。

不过,对小米而言,若要达到会上宣讲的效果,将模型接入车、手机等设备,300B的规模仍然偏大,距离端侧落地尚有差距。

最耐人寻味的,或许是罗福莉在演讲时的结语:

“AI进化的下一个起点,必须有一个能与真实环境交互的物理模型,”罗福莉说道,“我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。”

从今年小米的模型发布动态来看,我们推测,小米未来的优化将拆分为两条线:一是死磕端侧,为智能终端加码;二是攻克物理模型,补足智驾方面的模型能力。

做端侧、做智驾,AI为小米全家桶奠基

无论外界对参数和架构的讨论多么热烈,对小米而言,AI的价值最终必须回归业务。

选择在12月18日的人车家全生态大会上发布模型,本身就说明了AI对小米的战略意义:

在智能终端侧,通过升级“超级小爱”和澎湃OS,使它们从指令执行者转变为真正的助理;在智能驾驶侧,则急需大模型作为基座,拓展智驾的上限。

回顾2025年,小米在MiMo系列上的发力呈现出急行军的态势,与两年前模型发布后的平静不同,今年小米显得高调许多。

4月:开源MiMo-7B系列,涵盖基础、指令微调及强化学习版。

5月:发布MiMo-VL-7B,突破多模态视觉理解。

11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。

12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一系列动作背后,是巨额资金的投入。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一(约75亿元)将直接投向AI领域,并计划在未来五年投入超过2000亿元。

“在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI,”卢伟冰说道,“这一定是小米未来的大方向,也是小米的优势所在。”

组织层面的动作,同样印证了小米的决心:从2024年开始,小米搭建了自己的AI Infra平台,去年年底,界面新闻爆料,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。据悉,其团队成立时已有6500张GPU资源。

为支撑这一战略,小米的人才拼图也在2025年逐步完善。

除负责基础大模型的罗福莉外,小米还挖来陈龙服务于智驾团队。这种“双核”配置在技术路线上已初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。

小米发布MiMo-V2-Flash模型,罗福莉领衔AI新战略 小米  AI模型 MiMo-V2-Flash 端侧部署 第4张

该模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正尝试用一套通用的AI逻辑,驱动其庞大的硬件生态——从手中的手机,到智能家居,再到智驾。

雷军曾提到,小米的AI战略是“轻量化+本地部署”。可见,小米一定会利用其在全球连接超过10亿台设备的巨大存量优势,通过AI拓展业务。

对小米而言,MiMo-V2-Flash的发布不仅是为了在排行榜上占据一席之地,更是向资本市场和用户讲述一个新故事:

一家硬件公司,正通过掌握最高效的“大脑”(AI模型)和最广泛的“身体”(人车家生态),试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通,不仅取决于模型本身的好坏,更取决于这些技术能否真正跑通每一台小米设备,转化为用户可感知的体验。