在12月17日举行的小米2025人车家全生态合作伙伴大会上,观众的焦点几乎全部集中在一位演讲者身上——Xiaomi Mimo大模型负责人罗福莉。
自从离开DeepSeek并低调加入小米以来,被业界誉为“AI天才少女”的罗福莉首次代表小米大模型团队公开亮相。大会前夕,小米发布并开源了最新的MoE大模型MiMo-V2-Flash,这成为罗福莉演讲的核心议题。
罗福莉在开场时强调,下一代智能体系统的核心在于Agent执行与Omni(全能)感知,涵盖记忆、推理、自主规划、决策和执行等多个层面,应当从单纯回答问题转向实际完成任务,并且需要统一多模态感知能力,为理解物理世界奠定基础。
她进一步指出,MiMo-V2-Flash在研发过程中主要围绕三个关键问题展开探讨。
首先,现代智能体必须具备高效的沟通语言,即强大的代码能力和工具调用能力;其次,“高带宽”是Agent协作的关键因素,因此需要围绕极致推理效率来设计模型结构;第三,模型训练范式正逐渐从预训练转向后训练,为了充分激发后训练的潜力,需要高效稳定的扩展强化学习训练方法。
图片来源:界面新闻
MiMo-V2-Flash是小米全新一代面向Agent的基座模型,总参数达309B,激活参数为15B,支持256k上下文窗口,整体针对推理、编码和Agent场景构建,支持混合思维模式,允许用户切换“思考”和即时回答模式。
在基准测试中,MiMo-V2-Flash的整体表现接近DeepSeek-V3.2,在SWE-Bench Verified/Multiligual、GPQA-Diamond等测试中略有优势,仅在HLE(人类最后的考试)及Arena-Hard(创意写作评估)两项测试中稍逊一筹。此外,该模型在AIME2025能力上接近GPT-5和Gemini 3.0 Pro。
作为首次公开亮相的成果,同时也是小米未来可能全面落地各个业务场景的智能体模型底座,罗福莉重点阐述了MiMo-V2-Flash的性价比优势及其技术背景。
目前,MiMo-V2-Flash的推理吞吐速度达到每秒150个token,定价为0.7元/每百万输入token,2.1元/每百万输出token。
在一张价格与速度构成的坐标轴图表中,MiMo-V2-Flash的速度与Gemini-2.5 Pro持平,但价格仅为后者的约二十分之一;其价格是DeepSeek V3.2的一半左右,但速度是后者的近3倍。
这样的推理效率主要源于两项技术创新。其一是模型注意力机制采用了Hybrid Sliding Window Attention(混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例为5:1。
罗福莉指出,相较于一些复杂的Linear Attention(线性注意力机制),SWA在兼顾长短文的推理、知识检索等方面表现更优。
一位AI大模型行业从业者向界面新闻记者表示,SWA本质上是一种Sparse Attention(稀疏注意力机制),业界普遍利用它解决长上下文的推理效率问题,其最大优势是可以将KV Cache保持在一个固定最大值,而不会随着上下文扩大而无限增长,从而实现降本增效。
他提到,这种机制核心要考虑的问题是在长文本任务中受到窗口策略限制可能表现不佳,这也是SWA会与Full Attention进行混合配比的原因之一。
MiMo-V2-Flash的另一项重要创新在于MTP(多令牌预测)。罗福莉表示,团队在训练时加入了一层MTP层以提高基座模型能力,并在微调时也加入了更多MTP层,最终在推理时加入了3层MTP,以加速并行token验证的方式实现了2-2.6倍推理速度的提升。
此外,为了提高强化学习训练的稳定性,MiMo团队提出了一种称为Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。相较于传统SFT+RL(微调+强化学习)的后训练方式,它可以提供稠密的token级别监督学习信号,以简单快速的方式获取各个专家模型的能力。
“我们还发现一个意外的现象,当学生模型很快超越老师模型时,我们能否将老师替换成学生继续自我迭代提升,这是一个正在进行中的工作。”罗福莉预告称。
图片来源:界面新闻
从这场演讲可以看出,罗福莉在小米大模型团队不仅要扮演科学家角色,还需要真正带领小米打造出能够落地其人车家全生态产品的AI基座模型及应用能力——在汽车、手机、大家电、智能穿戴等硬件产品线全面跨越阶段性门槛后,AI能力成为小米支撑下一个十年技术叙事的核心底座。
罗福莉几乎未谈论个人,唯一涉及团队构成的表述是,这是一个“小而美,却充满创业精神、极度好奇、追求真理”的年轻团队。此外,她认为在大模型的能力竞争中,算力和数据并非最终的护城河,“而是科学的研究文化与方法,是将未知问题结合模型优势转化为可用产品的能力”。
此外,在大会上,小米集团合伙人、集团总裁卢伟冰披露了小米“人车家全生态”的最新进展:用户规模方面,小米全球月活跃用户数达到7.42亿;硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家;软件生态方面,小米全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿。
本文由主机测评网于2026-02-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224464.html