小米AI新模型MiMo-V2-Flash：高效与成本优化并重

从年初与雷军接触、离职的消息，到加入小米并出席人车家全生态大会，罗福莉带着新模型MiMo-V2-Flash登台亮相。这一举动，标志着小米在AI领域的一次重要推进。

尽管作为参数规模相对较小的模型（309B、激活参数15B），但MiMo-V2-Flash在性能与成本之间找到了平衡。在追求高性价比的同时，该模型保证了极高的生成速度，每秒可达150 tokens，展现了其卓越的性能。

罗福莉自豪地表示，在多个世界级评估榜单中，该模型的代码能力和Agent能力已跻身全球开源模型的前列，部分评估基准甚至超越了DeepSeek-V3、Kimi K2-Thinking等模型，尽管其参数规模仅为后者的1/2至1/3。

小米AI新模型MiMo-V2-Flash：高效与成本优化并重小米 AI模型 MiMo-V2-Flash 高效优化第1张

然而，这款模型也引发了不同的声音。一方面，有人称赞其代码能力领先；另一方面，也有人质疑其“刷分”行为。但无论如何，小米对AI的需求是显而易见的。

在人车家全生态大会上，小米明确了两个关键任务：一是通过轻量化模型和端侧部署，升级“超级小爱”和澎湃OS，将AI接入智能终端；二是通过大模型基座，提升智能驾驶能力。

罗福莉在演讲中指出，单纯的“大力出奇迹”已难以造就更高阶的智能。因此，小米选择了参数小、性能好且成本低的模型路线。

为了优化模型性能，小米选择了混合注意力机制，并采用了5:1的滑动窗口注意力与全局注意力的混合结构。这一技术架构不仅提升了模型的推理效率，还降低了成本。

小米AI新模型MiMo-V2-Flash：高效与成本优化并重小米 AI模型 MiMo-V2-Flash 高效优化第2张

展望未来，小米将继续在AI领域深耕。通过优化端侧和智驾能力，小米试图打造一个具备物理一致性和时空连贯性的虚拟宇宙。

正如卢伟冰所言，小米将追求轻量算力、低功耗和周期成本，以普及端侧AI。这一战略不仅是为了在排行榜上占据一席之地，更是为了通过AI技术，驱动其庞大的硬件生态——从手机到智能家居，再到智能驾驶。

小米AI新模型MiMo-V2-Flash：高效与成本优化并重小米 AI模型 MiMo-V2-Flash 高效优化第3张