当前位置:首页 > 科技资讯 > 正文

小米AI新模型MiMo-V2-Flash:高效与成本优化并重

从年初与雷军接触、离职的消息,到加入小米并出席人车家全生态大会,罗福莉带着新模型MiMo-V2-Flash登台亮相。这一举动,标志着小米在AI领域的一次重要推进。

尽管作为参数规模相对较小的模型(309B、激活参数15B),但MiMo-V2-Flash在性能与成本之间找到了平衡。在追求高性价比的同时,该模型保证了极高的生成速度,每秒可达150 tokens,展现了其卓越的性能。

罗福莉自豪地表示,在多个世界级评估榜单中,该模型的代码能力和Agent能力已跻身全球开源模型的前列,部分评估基准甚至超越了DeepSeek-V3、Kimi K2-Thinking等模型,尽管其参数规模仅为后者的1/2至1/3。

小米AI新模型MiMo-V2-Flash:高效与成本优化并重 小米 AI模型 MiMo-V2-Flash 高效优化 第1张

然而,这款模型也引发了不同的声音。一方面,有人称赞其代码能力领先;另一方面,也有人质疑其“刷分”行为。但无论如何,小米对AI的需求是显而易见的。

在人车家全生态大会上,小米明确了两个关键任务:一是通过轻量化模型和端侧部署,升级“超级小爱”和澎湃OS,将AI接入智能终端;二是通过大模型基座,提升智能驾驶能力。

罗福莉在演讲中指出,单纯的“大力出奇迹”已难以造就更高阶的智能。因此,小米选择了参数小、性能好且成本低的模型路线。

为了优化模型性能,小米选择了混合注意力机制,并采用了5:1的滑动窗口注意力与全局注意力的混合结构。这一技术架构不仅提升了模型的推理效率,还降低了成本。

小米AI新模型MiMo-V2-Flash:高效与成本优化并重 小米 AI模型 MiMo-V2-Flash 高效优化 第2张

展望未来,小米将继续在AI领域深耕。通过优化端侧和智驾能力,小米试图打造一个具备物理一致性和时空连贯性的虚拟宇宙。

正如卢伟冰所言,小米将追求轻量算力、低功耗和周期成本,以普及端侧AI。这一战略不仅是为了在排行榜上占据一席之地,更是为了通过AI技术,驱动其庞大的硬件生态——从手机到智能家居,再到智能驾驶。

小米AI新模型MiMo-V2-Flash:高效与成本优化并重 小米 AI模型 MiMo-V2-Flash 高效优化 第3张