当前位置:首页 > 科技资讯 > 正文

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当

智东西12月17日报道,今日,小米公司隆重发布并开源了其最新研发的MoE大模型MiMo-V2-Flash,该模型拥有309B的总参数和15B的激活参数。在上午的小米2025小米人车家全生态合作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉发表了主题演讲,首次公开亮相

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第1张

该模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户切换模型是“思考”还是即时回答。它能一键生成功能齐全的HTML网页,并与Claude Code、Cursor和Cline等氛围编码框架协同工作。该模型提供256k上下文窗口,能够完成数百轮Agent交互和工具调用的任务。

基准测试结果显示,MiMo-V2-Flash的性能与DeepSeek-V3.2相当,仅在未使用任何工具辅助的“人类最后一场考试”和创意文本生成评估ARENA-HARD中略逊于DeepSeek-V3.2,但时延更小

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第2张

在多个Agent测评基准上,MiMo-V2-Flash位列全球开源模型Top 2;代码能力测评超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理价格仅为其2.5%,且生成速度提升至其两倍。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第3张

小米已开源了MiMo-V2-Flash的所有内容,并向开发者社区SGLang贡献了所有推理代码,API限时免费。目前,用户可在网页端免费体验MiMo-V2-Flash。

开源地址:点击这里

体验地址:点击这里

技术报告:点击这里

实测展示:强大的网页开发与聊天能力

智东西先对MiMo的网页开发能力进行了实测。首先,让其生成了一个包含商品主图轮播、规格选择、价格、库存等要素的电商页面。代码生成后,MiMo会在右侧显示预览界面,除查看商品大图功能需要在完整版使用外,其他元素几乎与真实的线上购物无异。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第4张

随后,智东西让其生成了一个网页版迷宫闯关小游戏,包含四个难度,通过鼠标和键盘控制。在生成的网页里,MiMo还增加了提示、积分、计时等功能,整个交互体验更加完整。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第5张

此外,智东西还让其生成了“圣诞树装饰”交互网页。网页左侧有彩灯、铃铛、星星、礼物盒、蝴蝶结等物品,可以拖动这些物品装饰到右侧的圣诞树上,还可以一键清空或直接生成随机装饰。整个画面会不断飘落雪花,并播放背景音乐。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第6张

技术亮点:高效推理与MOPD训练法

MiMo-V2-Flash采用全局注意力(GA)和滑动窗口注意力(SWA)的混合结构,为高通量推理设计了创新架构。得益于这种结构以及多词元预测(MTP)训练技术的引入,MiMo-V2-Flash在推理速度和效率上取得了显著提升。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第7张

此外,小米研究人员还提出了多教师在线策略蒸馏(MOPD)训练法,以高效拓展强化学习的计算规模并增强模型的推理能力与智能体自主决策能力。MOPD训练只需不到传统SFT+RL流程的1/50计算资源即可匹配教师模型的峰值表现。

小米发布开源大模型MiMo-V2-Flash,性能与DeepSeek V3.2相当 小米 大模型 MiMo-V2-Flash DeepSeek V3.2 第8张