当前位置:首页 > 科技资讯 > 正文

M2.5:全栈智能体,性能超Claude Opus

新春科技竞赛,又一黑马崛起。

今日,MiniMax正式发布了新模型M2.5的官方消息,该模型提前两天便展现出了强劲实力,主打智能体和Vibe Coding,性能直逼Claude Opus 4.6。

M2.5兼容多种开发环境,从PC端到手机App,从React Native到Flutter,无所不能。而且,它不仅是前端到后端的真全栈解决方案,还包含数据库支持。

与以往模型相比,M2.5更加全面。过去的模型大多只处理前端,而M2.5从前到后,从界面到后端逻辑和数据存储,全部涵盖。

M2.5是为智能体生态而生。配合OpenClaw等脚手架工具,它能将自然语言直接转化为电脑上的具体操作。你只需理解业务逻辑,剩下的全栈代码实现由M2.5以100TPS的速度快速完成,且每小时成本仅需1美金。

10B激活参数,跻身顶尖行列

在编程能力和任务执行这两个关键指标上,M2.5与Claude Opus 4.6并驾齐驱。

在编程领域最硬核的SWE-Bench Verified榜单中,M2.5获得了80.2%的高分;在多语言任务Multi-SWE-Bench上更是拔得头筹。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第1张

Vibe Coding模式下,M2.5能轻松应对全栈挑战,从界面设计到后端逻辑和数据库设计,一次性交付完整可运行的代码。

例如,面对一个“豪华猫咪隧道电商网站”的需求,M2.5不仅能实现极简风、视差滚动效果,后台还附带3D配置器。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第2张

M2.5生成的效果如大片般震撼,3D配置器也栩栩如生。整体网站感觉高端且功能齐全。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第3张

M2.5的底气源于其“原生Spec行为”——在编码前,它会像架构师一样主动拆解功能结构和UI设计。

其全栈能力得益于在Go、Rust、Python等10多种编程语言和数十万个真实环境中的磨练。

在处理长链路任务时,M2.5也经过专门优化。它引入了Process Reward机制,能全链路监控完成质量,解决了长任务易“跑偏”的问题。

文能编程,武能操控系统

在线演示只是开胃菜,接下来将M2.5带入真实的智能体环境中进行测试。

MiniMax称,适配各种智能体框架是M2.5的一大优势。

以爆火的OpenClaw为例,我在电脑上安装并接入了M2.5。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第4张

通过飞书将任务布置给M2.5控制的OpenClaw。例如,用Python生成一个包含100个财务文件的文件夹,要求将所有文件名清洗并统一格式。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第5张

文件迅速重命名后,OpenClaw还汇报了工作进度并生成了月度财务分析PPT。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第6张

激动人心的验收时刻来临。M2.5指挥的OpenClaw选择了科技感十足的深色主题。

它不仅处理了数据,还洞察了账单中的业务细节。例如,它发现“云计算服务”占支出大头,并建议与“星云云计算”谈年度合同以降低成本。

AI浪潮汹涌澎湃

M2.5的发布是一个明确信号——AI应用的大爆发即将来临。

过去100多天里,M2系列在代码能力上的进步速度惊人,保持了行业最快的迭代节奏。这表明现在的模型在“智力”方面已准备就绪。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第7张

此外,M2.5解决了“贵”和“慢”两大难题。推理速度达到100TPS,且智能体工作一小时仅需1美金。

M2.5:全栈智能体,性能超Claude Opus M2.5 智能体 Vibe Coding 全栈代码 第8张

...(部分图片因版权未显示)