新春科技竞赛,又一黑马崛起。
今日,MiniMax正式发布了新模型M2.5的官方消息,该模型提前两天便展现出了强劲实力,主打智能体和Vibe Coding,性能直逼Claude Opus 4.6。
M2.5兼容多种开发环境,从PC端到手机App,从React Native到Flutter,无所不能。而且,它不仅是前端到后端的真全栈解决方案,还包含数据库支持。
与以往模型相比,M2.5更加全面。过去的模型大多只处理前端,而M2.5从前到后,从界面到后端逻辑和数据存储,全部涵盖。
M2.5是为智能体生态而生。配合OpenClaw等脚手架工具,它能将自然语言直接转化为电脑上的具体操作。你只需理解业务逻辑,剩下的全栈代码实现由M2.5以100TPS的速度快速完成,且每小时成本仅需1美金。
在编程能力和任务执行这两个关键指标上,M2.5与Claude Opus 4.6并驾齐驱。
在编程领域最硬核的SWE-Bench Verified榜单中,M2.5获得了80.2%的高分;在多语言任务Multi-SWE-Bench上更是拔得头筹。
Vibe Coding模式下,M2.5能轻松应对全栈挑战,从界面设计到后端逻辑和数据库设计,一次性交付完整可运行的代码。
例如,面对一个“豪华猫咪隧道电商网站”的需求,M2.5不仅能实现极简风、视差滚动效果,后台还附带3D配置器。
M2.5生成的效果如大片般震撼,3D配置器也栩栩如生。整体网站感觉高端且功能齐全。
M2.5的底气源于其“原生Spec行为”——在编码前,它会像架构师一样主动拆解功能结构和UI设计。
其全栈能力得益于在Go、Rust、Python等10多种编程语言和数十万个真实环境中的磨练。
在处理长链路任务时,M2.5也经过专门优化。它引入了Process Reward机制,能全链路监控完成质量,解决了长任务易“跑偏”的问题。
在线演示只是开胃菜,接下来将M2.5带入真实的智能体环境中进行测试。
MiniMax称,适配各种智能体框架是M2.5的一大优势。
以爆火的OpenClaw为例,我在电脑上安装并接入了M2.5。
通过飞书将任务布置给M2.5控制的OpenClaw。例如,用Python生成一个包含100个财务文件的文件夹,要求将所有文件名清洗并统一格式。
文件迅速重命名后,OpenClaw还汇报了工作进度并生成了月度财务分析PPT。
激动人心的验收时刻来临。M2.5指挥的OpenClaw选择了科技感十足的深色主题。
它不仅处理了数据,还洞察了账单中的业务细节。例如,它发现“云计算服务”占支出大头,并建议与“星云云计算”谈年度合同以降低成本。
M2.5的发布是一个明确信号——AI应用的大爆发即将来临。
过去100多天里,M2系列在代码能力上的进步速度惊人,保持了行业最快的迭代节奏。这表明现在的模型在“智力”方面已准备就绪。
此外,M2.5解决了“贵”和“慢”两大难题。推理速度达到100TPS,且智能体工作一小时仅需1美金。
...(部分图片因版权未显示)
本文由主机测评网于2026-04-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260436219.html