国产模型再次引领潮流,Minimax M2荣登开源模型榜首!
在之前的榜单中,DeepSeek和Qwen分别来自杭州,而现在这一荣誉转给了上海的Minimax。M2在第三方评测机构Artificial Analysis的测试中,以61分的高分位居第一,紧随Claude 4.5 Sonnet。
Minimax M2专为智能体和编程而生,拥有出众的编程能力和Agent表现。其经济高效的特点,使得推理速度是Claude 3.5 Sonnet的两倍,而API价格仅为其8%。
Minimax表示,M2的出世打破了智能水平、速度和成本之间的“不可能三角”。
目前,M2的完整模型权重已经开源,采用MIT协议,在线Agent平台和API也限时免费。
Minimax M2是一个稀疏度较高的MoE模型,总参数量达230B,激活参数量仅为10B。网友表示,这样的激活参数运行起来会非常快。
M2的另一个特色是采用了交错的思维格式,能够规划和验证跨多个对话的操作步骤,这对于Agent推理至关重要。
M2在Agent最关键的三个能力——编程能力、工具使用能力和深度搜索能力上表现优异,特别是在工具使用和深度搜索方面不逊于海外顶尖模型。
在Artificial Analysis的测试中,M2获得了总排名第五、开源第一的成绩。该测试使用了包括MMLU Pro、GPQA Diamond等在内的10个热门数据集。
M2的定价是每百万输入Token为人民币 8.4元(约合美元 1.6元),每百万输出Token为人民币 33.6元(约合美元 6.4元)。
Minimax绘制了一张图来比较各大模型的性价比(横轴越向右成本越低)。
在线推理服务的速度可达每秒100Token,Minimax也画了一张图体现以速度衡量的性价比。
同时,Minimax团队还针对三项任务对M2和其他模型进行了一对一比拼,结果显示M2具有极高的Win+Tie比例和低成本。
Minimax已经把M2部署到了Agent平台,并限时免费使用。按官方说法,免费期将持续到服务器无法承受为止。
本文由主机测评网于2026-05-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543456.html