当前位置:首页 > 科技资讯 > 正文

大模型领域再掀热潮:MiniMax M2技术突破与商业化进程引领中国AI回归

在经历了一段相对平静的时期后,大模型领域再次迎来了蓬勃生机。尽管昔日流行的“AI六小虎”概念已逐渐淡出公众视野,但作为国内首批投身大模型研发的企业,这六家公司的命运轨迹在悄然中已分道扬镳。其中,智谱与MiniMax正凭借扎实的技术成果与市场表现,向资本市场发起IPO冲刺;而其余几家则处境各异,有的正在寻求新的融资机会,有的则不得不采取收缩策略以求生存。

近期,行业动态频传。上周,Kimi被披露已完成一轮数额可能高达数亿美元的新融资。几乎与此同时,国内大模型厂商MiniMax开启了新一轮的技术发布活动,其重点推出的MiniMax-M2模型强势回归文本领域,直接挑战海外科技巨头的核心优势地带。

更早一些,在9月底,智谱发布了其GLM系列的最新旗舰文本模型GLM-4.6,该模型被定位为公司迄今最强的代码生成模型,其功能定位与此次MiniMax的M2模型不谋而合。对此,有投资人指出:“大模型的技术演进方向从来都是公开的竞争焦点。”无论如何,这一系列动作清晰地表明,无论是在资本市场还是核心技术赛道,中国大模型企业正展现出强劲的回归态势。

“大模型的技术领先窗口期仅剩三个月”

这种“回归”最显著的标志,莫过于MiniMax-M2模型在海外发布后迅速引发关注。该模型在全球权威测评榜单Artificial Analysis (AA)中,综合得分跃居全球前五、开源模型第一,成功跻身全球文本模型的第一梯队。M2也成为首个进入该顶级梯队的中国本土模型。

最新数据显示,M2模型上线仅五天,其在API整合平台OpenRouter上的实时调用token量已攀升至全球第三位,超越了DeepSeek和Qwen等模型;在编程专用场景中,其调用量同样位列全球第三,并登上了HuggingFace的Trending榜单首位。

过去,MiniMax更多因其在“视频、语音”等多模态大模型方面的成就而闻名。而本次发布周的核心焦点,却落在了专为“智能体(Agent)和代码生成(Coding)而设计”的MiniMax-M2模型上。

大模型领域再掀热潮:MiniMax M2技术突破与商业化进程引领中国AI回归 大模型  MiniMax 商业化 技术迭代 第1张

图/海螺视频官网截图

更为关键的是,M2模型提供了极具竞争力的综合成本。其API定价定为每百万Token输入0.3美元,输出1.2美元,同时能提供TPS(每秒事务处理量)在100左右的高性能推理服务。这一价格仅为Claude Sonnet 4.5的8%,而推理速度却快了近一倍。

外界分析认为,这是MiniMax主动切入白热化细分市场的战略选择。在基础模型这个“强者恒强”的赛道中,证明自身实力的最佳方式,就是投身于竞争最激烈的战场。目前来看,这个战场正是智能体(Agent)和代码生成两大领域。就在一个月前,Anthropic刚刚推出了号称“世界最强编程模型”的Claude Sonnet 4.5。紧接着,OpenAI在开发者大会上发布了GPT-5 Pro,该模型的核心升级方向也聚焦于精准编码与智能体构建能力。

因此,MiniMax的举措不难理解,也并非临时起意。早在6月技术周发布的MiniMax-M1系列模型,就已为此次更新进行了铺垫和探路。实际上,M2模型并非MiniMax首次突破海外技术壁垒。同样在6月,其推出的视频生成大模型Hailuo 02就率先在视频生成领域打破了国外垄断。从Hailuo 02到M2,MiniMax在短短四个月内实现了在“视觉”与“语言”两大核心模态上的双重突破——这在业界尚无先例。

然而,模型赛道一直存在一个不公开的共识——“大模型的技术领先优势保质期可能只有三个月”。这意味着,一个模型在发布时所具备的技术领先窗口期正在急剧缩短。这也解释了为何MiniMax创始人闫俊杰认为,“当前MiniMax最重要的目标不是增长,也不是收入,而是加速技术迭代”。

这种选择并非个例。全球头部厂商正以近乎季度冲刺的节奏推动技术突破。例如,阿里巴巴的通义千问Qwen 3系列从发布到重大更新仅用了85天,迭代周期比上一代缩短了35%;OpenAI在2025年10月推出的GPT-5 Pro,相较于同年8月发布的GPT-5,新增了工具调用与智能体能力。这种快速的迭代节奏,使得模型性能的领先窗口期从过去的半年左右压缩至仅约三个月。

商业化落地成为核心命题

大模型快速迭代的背后,是厂商们对于商业化落地的迫切期待与真实反馈。一个合乎逻辑的商业叙事是:当技术迭代速度足够快、能力足够强时,用户自然会随之迁移。一个典型的例子是,2025年中,Anthropic凭借其Claude系列在代码生成领域的突破,企业市场份额从12%大幅跃升至32%,超越OpenAI(25%)成为新的领跑者。这种市场格局的变动,源于用户对模型垂直领域能力的敏感度已经超越了品牌忠诚度。

谈及研发M2模型的初衷,MiniMax创始人闫俊杰在其以花名“IO”署名的官方文章中写道:一款优秀的模型需要在效果、价格和推理速度三者之间取得良好的平衡,这几乎是一个“不可能三角”。海外顶尖模型可能效果出色,但价格昂贵且推理速度较慢;国内模型价格相对便宜,但在效果和推理速度上可能存在差距。这导致现有的智能体(Agent)产品为了追求好效果,往往定价高昂,或者速度较慢,例如不少Agent产品的月费经常达到数十甚至数百美元,完成一个任务可能需要小时级的时间。我们一直在探索,能否打造一款在效果、价格和速度上取得更佳平衡的模型,从而让更多人能够受益于Agent时代的生产力提升,延续我们“Intelligence with Everyone”(智能普惠)的愿景。

大模型领域再掀热潮:MiniMax M2技术突破与商业化进程引领中国AI回归 大模型  MiniMax 商业化 技术迭代 第2张

图/海螺视频官网截图

简而言之,M2的出现是为了让全球更多开发者和企业,能够以可负担的成本用上第一梯队性能的模型。当性能指标不再是唯一的竞争焦点时,纯技术的护城河便开始变浅,而实用性、成本与速度的综合价值便占据上风。M2在海外上线后,全球开发者用实际行动做出了选择,通过API快速接入M2。其在OpenRouter平台升至全球第三的排名,是中国模型迄今为止取得的最好成绩,甚至超越了OpenAI和Anthropic的模型。中国模型正在吸引硅谷及全球开发者的自发采用,这一切都源于M2模型自身的竞争力与自然增长。

MiniMax的选择也代表了中国大模型企业的一种典型发展路径——高度重视商业化落地,这也是其优势所在。数据提供了更直观的证明:截至9月,MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家和地区的逾1.57亿个人用户,以及来自超过90个国家和地区的50,000余名企业客户与开发者提供服务。

MiniMax的早期投资人曾提到:“相比于国内其他大模型厂商,MiniMax的营收来源更加市场化,现金流也更健康。这也是其估值增长能够领跑同行的重要原因之一。”当然,这背后离不开创始团队对AI商业化落地的深刻理解。

与其他大模型公司不同,MiniMax的核心团队亲历了从“AI 1.0”到“AI 2.0”的产业变迁与阵痛。这种稀有经历使他们更深切地理解技术落地的重要性——不是依赖单一的项目制,而是通过开放API、发力企业服务(To B),成为那个“先帮助合作伙伴赚钱的朋友”。

这种务实的态度迅速获得了资本市场的认可:红杉中国、阿里巴巴、高瓴资本、IDG资本、明势资本、腾讯、米哈游以及上海国资等机构陆续注资,使其估值增速在所谓的“AI六小虎”中保持领先。今年,MiniMax已正式向港交所递交上市申请,有望摘得“中国大模型第一股”的桂冠。

上市前的关键冲刺

谈到上市,今年6月MiniMax发布技术周时,恰逢其上市传闻首次曝光,让这家一贯低调的公司成为舆论焦点。巧合的是,与本次发布周几乎同步,市场传出了OpenAI正在筹备IPO的消息。据路透社援引知情人士称,OpenAI估值最高可能达到1万亿美元,这或许将成为历史上规模最大的IPO之一。尽管OpenAI很快否认了具体的上市时间表,但却向外透露了一个关键信息——其年营收远超外界此前预估的130亿美元(约合人民币926亿元)。

无独有偶,Anthropic在9月完成130亿美元F轮融资时,曾披露截至2025年8月,其年化收入已超过50亿美元。强大的商业化能力成为支撑其估值的核心,此轮融资后Anthropic的估值达到了1830亿美元。

由此可见,在这个日渐务实、竞争日趋同质化的市场中,支撑起估值想象空间的关键变量,最终落在了商业化能力上。

毫无疑问,DeepSeek等模型的出现,让中美大模型市场呈现出不同的发展路径。尤其是在资本市场,曾风光无限的“AI六小虎”进入了不同程度的调整期,除了经历技术与人员的更迭,更重要的是估值和市场预期都经历了回调。而让国内大模型厂商重拾信心的方式,除了持续的融资,便是扎实的商业化落地。从结果看,智谱和MiniMax确实走在了前面。在融资方面,今年上半年,智谱接连完成多轮大额融资,且多有地方政府资金参与;相比之下,MiniMax延续一贯低调作风,虽已完成多轮融资,但极少对外官宣,其最新估值已接近300亿元。基于此,有分析指出,此次发布的M2模型是MiniMax向企业端用户发力的又一重要举措,标志着其在文本模型的全球竞争中再下一城,并已经开始切入Anthropic等巨头所主导的企业服务市场份额。

在当前的大模型叙事下,MiniMax呈现出近乎完美的企业画像——兼具全球多模态顶级厂商的估值想象空间、在热门细分赛道的精准卡位能力,以及充足的现金储备。如今,MiniMax携M2模型杀回文本模型领域,在原有强大的多模态能力基础上,正致力于构建一个让C端创作者与B端企业都能轻松用得起、用得好的大模型生态系统。

展望未来,大模型的演进趋势将是多模态能力的深度融合。目前,市场上具备综合多模态研发实力与积累的公司已收敛至OpenAI、Google、字节跳动等少数巨头,而MiniMax作为在全模态领域均保持领先的厂商,是其中唯一一家创业公司。

封面来源:海螺视频官网截图