当前位置：首页 > 科技资讯 > 正文

阿里通义千问Qwen3-Max突破万亿参数，国产大模型迈入新纪元

主机测评网
科技资讯
2026-05-02
649

在9月24日的云栖大会上，阿里巴巴宣布其通义千问Qwen3-Max模型达到“超万亿参数”规模，训练数据量高达36T tokens。周靖人称其为“通义家族最强”。这是国产大模型首次正式站在“万亿级”门槛上。

这次发布会之所以备受关注，是因为“万亿”这个词本身具有象征意义。在AI发展史上，每次参数数量的跨越都被视为行业新纪元的标志：从GPT-2的15亿参数，到GPT-3的1750亿参数，再到GPT-4被推测接近万亿。

如今，国内厂商首次在舞台上宣布“我们也有万亿”，这不仅是一次产品升级，更是一次“地位宣言”。

成绩同样引人注目：在数学推理测试AIME25中，Qwen3-Max取得86.4%的准确率，位列全球前三。在编程基准SWE-Bench Verified上得分69.6%，仅次于GPT-4.1（71.2%），位居全球第二。在Chatbot Arena综合榜单中进入前五，最高位列第四。这是国产大模型首次在多项国际权威基准上全面进入世界前列。

值得注意的是，阿里并非只推出一个“巨无霸”，而是将其切分为多个方向：Thinking版专注复杂推理，适合科研、数学、金融分析等场景。Instruct版擅长指令遵循，更像ChatGPT的日常应用版。Omni版则支持实时语音交互与多模态，让用户能够和AI进行自然对话，甚至在视频场景里实现即时反馈。对普通用户而言，这已经不仅是一个聊天机器人，而是一个能写代码、能看文档、还能听得懂、看得见的全能助手。

为什么国内厂商没有退路

在国际市场，OpenAI的GPT-4.1、Anthropic的Claude已经开始追求“更轻、更灵活”。GPT-4.1的重点是多智能体协作与API工具调用，Claude则强调长文本和安全性。换句话说，他们意识到“越大越好”的阶段正在过去。

而国内，几乎所有巨头都被推向了万亿参数这条单行道。

资本市场的推力最直接。2024年，国内超过50家大模型公司融资总额突破300亿元。投资人最敏感的指标不是你能否落地，而是你是否能在技术指标上追平国际巨头。参数数值，成了最能“安抚市场”的语言。于是，“万亿”成了过关口令，谁没到万亿，谁就可能被贴上“二线”的标签。

企业客户也加了一把火。在采购逻辑里，模型越大，意味着越靠谱。很多需求被天然等同于“只有万亿才行”：跨语种客服、动辄20万字的合同审查、跨行业知识整合等等。哪怕实际差距只是92%与93%的准确率，在客户眼里也足以放大成决定性的差别。于是厂商们不得不迎合这种认知，把“万亿”当成展示实力的筹码。

更深层的原因也在于产业环境。高端GPU的获取仍受限制，国内厂商在算法优化上难以直接与国际巨头硬碰硬。于是，唯有通过“以量补质”来走捷径：扩大参数规模，用工程手段换性能表现。就像LCD时代，中国厂商把背光做到极致，才在画质上追上OLED，如今在大模型赛道，厂商们也只能靠堆算力来追赶。

而这并不是选择，而是被裹挟后的必然。不卷上去，就意味着退出牌桌。

冷冰冰的算力账单

据行业测算（斯坦福AI Index 2024数据，结合多家券商研报），训练一次万亿参数模型，能耗可达2000–5000万度电，仅电费成本就超过上千万元。如果算上GPU采购、数据清洗、分布式工程调度等全流程，完整成本可能超过数十亿元。

阿里通义千问Qwen3-Max突破万亿参数，国产大模型迈入新纪元通义千问 Qwen3-Max 万亿参数智能密度第1张

推理阶段同样昂贵。恒信证券的一份测算指出，万亿模型的单次调用开销是百亿模型的2–4倍。这意味着企业在部署时要么承担更高的算力租赁费用，要么就要接受调用速度和稳定性的下降。

然而，性能提升却往往只是个位数。比如在客服场景下，一个模型准确率92%，另一个93%，后者的训练成本却可能翻倍。对于企业来说，多花的不是1%，而是实实在在的数亿预算。

这就是所谓的“边际效益递减”。随着参数规模越来越大，性能提升越来越有限，而能耗、账单却是成倍增加。对于巨头来说，这可能是可以承受的“战略性亏损”，但对于普通企业来说，这种成本根本不具备推广价值。

阿里的真正野心，不止是参数

既然如此，阿里为什么还要第一个喊出“万亿”呢？

答案很清楚：阿里瞅准的并不是单纯的参数竞赛，而是一盘云生态的棋。

阿里的真正目标，是让Qwen3-Max成为下一代阿里云的“操作系统”。在百炼平台，它已经开放API，按Token计费。Qwen3-Coder在OpenRouter的调用量一度暴涨1474%，跃居全球第二。同期推出的Qwen3-VL、通义万相2.5、通义百聆，覆盖了视频生成、语音交互、视觉编程等核心场景。

阿里通义千问Qwen3-Max突破万亿参数，国产大模型迈入新纪元通义千问 Qwen3-Max 万亿参数智能密度第2张