当前位置:首页 > 科技资讯 > 正文

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第1张

核心要点:

1、阿里巴巴推出了其有史以来参数规模最大的AI模型——Qwen3-Max-Preview,参数量突破1万亿大关,在编程能力上成功超越Claude,再次验证了Scaling Law在人工智能领域的持续有效性。

2、阿里实施的“模型+云服务”战略构建了从技术研发到商业化落地的最短路径,成为Qwen能够实现后来者居上表现的关键因素之一。

3、阿里开源模式面临的核心挑战在于如何平衡技术开放与商业收益。Qwen未来不仅需要在技术上持续创新,更需在商业模式和组织能力上证明其独特价值。

作者 林易

编辑 重点君

在Anthropic采取“极端措施”之后,阿里巴巴在深夜以重磅行动回应——推出其史上最大规模的模型Qwen3-Max-Preview,参数量高达超过1万亿,展现了强大的技术实力。

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第2张

根据“通义大模型”官方微信公众号的描述,该模型的能力“强得不止一点”。从基准测试结果来看,Qwen3-Max-Preview已经超越了此前自家的Qwen3-235B-A22B-2507版本。

官方还发布了与Kimi K2、Claude Opus 4(Non-thinking)以及DeepSeek-V3.1的对比数据。从下表可以看出,Qwen3-Max-Preview在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等多个基准测试中均领先于其他竞争对手。

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第3张

特别是在编程能力方面,此前Claude被视为业内最强,而Qwen3-Max-Preview通过大规模参数扩展实现了反超,令众多业界观察者惊叹。

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第4张

Qwen在X平台上的推文简洁地揭示了其成功秘诀:Scaling works(规模化扩展确实有效)。

01 实测阿里史上最大模型:性能与速度并重

目前,Qwen3-Max-Preview已经开放体验,用户只需在模型下拉选项中选择即可快速使用:

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第5张

体验地址:https://chat.qwen.ai

同时,官方API服务也已正式开放:https://bailian.console.aliyun.com/?tab=model#/model-market(搜索Qwen3-Max-Preview)。

在实际效果测试中,国内外网友已展开广泛实测。例如,X平台知名博主AK在HuggingFace集成的Qwen3-Max-Preview项目AnyCoder中,输入了以下提示:

设计并创建一个极具创意、精细且细节丰富的体素艺术场景,描绘一座位于美丽花园中的宝塔,周围有树木和樱花。场景需令人印象深刻且多样化,并使用彩色体素。可利用任何库来实现。

据AK描述,Qwen3-Max-Preview一次性生成了如下效果:

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第6张

当我们在官网输入提示:为Qwen3 Max的发布创建一个精美的庆祝着陆页。

仅需几秒钟,Qwen3-Max-Preview就生成了一个完整的庆祝页面,响应速度实测极为迅捷

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第7张

接下来,我们增加难度,尝试经典的编程问题——弹跳球模拟碰撞

先进行简单测试:编写一段JavaScript代码,展示一个在旋转六边形内弹跳的小球。小球应受重力和摩擦力影响,并真实地从旋转墙壁上反弹,用JavaScript和HTML实现。

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第8张

可以看到,小球基于物理规律在六边形框内运行;当使用“向上键”施加力时,它能立即响应。

将球的数量设置为10个时,一次性生成的效果也相当自然:

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第9张

最后,让Qwen3-Max-Preview生成一个小游戏:制作一个《愤怒的小鸟》小游戏。

阿里发布万亿参数模型Qwen3-Max-Preview,编程能力反超Claude引领AI新浪潮 阿里通义千问 万亿参数模型 Scaling Law 开源策略 第10张

虽然一次性生成成功,但由于提示词较简单,游戏存在小瑕疵,如怪物位置不精确;感兴趣的用户可多次尝试优化。

02 Qwen后来者居上的关键因素:战略清晰与生态协同

从千亿参数模型跃升至万亿规模(提升近四倍),并在多项评测中领先,Qwen已在全球AI大模型领域稳居第一梯队。

回顾整场AI竞赛,阿里并非最早在中国推出对标ChatGPT产品的公司,但无疑是后来者居上的典范。相较于国内先行者(如百度),阿里大模型初期相对低调,但其路径格外清晰——通过开源模型构建生态,通过自研闭源探索技术前沿

在开源方面,自2023年起,Qwen以惊人速度向全球开发者开源多个版本模型,从70亿参数的Qwen-7B到140亿、720亿参数,再拓展至视觉、音频等多模态模型,几乎覆盖所有主流尺寸和应用场景。更重要的是,阿里不仅开源模型权重,还开放商业化授权,极大激发了中小企业和个人开发者的参与热情。

这一系列举措使Qwen迅速在Hugging Face等全球顶级开源社区建立广泛影响力,吸引了大量开发者围绕其生态进行创新,形成了强大的社区驱动力。这种“广积粮”策略为通义千问赢得了宝贵的开发者心智和应用场景数据,这是闭源模型难以比拟的优势。

在开源之外,阿里内部持续探索模型能力上限。正如官方发布万亿参数模型时强调,Scaling works(规模化扩展有效)。这体现了对Scaling Law的坚定信念——随着模型参数、数据量和计算量指数级增长,模型能力将实现质的飞跃。

训练Qwen3 Max Preview这样的万亿参数模型,不仅是资源投入,更要求在超大规模计算集群稳定性、分布式训练算法效率、数据处理精细度及工程优化每个环节做到极致。这背后是阿里多年来在算力基础设施上的巨大投入,以及在AI工程化领域的深厚积累。正是这种“大力出奇迹”式的饱和投入,让Qwen在编程、推理等核心能力上实现了对Claude Opus等顶级模型的反超。

此外,阿里云是Qwen后来者居上的另一关键。大模型训练推理是算力密集型任务,阿里云为Qwen研发提供了稳定高效的算力基础设施,整合了从数据标注、模型开发、分布式训练到部署推理的全链路工具,极大降低了研发团队的工程负担,使其能专注于算法和模型创新。

在模型应用和普及方面,阿里云的MaaS战略使Qwen能快速渗透各行各业;例如,企业客户无需从零训练模型,可直接通过阿里云调用Qwen API,或利用平台工具对开源Qwen模型进行微调,快速构建AI应用。这种“模型+云服务”策略形成了从技术研发到商业化落地的最短路径。

03 挑战与隐忧:平衡开放与商业化的难题

尽管阿里在大模型发展的战略选择促成了其后发优势,但现阶段的Qwen仍面临隐忧。

阿里选择的开源模型引流、云服务变现是一条机遇与挑战并存的道路;它与Meta的Llama系列类似,旨在通过开放生态快速抢占市场份额和开发者心智,最终将商业价值导向自家基础设施。这与OpenAI、Anthropic等闭源+API的精英路线形成鲜明对比,后者的优势在于更好保护核心技术,维持技术代差,并通过高价值API服务直接获取高额利润。

而阿里的开源策略虽能快速普及技术,但也意味着其最先进模型很难与竞争对手拉开绝对差距,商业模式更加迂回,需要客户首先认可其云平台价值。

开源模式的核心挑战在于如何平衡开放与收益:当企业可以免费获取并私有化部署性能足够好的开源模型时,他们为官方云服务付费的意愿会有多强?

换言之,阿里云不仅要提供简单的模型托管,还必须提供远超开源版本的性能优化、安全保障、以及强大工具链和企业级服务,才能构建足够深的护城河。如何将庞大的开源用户群体有效转化为高价值付费云客户,是这条道路上最关键的商业考验。

除了商业化挑战,在顶尖AI人才争夺白热化的今天,任何核心人才流失都可能对团队造成深远影响。近年来,包括AI框架和基础设施领域关键人物贾扬清在内的一些核心技术人才先后离开阿里,投身创业浪潮或加入其他巨头。虽然对于阿里这样体量的公司,个别人员离开未必动摇根基,但负面影响依然存在。

核心领军人物的离开可能影响团队士气,对外传递负面信号,增加后续吸引顶尖人才的难度;在关键技术方向上,领军人物的变动还可能给项目长期战略延续性带来不确定性。正如Meta在硅谷持续上演的抢人大战,离开的人才往往成为新竞争对手,他们对原有体系优劣势了如指掌,可能在细分领域构成更精准威胁。

因此,阿里如何在高强度竞争下持续保持对全球顶尖AI人才的吸引力,并建立稳定可持续的人才梯队,是其未来发展过程中必须面对的严肃课题。

结语:技术突破与商业模式的未来博弈

总体来看,阿里通义千问无疑是中国乃至全球大模型领域的顶级力量。它凭借“开源与自研并行”的清晰战略、依托阿里云的强大生态、以及深厚技术人才积累,成功在激烈竞争中占据领先地位。万亿参数模型的发布更是彰显了其在Scaling Law上的决心和实力。

然而,成功之路也伴随着清晰挑战。以开源换生态的商业模式,其盈利能力的持续性仍需市场检验;与OpenAI等闭源巨头的技术代差追逐将是长期过程;而顶级人才的保留与吸引,则是维持创新活力的生命线。Qwen在未来不仅需要在技术上持续突破,更需要在商业模式和组织能力上证明自己的独特价值。它能否将今天的技术优势转化为明天不可动摇的市场胜势,将是整个行业、包括资本市场关注的焦点。这也是阿里未来市值能否更上一层楼的关键。

参考链接:

1、https://x.com/Alibaba_Qwen/status/1963991502440562976 

2、https://chat.qwen.ai/ 

3、https://x.com/_akhaliq/status/1964001592710975971