智东西7月23日报道,刚刚,阿里巴巴Qwen团队宣布开源其最新一代旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。据Qwen团队称,这是该团队迄今为止最强大的开源智能体编程模型,拥有480B参数,激活参数为35B,原生支持256K上下文,并可外推扩展至100万上下文(输入),其最大输出为6.5万token。
在基准测试中,Qwen3-Coder在编程和智能体任务上表现优异,于Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)三类任务中获得了开源SOTA,超越Kimi K2、DeepSeek V3等开源模型和GPT-4.1等闭源模型,并可与Claude Sonnet 4这一以编程能力著称的模型相媲美。
Qwen3-Coder将提供多种尺寸,本次开源的是其最强大的变体,其参数量超过了阿里旗舰模型Qwen3的235B(2350亿),但小于Kimi K2的1T(1万亿)。阿里官方介绍,借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
除了模型之外,Qwen还开源了一个由Gemini Code分叉而来的智能体编程命令行工具——Qwen Code,这一工具进行了定制提示和函数调用协议的适配,能更充分地释放Qwen3-Coder在智能体编程任务上的能力。
这一模型已在阿里云旗下大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入token量调整价格。在256K~1M一档,其输入价格为6美元/百万token,输出价格为60美元/百万token。相比之下,Claude Sonnet 4的输入输出价格分别为3美元/百万token、15美元/百万token,与Qwen3-Coder 128k~256k一档的价格持平。
Qwen3-Coder也已在Qwen Chat网页版上线,用户可免费体验。此外,其480B版本已在Hugging Face、魔搭等开源社区发布,可供下载和本地部署。Qwen还在一篇博客文章中详细分享了模型的技术细节。
在Qwen团队官宣Qwen3-Coder发布前,这一模型已经悄然在Qwen Chat官网上线,手速快的海外网友们贡献了一批实测案例。
这一案例让Qwen3-Coder打造一个Wordle单词游戏,规则是在六次尝试中猜出一个长度为5个字母的单词。最终,Qwen3-Coder交付的游戏页面和源代码如下。
提供案例的网友称,Qwen3-Coder在指令遵循、UI设计、动画方面的能力惊人,大部分测试结果一次就跑通了,完全不需要推理。不过,在Wordle游戏设计这一任务上,Qwen并没有使用单词解析器,也没有引用来源,而是决定自行枚举所有5个字母的单词。
在一则找不同游戏的开发案例中,可以看到与昨日发布的Qwen3-235B-A22B-2507相比,Qwen3-Coder在审美和完成度上要明显好于前者。
智东西则尝试让Qwen3-Coder开发一个中英文术语库,并支持增删改查的基础功能。可以直观感受到,由于并未开启推理,Qwen3-Coder的开发速度极快,20多秒便完成了初步结果。在对其生成结果进行进一步修改时,速度同样较快。
其最终生成的结果从UI角度上看的确美观清晰,功能运转正常。不过并没有遵循提示词中使用PHP+MySQL进行开发的指令。其最终交付的结果作为功能演示、原型展示完全足够,但在真实部署场景中的可扩展性还需进一步优化。
本文由主机测评网于2026-04-16发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260437929.html