当前位置:首页 > 科技资讯 > 正文

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位

近期,全球AI代码生成的竞争版图迎来了新的转折。

在编程界,曾被视为标杆的Anthropic似乎正逐渐失去其往日光辉,地位开始动摇。一方面,OpenAI的GPT-5系列模型强势崛起,在与Claude Code的较量中展现出「后来居上」的态势,AI专家Karpathy现身说法并推荐GPT-5 Pro的强大代码能力。另一方面,Anthropic自身的一系列决策也令人费解,先是放任自家模型(包括Claude Opus 4.1和Opus 4)性能下降,本周又宣布对包括中国在内的部分地区限制其AI产品和服务的使用。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第1张

在这个关键时刻,多家国产大模型厂商对Anthropic发起了正面挑战。月之暗面发布了Kimi-K2-0905版本,阿里则推出了超万亿参数的Qwen3-Max-Preview。

作为Kimi-K2系列的最新版本,Kimi-K2-0905将上下文长度扩展至256k,针对前端开发等实际编程任务进行了优化,提升了长代码生成中的正确性、稳定性和逻辑一致性。而Qwen3-Max-Preview则是阿里迄今为止最大的模型,同样在通用知识、数学推理、编程等多种任务上有所提升。

可见,国产大模型厂商近期在代码生成任务上投入颇多。Kimi-K2-0905强调了工具调用能力,并提升了模型与Agent框架(如Roo Code)的集成性。在使用该模型调用外部工具时,格式正确率现在达到100%,无需人工修正。它还完全兼容Anthropic API,便于接入与迁移。对WebSearch Tool的支持可通过实时信息检索提升任务效果。

随着0905版本的发布,近30天Kimi-K2系列模型在Hugging Face中的下载量超过39万。

对于最新的Kimi-K2-0905,有人表示:「终于不用再为处理复杂的长任务而感到挫败了。」

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第2张

随着国产大模型在代码生成领域的持续发力,全球竞争格局或许将发生深刻变化。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第3张

性能与价格双重优势,国产大模型竞争力十足

作为Kimi K2系列中的最新成员,Kimi-K2-0905与其他国产大模型厂商的新模型(如Qwen3-Max-Preview)一道,向曾经的王者Claude的传统优势区间发起挑战,强调在智能编程领域的性能提升。

从技术细节来看,Kimi-K2-0905采用了主流的MoE架构,参数规模达到万亿级别,在推理时实际被激活的参数为320亿。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第4张

参数概览

在SWE-bench Verified等真实编程基准的对比中,Kimi-K2-0905在部分测试(如多语言环境、命令行/终端交互)中甚至超越了竞争对手Claude Sonnet 4。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第5张

实战表现究竟如何?我们做了一个经典小游戏来测试。

指令很简单:「制作一个类似微信打飞机的网页小游戏,要求美观、好玩、功能齐全。」

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第6张

Kimi-K2-生成的游戏代码(部分截图)

在网页端实现的效果令人惊艳,不仅实现了浩瀚星空背景、高速移动的拖影、概率出现的回血道具,还有不同颜色的敌人爆炸效果。玩得好的话还有连击加分。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第7张

我们试玩了好一会儿,困难模式确实很有挑战性。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第8张

知名博主「karminski - 牙医」的测试显示,Kimi-K2的前端水平有了显著提升,空间理解能力和召回能力都有所增强。

在需要生成超过一千行代码的「鞭炮连锁爆炸测试」中,Kimi-K2表现优秀。

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第9张

原贴地址:https://x.com/karminski3/status/1963834619767o99s?s=46

此外,Kimi K2在API定价上也颇具竞争力。

据我们了解,Kimi开放平台上的kimi kimi kimi k 预览版模型API定价与上一代一致。计费方案为缓存未命中时每百万输入tokens收费4元;缓存命中时每百万输入tokens收费1元;每百万输出tokens收费16元。具体定价策略可参考下图:

AI编程竞赛:国产大模型崛起,挑战Anthropic霸主地位 AI编程 国产大模型 Anthropic Kimi-K2-0905 第10张

结语

在AI编程领域,国内AI厂商各有侧重。一部分厂商致力于产品和用户体验的优化;另一部分则专注于基础模型的打磨。

例如腾讯和字节对自家编码产品的更新主要集中在产品侧。字节更新了Trae Solo版本、腾讯发布了CodeBuddy IDE等,都是试图超越Cursor核心竞争力的尝试。