当前位置:首页 > 科技资讯 > 正文

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现

Claude Opus 4.5编程模型横空出世,挑战Gemini 3 Pro,面试成绩力压人类候选人。

智东西11月25日报道,Anthropic公司今日发布了其旗舰编程模型Claude Opus 4.5。Anthropic宣称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首个得分超过80%的AI模型,不仅超越了自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第1张

Anthropic还将该公司面试人类工程师的高难度居家考试交给Claude Opus 4.5。在规定的两小时内,Claude Opus 4.5的得分高于以往任何人类应聘者,这表明AI模型在重要技术技能方面,已经超越了优秀的人类应聘者。

编程并非Claude Opus 4.5唯一的改进,其视觉、推理和数学能力都优于前代产品,可较好地胜任深度研究、处理幻灯片和电子表格等日常任务。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第2张

与此同时,Claude Opus系列模型的价格也真被Anthropic打下来了。Claude Opus 4.5的定价为每百万tokens 5美元(输入)/25美元(输出),仅为前代Claude Opus 4.1的1/3。同时,Anthropic还移除了专门针对Opus系列的用量限制。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第3张

Claude Opus 4.5现已在Claude应用程序、API中可用,不过,使用Opus前,用户还得开一个200美元/月的最高档套餐。Claude Opus 4.5也已在AWS、谷歌云和微软Azure三大主流云平台上线。

前端表现再飞跃,还一次性完美复刻《我的世界》

Claude Opus 4.5用起来效果究竟怎么样?在Anthropic官宣模型发布的评论区中,已有不少用户分享了自己的一手体验。

前端能力上,前端开发者平台Vercel的CEO Guillermo用Claude Opus 4.5打造了一个购物网站,一次性生成的结果如下:

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第4张

Guillermo感叹,Claude Opus 4.5的水平完全不同,好得让人难以置信。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第5张

这位网友分享了自己用Claude Opus 4.5打造的4个Hero Section。这些页面在字体设计和网页布局上都很有高级感。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第6张

有网友用Claude Opus 4.5打造了《我的世界》克隆版。这考察了模型在更复杂项目上的性能。Claude Opus 4.5一次就成功了,生成了3500行代码。网友认为这意味着Claude Opus 4.5不会像Gemini 3.0 Pro一样偷工减料。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第7张

Claude Opus 4.5复刻的《我的世界》游戏有模有样,拥有不同的生物群系、树叶和水的透明方块,还有一套非常棒的物品栏和合成系统。所有这些都集成在一个游戏中。它甚至还打造了云朵效果,网友称自己此前从未见过哪个模型能做到这一点。

7门编程语言测试领先,安全性大幅提升

发布前,Anthropic对Claude Opus 4.5模型进行了内部测试。测试人员称,Claude Opus 4.5能够处理模糊不清的情况,并能权衡利弊,无需过多指导。

当遇到复杂的多系统错误时,Claude Opus 4.5能够自行找到修复方法。几周前Claude Sonnet 4.5几乎无法完成的任务,现在Claude Opus 4.5已经能够轻松应对。Anthropic的测试人员告诉模型团队,Claude Opus 4.5真的“很懂行”。

Anthropic Claude Opus 4.5:编程模型新标杆,超越人类表现 4.5  编程模型 AI 第8张

新增思考强度控制,用上GPT同款上下文压缩功能

在发布最新模型的同时,Anthropic还宣布了Claude开发者平台的一系列新增功能。

... (继续保留原文的HTML标签和文本内容不变) ...