当前位置：首页 > 科技资讯 > 正文

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现

Claude Opus 4.5编程模型横空出世，挑战Gemini 3 Pro，面试成绩力压人类候选人。

智东西11月25日报道，Anthropic公司今日发布了其旗舰编程模型Claude Opus 4.5。Anthropic宣称，这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中，Claude Opus 4.5成为首个得分超过80%的AI模型，不仅超越了自家的Claude Sonnet 4.5，还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第1张

Anthropic还将该公司面试人类工程师的高难度居家考试交给Claude Opus 4.5。在规定的两小时内，Claude Opus 4.5的得分高于以往任何人类应聘者，这表明AI模型在重要技术技能方面，已经超越了优秀的人类应聘者。

编程并非Claude Opus 4.5唯一的改进，其视觉、推理和数学能力都优于前代产品，可较好地胜任深度研究、处理幻灯片和电子表格等日常任务。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第2张

与此同时，Claude Opus系列模型的价格也真被Anthropic打下来了。Claude Opus 4.5的定价为每百万tokens 5美元（输入）/25美元（输出），仅为前代Claude Opus 4.1的1/3。同时，Anthropic还移除了专门针对Opus系列的用量限制。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第3张

Claude Opus 4.5现已在Claude应用程序、API中可用，不过，使用Opus前，用户还得开一个200美元/月的最高档套餐。Claude Opus 4.5也已在AWS、谷歌云和微软Azure三大主流云平台上线。

前端表现再飞跃，还一次性完美复刻《我的世界》

Claude Opus 4.5用起来效果究竟怎么样？在Anthropic官宣模型发布的评论区中，已有不少用户分享了自己的一手体验。

前端能力上，前端开发者平台Vercel的CEO Guillermo用Claude Opus 4.5打造了一个购物网站，一次性生成的结果如下：

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第4张

Guillermo感叹，Claude Opus 4.5的水平完全不同，好得让人难以置信。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第5张

这位网友分享了自己用Claude Opus 4.5打造的4个Hero Section。这些页面在字体设计和网页布局上都很有高级感。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第6张

有网友用Claude Opus 4.5打造了《我的世界》克隆版。这考察了模型在更复杂项目上的性能。Claude Opus 4.5一次就成功了，生成了3500行代码。网友认为这意味着Claude Opus 4.5不会像Gemini 3.0 Pro一样偷工减料。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第7张

Claude Opus 4.5复刻的《我的世界》游戏有模有样，拥有不同的生物群系、树叶和水的透明方块，还有一套非常棒的物品栏和合成系统。所有这些都集成在一个游戏中。它甚至还打造了云朵效果，网友称自己此前从未见过哪个模型能做到这一点。

发布前，Anthropic对Claude Opus 4.5模型进行了内部测试。测试人员称，Claude Opus 4.5能够处理模糊不清的情况，并能权衡利弊，无需过多指导。

当遇到复杂的多系统错误时，Claude Opus 4.5能够自行找到修复方法。几周前Claude Sonnet 4.5几乎无法完成的任务，现在Claude Opus 4.5已经能够轻松应对。Anthropic的测试人员告诉模型团队，Claude Opus 4.5真的“很懂行”。

Anthropic Claude Opus 4.5：编程模型新标杆，超越人类表现 4.5 编程模型 AI 第8张

在发布最新模型的同时，Anthropic还宣布了Claude开发者平台的一系列新增功能。

... (继续保留原文的HTML标签和文本内容不变) ...

本文由主机测评网于2026-05-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260545015.html