Claude Opus 4.5编程模型横空出世,挑战Gemini 3 Pro,面试成绩力压人类候选人。
智东西11月25日报道,Anthropic公司今日发布了其旗舰编程模型Claude Opus 4.5。Anthropic宣称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。
在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首个得分超过80%的AI模型,不仅超越了自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。
Anthropic还将该公司面试人类工程师的高难度居家考试交给Claude Opus 4.5。在规定的两小时内,Claude Opus 4.5的得分高于以往任何人类应聘者,这表明AI模型在重要技术技能方面,已经超越了优秀的人类应聘者。
编程并非Claude Opus 4.5唯一的改进,其视觉、推理和数学能力都优于前代产品,可较好地胜任深度研究、处理幻灯片和电子表格等日常任务。
与此同时,Claude Opus系列模型的价格也真被Anthropic打下来了。Claude Opus 4.5的定价为每百万tokens 5美元(输入)/25美元(输出),仅为前代Claude Opus 4.1的1/3。同时,Anthropic还移除了专门针对Opus系列的用量限制。
Claude Opus 4.5现已在Claude应用程序、API中可用,不过,使用Opus前,用户还得开一个200美元/月的最高档套餐。Claude Opus 4.5也已在AWS、谷歌云和微软Azure三大主流云平台上线。
Claude Opus 4.5用起来效果究竟怎么样?在Anthropic官宣模型发布的评论区中,已有不少用户分享了自己的一手体验。
前端能力上,前端开发者平台Vercel的CEO Guillermo用Claude Opus 4.5打造了一个购物网站,一次性生成的结果如下:
Guillermo感叹,Claude Opus 4.5的水平完全不同,好得让人难以置信。
这位网友分享了自己用Claude Opus 4.5打造的4个Hero Section。这些页面在字体设计和网页布局上都很有高级感。
有网友用Claude Opus 4.5打造了《我的世界》克隆版。这考察了模型在更复杂项目上的性能。Claude Opus 4.5一次就成功了,生成了3500行代码。网友认为这意味着Claude Opus 4.5不会像Gemini 3.0 Pro一样偷工减料。
Claude Opus 4.5复刻的《我的世界》游戏有模有样,拥有不同的生物群系、树叶和水的透明方块,还有一套非常棒的物品栏和合成系统。所有这些都集成在一个游戏中。它甚至还打造了云朵效果,网友称自己此前从未见过哪个模型能做到这一点。
发布前,Anthropic对Claude Opus 4.5模型进行了内部测试。测试人员称,Claude Opus 4.5能够处理模糊不清的情况,并能权衡利弊,无需过多指导。
当遇到复杂的多系统错误时,Claude Opus 4.5能够自行找到修复方法。几周前Claude Sonnet 4.5几乎无法完成的任务,现在Claude Opus 4.5已经能够轻松应对。Anthropic的测试人员告诉模型团队,Claude Opus 4.5真的“很懂行”。
在发布最新模型的同时,Anthropic还宣布了Claude开发者平台的一系列新增功能。
... (继续保留原文的HTML标签和文本内容不变) ...
本文由主机测评网于2026-05-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545015.html