当前位置:首页 > 科技资讯 > 正文

Claude Opus 4.5震撼发布:编程与AI能力再升级

深夜,Claude Opus 4.5震撼问世,编程实力直逼Gemini 3 Pro、GPT-5.1。仅一周时间,AI界完成了一次循环迭代。

全球编码王座,一夜之间易主。

Anthropic在深夜发布了Claude Opus 4.5,这款模型被誉为全球顶尖。

它不仅编程能力强,智能体和计算机使用能力也属一流。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第1张

Opus 4.5的诞生,标志着AI能力再跃新高,未来将彻底改变工作方式。

基准测试中,Opus 4.5的编码、工具调用、计算机使用成绩刷新SOTA,远超Sonnet 4.5、Opus 4.1。

不仅如此,就连发布仅一周的Gemini 3 Pro、GPT-5.1也遭受重创。

SWE-bench Verified一张图显示,Opus 4.5以80.9%的准确率位居世界第一。

同时,在ARC-AGI-2评估中,Opus 4.5(64k)拿下37.6%的高分。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第2张

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第3张

Opus 4.5无需人工干预即可处理模糊信息,并权衡利弊。

即使面对复杂的多系统漏洞,也能找到修复方法。

总之,用起来就一个感觉——「一点就透」。

内部评估显示,Opus 4.5+Claude Code联动使用,平均生产效率暴增220%。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第4张

目前,Opus 4.5已在APP、Claude API和三大主流云平台中上线。

价格方面,相较以往大幅下调,输入仅需5美元/百万token,输出为25美元/百万token。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第5张

Gemini 3 Pro曾击败GPT-5.1,但在编码性能上,Opus 4.5全面超越两者。

仅一周时间,AI界实现了真正的闭环。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第6张

编程之王回归,真SOTA

不得不说,Claude Opus 4.5是全球最强的编程模型。

它智能、高效,是全球在编程、AI智能体以及计算机操作方面的佼佼者。

Anthropic研究员Adam Wolff豪言,明年上半年,软件工程将彻底终结。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第7张

在深度研究、处理PPT和电子表格等日常任务上,它也有显著提升。

在真实场景的软件工程测试中,Claude Opus 4.5刷新了SOTA:

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第8张

在SWE-bench Verified上的对比显示,Opus 4.5得分最高。

与Opus一同发布的还有Claude开发者平台、Claude Code以及消费者端App的更新。

Anthropic为长时间运行的智能体提供了新工具,并带来了在Excel、Chrome和桌面端使用Claude的新方式。在Claude App中,长对话不再因上下文限制而中断。

碾压Gemini 3,超越人类

首先,Opus 4.5在视觉、推理和数学能力上均得到全面提升,并在多个领域达到业界顶尖水平。

尤其在编码、智能体、计算机使用三大项上,全面超越Gemini 3 Pro、GPT-5.1。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第9张

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第10张

其次,在代码方面

Opus 4.5编写的代码质量更高。在SWE-bench Multilingual测试的8种编程语言中,有7种都领先。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第11张

Opus 4.5能轻松解决复杂编码问题。在Aider Polyglot测试中比Sonnet 4.5提升达10.6%。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第12张

最稳健、最对齐、最安全

Claude Opus 4.5是Anthopic迄今为止发布的最稳健、最对齐的模型。

Claude Opus 4.5震撼发布:编程与AI能力再升级 4.5 AI模型 编程实力 智能体 第13张https://assets.anthropic.](\n在这项评估中,「令人担忧的行为」评分涵盖了广泛的错位行为。在抵御「提示词注入」(Prompt Injection)攻击方面,Opus 无论是拦截欺骗性指令还是防止有害行为都取得了实质性进展:\n