当前位置:首页 > 科技资讯 > 正文

Anthropic发布Claude Sonnet 4.5:编程性能再升级

谈及卷编程,Claude当属翘楚。

就在此刻,Anthropic正式揭晓了Claude Sonnet 4.5的庐山真面目。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第1张

先说说Claude Sonnet 4.5的亮眼成绩吧。在严苛的SWE-bench Verified测试中,它展现了非凡的编程实力,一跃成为业界龙头。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第2张

更值得一提的是,它居然能持续高效工作超过30小时,这简直是AI取代人类的一大步。

看来,AI在取代人类的道路上又迈出了坚实的一步。比如,让它编写一个类似Slack或Teams的聊天应用,它竟能一口气敲出约1.1万行代码。相比之前的Claude Opus 4和Codex,这简直是天壤之别。

Anthropic自豪地宣称,现在的Claude Sonnet 4.5,就是全球编程模型的巅峰之作——无论是构建智能体、操作电脑,还是进行推理和数学运算,它的能力都实现了质的飞跃。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第3张

举个例子,在专门测试真实计算机任务的OSWorld基准测试中,它取得了令人瞩目的61.4%成绩,稳居榜首。要知道,仅仅四个月前,Sonnet 4还以42.2%的成绩遥遥领先。如今,它的性能又上了一个新台阶。

Anthropic的Claude Chrome插件更是能在浏览器中自主导航、填写表格、处理任务,就像真人操作一样流畅。在推理、金融等测评项目中,它的表现也更为出色,各项指标都在稳步增长。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第4张

拥有如此强大的能力,Anthropic自然不会只是发布一个模型那么简单。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第5张

具体来说:

Claude Code新增了“检查点”功能,随时保存进度,一键回退至之前的状态。

终端界面焕然一新,还推出了原生VS Code插件。

Claude API增加了上下文编辑功能和记忆工具。

代码执行和文件创建现在直接集成到对话中。

甚至,Anthropic还开放了构建Claude Code的底层基础设施——Claude Agent SDK。

如何在长时间任务中管理记忆、如何设计权限系统以平衡自主性和用户控制、如何让多个子智能体协同完成任务……这些都是构建和设计AI智能体的棘手难题。

现在,借助Claude Agent SDK,你也可以打造自己的产品了。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第6张

从今天起,开发者还能通过Claude API调用claude-sonnet-4-5。定价与Claude Sonnet 4保持一致,每百万tokens为$3/$15,价格未涨但能力更强。

网友@vasumanmoza体验后发帖:

“Claude 4.5 Sonnet在一次调用中重构了我的整个代码库,进行了25次工具调用,新增了3000多行代码,创建了12个新文件。它让一切变得模块化,拆除了巨石式结构,清理了意大利面条式代码。虽然结果无法运行,但真的很优雅。”这评价真是爱恨交织啊。

Cursor表示,在Claude Sonnet 4.5上看到了最前沿的编程性能,尤其是处理长周期任务时提升明显。这也再次解释了为什么很多Cursor用户会选择Claude来解决最复杂的问题。

知名测评博主Dan Shipper则指出,新版Sonnet 4.5在响应速度、可控性和稳定性上都有了显著提升。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第7张

性能固然重要,但安全性也不可忽视。

据悉,Claude Sonnet 4.5是Anthropic迄今为止对齐度最高的前沿模型。

借助更强的能力和完善的安全训练,Anthropic在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,在防御提示注入攻击和减少内容误判方面也有了重大突破。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第8张

值得一提的是,Anthropic还推出了一个名为“Imagine with Claude”的临时研究预览功能。

“Imagine with Claude”功能中,Claude会实时生成软件。所有功能都是互动时当场创造和调整出来的,没有预设也没有提前写好的代码。

“Imagine with Claude”将在未来五天内仅对Max订阅用户开放。

Anthropic发布Claude Sonnet 4.5:编程性能再升级 Claude 4.5 编程性能 Anthropic AI竞赛 第9张