谈及卷编程,Claude当属翘楚。
就在此刻,Anthropic正式揭晓了Claude Sonnet 4.5的庐山真面目。
先说说Claude Sonnet 4.5的亮眼成绩吧。在严苛的SWE-bench Verified测试中,它展现了非凡的编程实力,一跃成为业界龙头。
更值得一提的是,它居然能持续高效工作超过30小时,这简直是AI取代人类的一大步。
看来,AI在取代人类的道路上又迈出了坚实的一步。比如,让它编写一个类似Slack或Teams的聊天应用,它竟能一口气敲出约1.1万行代码。相比之前的Claude Opus 4和Codex,这简直是天壤之别。
Anthropic自豪地宣称,现在的Claude Sonnet 4.5,就是全球编程模型的巅峰之作——无论是构建智能体、操作电脑,还是进行推理和数学运算,它的能力都实现了质的飞跃。
举个例子,在专门测试真实计算机任务的OSWorld基准测试中,它取得了令人瞩目的61.4%成绩,稳居榜首。要知道,仅仅四个月前,Sonnet 4还以42.2%的成绩遥遥领先。如今,它的性能又上了一个新台阶。
Anthropic的Claude Chrome插件更是能在浏览器中自主导航、填写表格、处理任务,就像真人操作一样流畅。在推理、金融等测评项目中,它的表现也更为出色,各项指标都在稳步增长。
拥有如此强大的能力,Anthropic自然不会只是发布一个模型那么简单。
具体来说:
Claude Code新增了“检查点”功能,随时保存进度,一键回退至之前的状态。
终端界面焕然一新,还推出了原生VS Code插件。
Claude API增加了上下文编辑功能和记忆工具。
代码执行和文件创建现在直接集成到对话中。
甚至,Anthropic还开放了构建Claude Code的底层基础设施——Claude Agent SDK。
如何在长时间任务中管理记忆、如何设计权限系统以平衡自主性和用户控制、如何让多个子智能体协同完成任务……这些都是构建和设计AI智能体的棘手难题。
现在,借助Claude Agent SDK,你也可以打造自己的产品了。
从今天起,开发者还能通过Claude API调用claude-sonnet-4-5。定价与Claude Sonnet 4保持一致,每百万tokens为$3/$15,价格未涨但能力更强。
网友@vasumanmoza体验后发帖:
“Claude 4.5 Sonnet在一次调用中重构了我的整个代码库,进行了25次工具调用,新增了3000多行代码,创建了12个新文件。它让一切变得模块化,拆除了巨石式结构,清理了意大利面条式代码。虽然结果无法运行,但真的很优雅。”这评价真是爱恨交织啊。
Cursor表示,在Claude Sonnet 4.5上看到了最前沿的编程性能,尤其是处理长周期任务时提升明显。这也再次解释了为什么很多Cursor用户会选择Claude来解决最复杂的问题。
知名测评博主Dan Shipper则指出,新版Sonnet 4.5在响应速度、可控性和稳定性上都有了显著提升。
性能固然重要,但安全性也不可忽视。
据悉,Claude Sonnet 4.5是Anthropic迄今为止对齐度最高的前沿模型。
借助更强的能力和完善的安全训练,Anthropic在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,在防御提示注入攻击和减少内容误判方面也有了重大突破。
值得一提的是,Anthropic还推出了一个名为“Imagine with Claude”的临时研究预览功能。
“Imagine with Claude”功能中,Claude会实时生成软件。所有功能都是互动时当场创造和调整出来的,没有预设也没有提前写好的代码。
“Imagine with Claude”将在未来五天内仅对Max订阅用户开放。
本文由主机测评网于2026-05-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260542172.html