当前位置:首页 > 科技资讯 > 正文

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第1张

在今天凌晨的北京时间,Anthropic公司正式推出了Claude Sonnet 4.5版本,这一发布标志着人工智能领域的新里程碑。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第2张

该版本被Claude官方定义为全球最强大的代码模型,同时在智能体构建、计算机操作、逻辑推理和数学能力方面实现了显著突破,为现代工作流程带来更高效和可靠的解决方案。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第3张

代码在现代社会中无处不在,它驱动着各种应用程序、表格和工具,而Sonnet 4.5通过提升智能和效率,让用户能更轻松地运用这些工具解决复杂问题。

全新功能与产品升级

随着Sonnet 4.5的发布,Anthropic对Claude全线产品进行了大规模更新,引入了多项创新功能。

Claude Code新增了备受期待的「检查点」(Checkpoints)功能,允许用户随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件,提升开发体验。

Claude API增加了上下文编辑功能和记忆工具,使智能体能运行更长时间,处理更复杂的任务,增强了灵活性和扩展性。

Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档),进一步整合了工作流程。

Claude for Chrome扩展对此前等待名单中的Max用户开放,提供了更便捷的浏览器集成。

开发者社区也迎来了新的核心资源:Claude Agent SDK,这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力,推动了AI应用的普及。

前沿性能与基准成绩

Sonnet 4.5在多项权威测试中表现出色,展现了卓越的性能水平。

SWE-bench Verified:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行,证明了其持久性和准确性。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第4张

OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%,显示出快速进步。

视频演示了Claude for Chrome的模拟操作计算机任务能力,直观展示了其实用性。

推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1,为行业应用奠定基础。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第5张

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第6张

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第7张

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第8张

这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价,他们分享了实际应用中的成功案例。

Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作,大幅提升效率。——Sean Ward, iGent AI CEO

在replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%,显示出惊人的准确性。——Michele Catasta, replit President

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第9张

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第10张

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第11张

更强的对齐,更安全

Sonnet 4.5是迄今为止对齐性最好的Claude模型,通过改进的能力和广泛的安全训练,在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。

在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御,提升了系统安全性。

这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性,增强了透明度。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第12张

Sonnet 4.5按照AI Safety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。

虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化,以平衡安全性与可用性。

Claude Agent SDK

在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。

如今,这些能力通过Claude Agent SDK向开发者全面开放,不仅适用于编码,还能支持更广泛的应用场景。

它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施,推动了AI开发的民主化。

研究预览:「Imagine with Claude」

作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」,在这一体验中,Claude会实时生成软件,没有预设功能或预写代码。

用户可以直接看到Claude在交互过程中即时创造与适配的过程,该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验,展示了AI的创造潜力。

API新特性

Sonnet 4.5在API层面也带来了重要更新,增强了开发灵活性和性能。

记忆工具(Beta):支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态,提升智能体连续性。

上下文编辑:通过自动清理旧的工具调用和结果来避免上下文溢出,优化资源使用。

新的停止原因提示:增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成,便于调试。

工具参数改进:修复了字符串参数尾部换行被截断的问题,保证格式精确传递,提高可靠性。

Token计数优化:系统会自动添加优化Token,但用户不会为这些系统注入的部分付费,降低了成本。

定价与使用渠道

价格保持与Sonnet 4一致,体现了Anthropic对可访问性的承诺。

输入:3美元/百万Tokens

输出:15美元/百万Tokens

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第13张

Sonnet 4.5可通过以下渠道使用,提供了多样化的集成选项:

Claude API:claude-sonnet-4-5-20250929

Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0

Google Cloud Vertex AI:claude-sonnet-4-5@20250929

同时也在Claude.ai与Claude Code平台上线,方便用户直接访问。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第14张

升级指南

当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移,所有现有API调用依然有效。

建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能,获得最佳体验。

需要注意的是,Sonnet 4.5不再允许同时指定temperaturetop_p参数,用户应选择其一,以确保调优一致性。

Anthropic正式发布Claude Sonnet 4.5:全球最强代码模型与智能体新突破 Claude 4.5  AI编程 智能体构建 代码模型 第15张

新一轮的AI编程大战即将来临

Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升,它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。

Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展,编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。

参考资料:

https://www.anthropic.com/news/claude-sonnet-4-5

https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5

https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf