当前位置:首页 > 科技资讯 > 正文

Claude Haiku 4.5: 性能卓越,价格亲民

就在最近,Anthropic 推出了 Claude Haiku 4.5,这是一款备受瞩目的 AI 模型更新。

首先简单介绍一下,Claude 家族包括三个不同规模的模型:Claude Opus(大模型)、Sonnet(中模型)和 Haiku(小模型)。

这次更新最引人注目的地方在于,小模型 Claude Haiku 4.5 在保持高性能的同时,速度更快,价格也更亲民。

五个月前,Claude Sonnet 4 还是最先进的模型之一。而现在,新推出的 Haiku 4.5 在编码性能上几乎与 Sonnet 4 并驾齐驱,但价格仅为三分之一,速度还提高了两倍多。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第1张

具体来说,在衡量 AI 编码能力的测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,这意味着它与 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 处于同一水平。

在某些任务如操控电脑方面,Haiku 4.5 甚至超越了老大哥 Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或结对编程助手,Haiku 4.5 的高智能和出色速度能带来更好的体验。

使用 Claude Code 的开发者也会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更灵敏高效。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第2张

当然,两周前发布的 Sonnet 4.5 依然是 Anthropic 的旗舰模型,属于全球编程模型的顶级档次。但 Haiku 4.5 提供了另一种选择:性能接近顶级,价格却亲民得多。

而且 Haiku 4.5 的玩法更灵活,可以与多个 Haiku 4.5 并行处理复杂任务,与 Sonnet 4.5 配合默契。

Anthropic 对 Haiku 4.5 进行了详细的安全性和对齐性测试。

结果显示,该模型的不良行为发生率较低,且比前代 Haiku 3.5 的对齐性显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为比 Sonnet 4.5 和 Opus 4.1 都更少。

因此,它目前是 Anthropic 家中最安全的模型。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第3张

至于价格方面...Haiku 4.5 的定价为:每百万输入 token 1 美元,每百万输出 token 5 美元。

相比之下,GPT-5 mini 约每百万输入 0.25 美元、输出 2.5 美元,而 Google 的 Gemini 2.5 Flash 价格相近。也就是说,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。

但与 Sonnet 4.5 相比,它便宜了约三倍,性能却几乎相同,这对开发者来说算是降本增效了。

不过需要注意的是,数学不是它的强项。

知名博主 Dan Shipper 试用后发现,Haiku 在算术上有些困难。

例如,在测试 Uber 账单的例子里,Haiku 虽然成功找出了所有相关邮件,但在计算总额时却失败了。更尴尬的是,在指出错误后它承认了——但后来又犯了同样的错。

Dan Shipper 的评价是:

如果你是开发者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。

如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第4张

附上博客地址:

https://every.to/vibe...

目前,Claude Haiku 4.5 已上线 Claude Code 和各类应用。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格是 Anthropic 最优惠的档次。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第5张

我们参考了@zb1992 的建议,让 Claude 4.5 Haiku 跑了一个钟表 Demo。整体体验下来,代码生成速度确实更快了,最终成品也令人满意。

在下面的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势更加明显,这正是轻量级模型在实际应用中的核心竞争力所在。

Claude Haiku 4.5: 性能卓越,价格亲民 4.5 性能提升 价格优惠 Anthropic 第6张