智东西10月16日消息,Anthropic公司近日宣布推出了一款更小、更便宜、速度更快的推理模型——Claude Haiku 4.5。该模型在性能和成本上均实现了显著提升。
Anthropic的官方博客指出,Claude Haiku 4.5专为追求快速且准确答案的用户而设计。相比前一代模型,它提供了与Claude Sonnet 4相媲美的编程性能,但成本仅为前者的三分之一,速度更是快了两倍多。此外,该模型在包括计算机任务在内的多种应用场景中表现优异,甚至超越了Claude Sonnet 4。
在衡量AI系统软件编程能力的测试集SWE-bench Verified中,Claude Haiku 4.5的表现与Claude Sonnet 4及OpenA的GPT-5不相上下。
目前,Claude Haiku 4.5对Anthropic的免费用户开放使用,开发者可以通过Claude API接入该模型,定价为每百万输入和输出token 1美元(折合人民币约7元)和5美元(折合人民币约35元)。 Anthropic的首席产品官迈克·克里格(Mike Krieger)在接受外媒CNBC采访时表示,对于付费用户而言,Haiku模型的成本通常是Anthropic的Sonnet模型的三分之一,而Sonnet模型的成本又仅为Opus模型的五分之一。在Claude系列模型中,最小的模型被称为Haiku,中型模型为Sonnet,最大的则是Opus。 在多个基准测试中,Claude Haiku 4.5均表现出色,超越了其前代模型。这意味着基于该模型的浏览器Agent插件如Claude for Chrome等工具将比以往任何时候都更加高效和有用。 Claude Haiku 4.5的训练数据涵盖了多种来源,包括互联网公开数据、第三方非公开数据等。在预训练后,研究人员通过强化学习对其进行了大量后训练和微调。 该模型是一种混合推理模型,支持用户切换至“扩展思维模式”,在回答前花费更多时间思考其响应。在极少数情况下,当思考过程过长时,它会生成较短的思考过程摘要。 此外,该模型具有明确的上下文感知能力,并提供有关上下文窗口使用量的精确信息。 Anthropic对Claude Haiku 4.5在单轮场景中的安全性进行了全面评估。在违规请求评估中,该模型表现出的安全性能与同类模型相当。 在Agent Red Teaming(ART)基准测试中,Claude Haiku 4.5表现良好,取得了多个优异成绩。该测试用于评估模型在敏感数据泄露、安全准则违反等方面的表现。 Anthropic目前估值为1830亿美元,正在为超过30万名企业客户提供服务。其发言人透露,公司本月年收入运行率接近70亿美元。然而,相比竞争对手仍有差距。Anthopic一直在努力追赶谷歌和OpenAI等竞争对手的步伐。 此次发布的Claude Haiku 4.5不仅在速度和成本上有所提升,还进一步细化了安全评估维度。未来有望在编程辅助、企业安全协作等更多场景中发挥作用。 来源:Anthropic、CNBC
支持多模型协同与上下文感知
思考过长会自动加速总结
安全性评估结果与Claude Sonnet 4.5相当
结语:Anthropic加速追赶
开启无缝衔接式研发节奏
本文由主机测评网于2026-05-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260542778.html