当前位置:首页 > 科技资讯 > 正文

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜

一睁眼,Anthropic携新模型Claude Opus 4.6震撼登场,为您送上一份新年大礼!

消息一出,金融数据服务商FactSet股价应声暴跌10%,S&P Global、穆迪、纳斯达克公司纷纷走低,各大指数全线跳水。

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第1张这已经是Anthropic本周第二次搅动市场了。

几天前,它旗下一款自动化法律工作的插件悄然上线,直接引爆了万亿美元级别的软件股暴跌。

投资者的恐慌聚焦于一个问题:谁能保证几年内不被AI颠覆?不能就抛售。

想不到今天的Anthropic更狠。

今天以前,大家对Claude的印象,就是编程能力断档性地强。

Claude Opus 4.6冷笑一声,梆梆一拳打破这个印象:俺在更多领域都很强!

至少就官方说法而言,财务分析、研究,以及Office三件套,Claude Opus 4.6都游刃有余。

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第2张官网直接写到:

在GDPval-AA(一项评估金融、法律和其他领域经济价值知识工作任务的性能指标)上,Opus 4.6比行业下一最佳模型OpenAI GPT-5.2高出144个Elo哟

(这意味着Claude Opus 4.6在大约70%的情况下在这个评估中获得比GPT-5.2更高的分数,50%的情况下意味着分数相当)

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第3张当然,编程这块它依旧独领风骚。

在Agent编程评估Terminal-Bench 2.0中取得了最高分,并在“人类最后考试”中领先所有其他前沿模型。

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第4张好消息是加量不加价,Opus 4.6的定价保持原有标准:每百万token输入/输出,价格是5美元/25美元

带着 1M 上下文和自适应思考杀回巅峰

Opus 4.6最直观的进步就是有了1M Token超大上下文,这是Claude首次在Opus级别模型中引入这个长度的上下文窗口。

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第5张这极大改善了Opus 4.6在处理长文本时会出现的“上下文衰减”情况。

在MRCR v2 8-needle 1M基准测试——大海捞针——中,Opus 4.6得分76%,而Claude Sonnet 4.5只有18.5%。

伴随而来的结果是搜索能力的提升。

在BrowseComp评测(评估在线检索难获取信息的能力)中,Opus 4.6排名行业第一,深度多步骤代理式搜索表现最佳,能精准定位分散在长文档中的关键信息。

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第6张Opus 4.6还引入了自适应思考(Adaptive Thinking)功能。

以前,使用Claude模型的开发者只能二选一,扩展思考模式要么开,要么关。

现在,Claude可以自己判断什么时候需要深度推理。

(讲真,这一步比ChatGPT慢了哈,下次请搞快点上这种好功能)

配套的effort参数提供四档选择——low、medium、high、max——,默认high,遇到模型过度思考的情况可以手动调低。

编码、知识工作、搜索、推理等核心场景,杀爆了

官方博客显示,Opus 4.6一出,几乎无模型能与其争锋。

在编码、知识工作、搜索、推理等核心场景,Opus 4.6有显著突破

Anthropic新模型Claude Opus 4.6震撼发布:多项能力飞跃,市场再掀波澜 Anthropic Claude 4.6 市场波动 多领域突破 第7张看完有了个大概印象,我们再一个一个掰开说。