当前位置:首页 > 科技资讯 > 正文

AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布

AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布 Claude 4.6 GPT-5.3 Codex AI竞赛 技术革新 第1张

2026年的这一天,注定成为AI发展史上的一个里程碑。

Claude Opus 4.6与GPT-5.3 Codex在几乎同一时间发布,展现了AI技术的最新进展。

这两家公司似乎在默默较劲,都想在这个时间节点上展示自己的实力。

这场“撞车”背后,是资本、技术和市场话语权的激烈较量。

就在两周前,英伟达宣布向Anthropic投资100亿美元,使其估值飙升到3500亿美元。紧接着,在不到72小时内,英伟达又向OpenAI注资200亿美元。

对于Anthropic和OpenAI而言,这不仅仅是资金的注入,更是上市前的关键布局。他们需要在技术实力和市场定价权上证明自己。

投资人关心的是实际的产品和模型能力,而非仅仅是PPT上的承诺。

在这场竞赛中,谁的产品更强大、更有实际应用价值,谁就能在IPO时获得更高的估值和更多的筹码。

在AI领域,一山不容二虎。Anthropic和OpenAI必须让对方明白,谁才是这个领域的领头羊。

因此,这样的产品发布节奏并非偶然,而是精心策划的较量。

双方都明白,每一次产品发布都是一次融资路演,每一个技术突破都会直接影响投资人的决策和市场预期。

从产品本身来看,两家公司都展现出了强大的实力。

Claude Opus 4.6:智能思考的全新升级

Anthropic对Claude Opus系列的这次升级,聚焦于“更智能的思考”。

Opus 4.6最显著的变化是学会了“adaptive thinking”,能够根据任务的复杂程度自动调整思考深度。在复杂问题上投入更多时间,而在简单任务上快速通过。

在代码能力方面,Opus 4.6在Terminal-Bench 2.0评测中取得了最高分。

AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布 Claude 4.6 GPT-5.3 Codex AI竞赛 技术革新 第2张

这个测试专门考察AI在终端环境下的操作能力。模型需要知道何时使用哪个命令、如何组合工具以及如何从错误信息中找出问题所在。

Opus 4.6是Anthropic首个提供100万token上下文窗口的Opus级别模型,能够一次性处理相当于两本中等厚度小说的文本量。

在金融、法律等实际工作任务中,Opus 4.6的表现尤为出色。

GPT-5.3 Codex:自我训练的新纪元

在Claude Opus 4.6发布的几十分钟后,OpenAI也发布了GPT-5.3 Codex。

AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布 Claude 4.6 GPT-5.3 Codex AI竞赛 技术革新 第3张

GPT-5.3 Codex最引人注目的特点是能够像真人同事一样工作,并且可以在工作中随时与你互动。

你给它一个复杂任务,它能自己琢磨几个小时甚至几天,并主动汇报进度、征求你的意见。

有趣的是,OpenAI用GPT-5.3 Codex的早期版本来开发后续版本。这种自我训练的方式极大地提高了开发速度。

GPT-5.3 Codex在多个基准测试中创造了新的行业纪录。在SWE-Bench Pro上,它达到了56.8%的准确率;在Terminal-Bench 2.0上,它的得分高达77.3%。

AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布 Claude 4.6 GPT-5.3 Codex AI竞赛 技术革新 第4张AI巨头竞相展示新成果:Claude Opus 4.6与GPT-5.3 Codex震撼发布 Claude 4.6 GPT-5.3 Codex AI竞赛 技术革新 第5张