当前位置：首页 > 科技资讯 > 正文

AI巨头对决：OpenAI与Anthropic的新纪元

就在刚刚，硅谷 AI 圈上演了一场「火星撞地球」般的激烈竞争。

OpenAI 和 Anthropic 几乎同时发布了他们的最新更新：Claude Opus 4.6 和 GPT-5.3-Codex。这两大更新不仅令人瞩目，更预示着 AI 领域的重大变革。

在昨晚之前，我们还在讨论如何写好 Prompt 辅助工作；但今天之后，我们可能需要学会如何像老板一样管理 AI 员工。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第1张

AI 造 AI，甚至接管你的电脑

Sam Altman 刚刚在 X 平台上凡尔赛了一把，庆祝 Codex 的「百万活跃用户」里程碑。短短一天后，OpenAI 再次乘胜追击，推出了——

GPT-5.3-Codex。

技术文档中提到了一句极具分量的话：「这是我们第一个在创造自己的过程中，发挥了关键作用的模型。」

换句话说：AI 已经学会了自己写代码、自己找 Bug，甚至开始自己训练下一代的 AI 了。这种自我进化能力，也体现在了一连串的跑分数据上。

在 OSWorld-Verified 基准测试中，GPT-5.3-Codex 的准确率从前代的 38.2% 直接跃升至 64.7%。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第2张

要知道，人类的平均水平也就 72%。这意味着，AI 距离像你一样熟练地操作电脑，只差一层窗户纸的距离。

而在 Terminal-Bench 2.0 中，它更是拿下了 77.3% 的高分，把 GPT-5.2（62.2%）远远甩在身后。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第3张

在覆盖四种编程语言的 SWE-Bench Pro 基准测试中，GPT-5.3-Codex 也表现出了 SOTA 水准，而且用的 Token 比以往任何模型都少。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第4张

OpenAI 甚至展示了它独立构建的能力：

在几天内，它从零构建了一款包含多张地图的赛车游戏 v2，还搞定了管理氧气系统的深海潜水游戏。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第5张

最让我印象深刻的是 GPT-5.3-Codex 对模糊意图的理解。

在构建落地页时，它自动把年度计划换算成了打折后的月付价格，还补充了用户评价轮播——这一切，都不需要你下指令。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第6张

OpenAI 的野心已经显露无遗：以前微软常说 AI 会成为人类的副驾驶（Copilot），但现在 AI 更想成为那个能掌控方向盘、甚至能自己修车的司机。

告别「金鱼记忆」Claude 迎来绝地反击

在 GPT-5.3-Codex 发布的前后脚，Anthropic 也端出了自己的春节大礼包。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第7张

相比于 OpenAI 在行动力上的激进，Anthropic 的 Claude Opus 4.6 则是在思考力和可靠性上死磕。

很多企业用户都有一个名为 Context Rot（上下文腐蚀）的痛点：号称支持 20 万上下文，但数据一多就顾头不顾尾。这次，Claude Opus 4.6 的召回率高达 76%。

AI巨头对决：OpenAI与Anthropic的新纪元 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第8张

这意味着你可以把几百页的财报、几十万字的代码库直接扔给它，它不仅能读完，还能精准地告诉你第 34 页脚注里的那个数字有问题。

本文由主机测评网于2026-04-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260435291.html