太震撼了!抢先于Claude 5问世之前,OpenAI深夜悄然祭出了一款编码杀器——Codex。它支持单人指挥多Agent并行协作,内置可复用的Skills技能包,让编码工作从此迈入自动化时代。
随着Claude 5的脚步声日益临近,奥特曼终于按捺不住了。
就在刚刚,OpenAI毫无预兆地抛出了一枚「重磅炸弹」——Codex正式进化为独立的桌面应用程序。
这不再仅仅是一个编写代码的窗口,而是一个能够同时调度千军万马(多个Agent)的「全能指挥中心」。
Codex的定位非常清晰:要做Agent的「指挥中枢」。
具体而言,Codex能够实现以下几大功能:
多任务并行切换,轻松自如:同时调用多个AI智能体协同工作,借助「工作树」(worktrees)实现变更隔离,彼此互不干扰;
创建并复用Skills:将常用工具和开发规范封装成可重复调用的能力模块;
设定自动化流程:通过后台定时工作流,把那些重复性的杂务全部交给Codex自动处理。
假设你想为相册里的照片增加「拖拽」功能,只需选择「工作树」,即可让AI在同一代码仓库中各司其职、并行开发。
Codex的进化速度令人惊叹,它不仅能够生成代码,还学会了利用代码作为「Skills」来操控电脑环境。
例如,想要解决项目中的Comment问题,直接调用已安装的Skills,Codex立刻就能将问题破解。
不仅如此,OpenAI仅凭一句指令,就让Codex消耗了700万token,独立打造出一个3D版赛车游戏。
这一次,Codex的诞生绝非新瓶装旧酒,更不是一次缺乏诚意的「套壳」包装。
它标志着AI编程正式从「对话式助手」进化为了「指挥控制中心」。
奥特曼激动地表示,「我实在太喜欢了!它比我想象中还要惊喜」。
「AI程序员永远不会耗尽多巴胺。它们不会感到沮丧,也不会耗尽精力。它们会一直坚持,直到问题被解决」。
OpenAI总裁Greg也极力推荐——
多年来我一直是终端和Emacs的忠实用户,但自从用了Codex之后,再回到终端简直感觉像是穿越回了原始时代,代差实在太明显了。
这种感觉,就像是一个专为开发而生的AI智能体原生界面。
OpenAI Codex代表了一种全新的AI编码范式,极有可能彻底重塑开发者与代码之间的交互逻辑。
甚至,Codex还能与Claude Cowork一较高下,瞬间将杂乱的桌面清理得干干净净。
目前,Codex已在macOS平台正式上线,Windows版本也即将推出。
OpenAI还放出了「限时福利」:ChatGPT免费用户和Go版本用户也可使用Codex,而Plus、Pro、Business、Enterprise和Edu计划的用户,使用速率直接翻倍。
macOS版Codex应用提供了一个功能强大的全新交互界面。
它让开发者能够轻松驾驭多个AI智能体,并行处理各项任务,并与AI协作攻克那些耗时巨大的复杂项目。
过去,开发者和AI的关系一直是「结对编程」:你写一段,它接一段。
如今,Codex的问世将彻底改变软件的构建方式——
人类不再需要与AI紧密结对,而是可以直接给AI委派任务,贯穿软件设计、构建、发布和维护的全生命周期。
这一转变的苗头,实际上从2025年4月Codex首次发布时便已初见端倪。
开发者与AI的协作方式已经发生了根本性的变革。
现有模型可以端到端地处理复杂、长流程的任务,开发者也开始在跨项目中指挥多个AI智能体:
分派工作、并行执行任务,并放心地把耗时数小时、数天甚至数周的重大项目交给AI处理。
核心挑战已不再是AI能做什么,而是人们如何大规模地指挥、监督并与它们协作——
遗憾的是,现有的IDE和终端工具并非为这种模式而生。
这种全新的构建方式,加上模型能力的持续提升,呼唤着一种全新的交互载体。
这正是OpenAI推出Codex桌面应用的原因,主打「一个AI智能体的指挥中心」。
Codex为与AI智能体的多任务并行,构建了一个专注的工作空间。
所有AI在按项目组织的独立线程中运行,确保你可以无缝地在任务间切换,而不会丢失上下文。
你可以在应用内直接检查AI的改动,在差异对比上写评论,甚至用编辑器打开进行手动调整。
它还内置了对Git worktree的支持,因此多个AI可以在同一个代码仓库中并行工作而互不冲突。
每个AI都在你代码的隔离副本中工作,让你能够探索不同的开发路径,无需担心它们会影响你的主代码库。
当AI智能体工作时,你可以将改动拉取(checkout)到本地,或者让它继续推进,完全不影响本地的git状态。
应用会自动从Codex CLI和IDE扩展中同步会话历史与配置,这样你马上就能在现有项目中用起来。
Codex正从一个只会写代码的AI,进化为一个能用代码在电脑上真正解决实际问题的AI。
通过Skills(技能),可以轻松扩展Codex的能力边界。
今后,Codex不再局限于代码生成,还能处理信息收集与整合、问题解决、文档撰写等任务。
Skills就像是打包好的指令、资源和脚本,让Codex能够可靠地连接工具、运行工作流,并按照团队的习惯完成任务。
Codex应用内有一个专门的界面来创建和管理Skills。
你可以明确要求Codex使用某个Skill,或者让它根据当前任务自动调用。
OpenAI举了一个例子:曾让Codex开发一款赛车游戏——
要求包含不同的车手、八张地图,甚至还有玩家能用空格键触发的道具。
利用图像生成Skill(由GPT Image驱动)和网页游戏开发Skill,Codex仅凭最初的一个用户提示词,就独立工作并消耗了超过700万个Token,最终把游戏做了出来。
它身兼数职,既是设计师、游戏开发者,又是QA测试员,通过实际试玩来验证成果。
6万Token
可以看到,在只消耗了6万token的这个版本里,画面显得非常粗糙。
狭窄的赛道中间塞满了撞上去会穿模的「障碍物」。
技能箱可以拾取,也可以发射,但似乎没有什么实际效果。
最尴尬的是,你会永远在「第二圈」无限循环下去……
80万Token
在80万token的版本中,画面似乎有所改善,赛道也宽敞了不少,更接近大家平时玩的赛车游戏了。
但是箱子吃到的技能好像没什么用,发射出去之后,小车们还是各跑各的……
而且依旧会在第二圈陷入循环,永远跑不完。
700万Token
最后这个700万token的版本,画质明显提升了很多。不仅有清晰的赛道,技能箱也更精致了。
这次,技能箱确实有用了。
比赛刚开始,我们就吃了AI扔出的一个大招,没来得及躲闪。于是,喜提倒数第一。
不过,比起前两个陷入无限循环的世界来说,这次至少能够完赛了。
从运行评测和监控模型训练,到起草文档和汇报增长实验,OpenAI内部构建了数百个Skills,帮助多个团队自信地将以前很难统一定义的工作委派给Codex。
Codex应用内置了一个Skills库,涵盖了OpenAI内部流行的工具和工作流,下面重点介绍几个。
实现设计:从Figma拉取设计上下文、资源和截图,并将其转化为视觉上1:1还原的生产级UI代码。
管理项目:在Linear中处理Bug分类、追踪发布、管理团队工作负载等,推动项目进展。
部署到云端:让Codex把你做好的Web应用部署到流行的云主机,如Cloudflare、Netlify、Render和Vercel。
生成图像:使用由GPT Image驱动的图像生成Skill来创建和编辑图像,用于网站、UI原型、产品配图和游戏素材。
使用OpenAI API构建:在使用OpenAI API开发时,参考最新的文档。
创建文档:一套用于阅读、创建和编辑PDF、电子表格和文件的Skills,排版布局专业。
使用Vercel和图像生成Skills更新网站
使用电子表格Skill创建表格以生成购物清单
使用Linear管理你的Issue Backlog
当你在应用中创建一个新Skill时,Codex可以在你工作的任何地方使用它:应用内、CLI或IDE扩展中。
你也可以把Skills提交到代码仓库,让整个团队都能共享使用。
OpenAI分享的Agent Skills:https://github.com/openai/skills
Codex可以设置Automations(自动化),按计划在后台自动执行任务。
Automations将指令与可选的Skills结合,会按照你设定的时间表运行。
当Automation完成时,结果会进入审查队列,你可以随时切回来查看并根据需要继续后续工作。
设置自动化以定期创建新Skills
在OpenAI内部,团队一直用Automations来处理那些重复但重要的任务,比如每日Issue分类、查找和总结CI失败原因、生成每日发布简报、检查Bug等等。
开发者在与AI合作时的偏好各不相同。
有人喜欢直截了当、只讲执行的搭档;有人则喜欢话多一点、更具互动感的风格。
Codex现在允许开发者在两种个性间选择——一种是简洁务实风,另一种是更具对话感和同理心的风格。
两者的能力完全一样,只为贴合你的喜好。只需在应用、CLI和IDE扩展中输入/personality命令即可切换。
此外,OpenAI还将「设计即安全」(Security by Design)的理念融入了Codex AI智能体栈的方方面面。
Codex应用采用了原生的、开源且可配置的系统级沙箱(Sandboxing),这与Codex CLI中的机制一致。
默认情况下,Codex AI智能体只能编辑它当前工作的文件夹或分支里的文件,并使用缓存的网页搜索。
如果需要运行像联网访问这类需要更高权限的命令,它会先请求你的许可。
你可以为项目或团队配置规则,允许特定命令自动以提升的权限运行。
如今,企业和开发者正越来越依赖Codex进行端到端开发。
自12月中旬发布GPT-5.2-Codex以来,Codex的总使用量翻了一番,过去一个月里有超过100万开发者使用Codex。
下一步,团队将继续扩展Codex的使用场景,包括上线Windows版应用、不断突破模型能力边界,以及实现更快的推理速度。
OpenAI科学家感慨:过去几周写的代码比过去几年还要多。而且,还用Codex修复了Prism的多个bug并完成了功能更新。
在应用内部,OpenAI还将根据实际反馈持续打磨多AI智能体工作流,让管理并行任务和在AI间切换变得更容易,且不丢失上下文。
他们还在为Automations开发基于云端的触发器支持,这样Codex就能在后台持续运行——而不仅仅是在你电脑开机的时候。
Codex建立在一个简单的前提之上:一切皆由代码控制。
一个AI智能体在推理和生成代码方面越强,它在各类技术和知识工作中的能力就越强。
OpenAI全家桶
然而,当今的一个关键挑战在于,前沿模型的能力与人们在实际中轻松使用它们之间存在差距。
Codex旨在缩小这一差距,让人们更容易指挥、监督并将OpenAI模型的全部智慧应用到实际工作中。
OpenAI致力于将Codex打造成最强的编程AI智能体,这也为它成为能处理代码之外广泛知识工作的全能AI奠定了基础。
在制作上面这款赛车游戏时,Codex使用的初始提示词如下(总结精炼版):
使用Three.js实现Voxel Velocity作为一个3D体素卡丁车赛车游戏,只有一种模式:单人比赛(总是3圈,1个人类对7个CPU,所有8条赛道立即在这个模式下可用,没有进度限制)。构建一个最小的赛前流程,仅包括:赛道(8),角色(8),难度(轻松/标准/刻薄),可选的镜像模式,可选的允许克隆,和开始比赛,加上一个选项菜单和一个赛中暂停菜单(恢复/重新开始/退出)。创建一个街机驾驶模型,具有灵敏的操控,宽容的擦墙碰撞,有意义的漂移作为主要技能,以及一个漂移充电系统,产生精确的加速等级(1级0.7秒,2级1.1秒,3级1.5秒),同时保持基准速度「快但可读」,并且在宽阔的道路上保持持续的超车。实现正好8个道具,单道具容量,微妙的位置加权分布,和温和的效果(最大失控≤1.2秒,最大转向禁用≤0.6秒),创造滑稽的混乱而没有硬眩晕,加上在加速期间减少50%的越野减速。定义8个角色及其给定的统计数据和AI倾向,实现CPU难度预设和赛道编写的赛车/变化样条线,漂移区和危险回避,以便AI使用多车道宽度进行干净的超车,并发布HUD/音频要素(位置,圈数/最后一圈横幅,小地图,道具槽,计时器/分段,可读的音效,和每个赛道一个音乐循环)。
随后,Codex不断地被从10个通用提示词的随机列表中重新提示,以继续处理这个问题。
其中一个提示词的例子是:
你的工作是添加新功能,使游戏更接近原作。首先,玩游戏并确定与原作相比缺少了什么。然后挑选几个缺失的功能并实现它们。在每个功能之后,彻底测试它,通过玩游戏并确认它工作正常。如果你在玩的时候注意到任何错误,也要优先修复它们。
参考资料:
https://x.com/sama/status/2018414858015039504?s=20
https://x.com/OpenAI/status/2018385565289267236?s=20
https://openai.com/index/introducing-the-codex-app/
本文由主机测评网于2026-04-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260434776.html