当前位置:首页 > 科技资讯 > 正文

Codex:从编程智能体到超级助手的进化

Codex:从编程智能体到超级助手的进化 Codex 人工智能 编程智能体 AGI 第1张

自8月GPT-5发布以来,Codex展现出惊人的爆发力,用户增长20倍,每周处理数万亿tokens,成为OpenAI最受欢迎的编程智能体。

“Codex能实现20倍增长,不仅因为模型变强,还因为我们理解了真正的智能体是模型、API和框架共同努力的结果。”在最新播客中,OpenAI编程智能体Codex产品负责人Alexander Embiricos揭示了背后的秘密。

例如,Codex在长时任务能力上的突破。为了让其能连续工作十几个小时甚至数天,团队设计了名为“压缩”的机制——模型提炼关键信息,API承接任务链路,框架负责稳定运行。三层像齿轮般咬合,使Codex能完成传统大模型难以支撑的长时编程任务。

正是这样的底层逻辑,让Codex在业务实战中有惊人表现。Andrej Karpathy曾公开分享,他被一个bug困住数小时,最终交给Codex处理,一小时内就完成了修复。

Sora团队更是依靠Codex,在短短28天时间从0到1完成Android应用的上线,直接冲到App Store第一。

Alexander Embiricos也坦言,Codex的路径并非一开始就清晰。早期的Codex“太过未来”,采用远程异步交互方式,这符合资深工程师的习惯但对大部分工程师并不友好。真正的拐点来自一个关键调整:团队将Codex从云端迁回本地,让它直接在工程师的IDE中工作,才更接地气起来。

目前的Codex在Alexander Embiricos看来,像一个“聪明但不会主动的实习生,写代码写得很快。”而Codex一直在自我监督、自我训练、不断进化。Alexander期待未来Codex能真正参与软件开发的全流程,成为工程师的好队友。

Alexander还谈到OpenAI的组织文化,他惊叹于OpenAI的速度与野心,迭代速度之快闻所未闻。比起其他组织的“先瞄准再射击”,他认为OpenAI的独特之处正在于“先射击再瞄准”,即先发布再根据真实使用反馈优化路径。而搜集世界最优秀的人才与自下而上的文化使这种高速迭代成为日常。

对于未来AGI会何时到来,Alexander给出了一个有趣的视角,他认为当前真正的限制AGI的因素不是模型能力而是人类——我们输入速度有限、审查速度有限,正在拖累其发展。

他做了一个预判:第一批生产力曲线出现陡增的用户将在明年出现,其后的变化会加速扩散。“当增长曲线突然变得异常陡峭时,”他说,“我们可能就已经站在AGI的门口。”

播客精彩观点汇集:

  1. 在Codex的帮助下,OpenAI仅用几周时间就凭借两三位工程师的协作打造出Sora安卓应用,并使其在App Store排名第一。Sora应用从零到员工测试仅用了18天并在10天后正式发布。Codex通过分析现有iOS应用、制定工作计划以及同时比较两个平台来实现功能从而提供了极大帮助。
  2. 即使人工智能模型明天停止改进我们仍需要数年时间进行产品开发才能充分发挥潜力。这项技术的发展速度超过了我们目前能够最佳利用它的能力。
  3. 充分利用Codex的关键在于选择最棘手的问题而不是最简单的问题。这些工具旨在解决棘手的bug和复杂的任务而不是简单的任务。从那些你平时需要花费数小时才能解决的问题入手。
  4. OpenAI最初的Codex产品“过于超前”。它以异步方式在云端运行这对高级用户来说很棒但对新手来说却很困难。当它将Codex带回工程师们日常工作的地方——他们自己的电脑上的代码编辑器——时其增长速度呈爆炸式增长。过去6个月里Codex的使用量增长了20倍。
  5. 编写代码可能成为人工智能完成任何任务的通用方式。与其点击界面或构建单独的集成不如即时编写小型程序这样才能发挥最佳性能。这意味着每个人工智能助手都应该内置编码能力而不仅仅是专门的编程工具。
  6. OpenAI的设计师现在编写并发布自己的代码。设计团队维护着一个由人工智能辅助构建的、功能齐全的原型。当他们有了想法他们会直接编写代码、进行测试并经常自行提交到生产环境。只有当代码库特别复杂时工程师才会介入。
  7. 人工智能生产力的最大瓶颈不是人工智能本身而是人类的打字速度。限制因素在于你输入提示的速度以及你审查人工智能生成工作的速度。在人工智能能够更可靠地验证自身输出并主动提供帮助之前我们将无法看到这些工具所能带来的全部生产力提升。
  8. 编写代码的乐趣正在逐渐被审查人工智能生成的代码所取代。工程师们曾经热爱构建代码的创造性过程而现在他们却花费更多时间阅读人工智能生成的代码。下一个挑战是如何让代码审查过程更快、更令人满意。
  9. 新型人工智能模型现在可以连续工作24到60多个小时来完成单个任务。一种名为“压缩”的技术可以让人工智能在内存耗尽之前总结其学习到的内容然后在新的会话中继续工作。这使得人工智能能够实现以前无法实现的通宵或多天自主工作。
  10. 如果你现在要创办一家公司深入了解特定客户比擅长产品开发更重要。产品开发变得越来越容易。如今真正的优势在于知道该开发什么产品以及为谁开发产品。

OpenAI的速度、文化与用人方式

Lenny:我想先从你在OpenAI的经历谈起。你大约一年前加入OpenAI。在那之前你创办自己的公司大约五年再之前在Dropbox担任产品经理。OpenAI显然是一家与你过去工作过的所有公司都截然不同的地方。我想问在OpenAI最特别的运作方式是什么?你在那里学到了什么是你认为无论未来走到哪里(假设你有一天会离开)都会带走的?

Alex:到目前为止我觉得在OpenAI工作的节奏和雄心远远超出我的想象。说这句话时我会想到以前在创业圈每个人都认为自己的公司速度快、人才要求高、目标宏大但来到OpenAI后我意识到这些词在这里意味着完全不同的尺度。在OpenAI我重新理解了“速度”和“雄心”真正的含义。

我们常听到外界感叹人工智能公司的发展速度快而我首先想到的例子就是模型本身的爆炸式增长。尽管我们扩大了外部数据规模但像Codex这样十倍级别的模型增长只在几个月内完成其后的进展又继续加速。至少对我而言在经历那些阶段之后我发现自己在打造科技产品时会自然把目标设定为达到那种速度和规模否则就会觉得不足。相比之下我在创业公司所经历的节奏显得慢得多。

创业过程中往往需要权衡投入与失败的可能性:先尝试再转型。不过在OpenAI我深刻意识到影响力之巨大而要把工作做好需要投入极高的精力。这种需求迫使我更加果断地安排时间。

Lenny:在继续往下之前我想追问一件事:像Codex这样能迅速推进的团队是否有某种特别的组织架构或结构性原因?还是因为我对开源软件的运作方式不够了解所以才让团队能这样快速前进?一定存在一些结构让这一切发生。

Alex:一方面我们所使用的技术本身就彻底改变了很多事情包括我们构建产品的方式以及能够为用户实现的功能。虽然我们经常讨论基础模型的改进但即使我们停止模型层面的进展(虽然事实上并没有)我们在产品开发方面仍然落后很多还有大量产品尚未实现。可以说这个领域的成熟度远高于外界想象。

不过也有很多让我意外的地方。刚到OpenAI时我对组织架构了解不多。例如以往在创业公司或在Dropbox担任产品经理时鼓舞团队士气、确保团队朝正确方向前进是极其重要的标配工作。但在OpenAI由于我们并不确切知道近期会出现哪些功能也不知道哪些功能最终奏效即便从技术层面可行也无法确定最终结果因此需要保持谦逊通过不断尝试来学习。

这里的组织架构设计为高度自下而上运作每个人都渴望快速推进。许多公司声称是自下而上但OpenAI真正如此。这对我来说是宝贵的学习经验也让我意识到未来可能很难再回到非人工智能公司工作。我甚至不确定那意味着什么。如果让我重新回到过去我的做事方式一定会完全不同。

Lenny:我听到你的描述感觉更像“预备射击瞄准”而不是“预备瞄准射击”。许多人工智能公司的思路似乎是:因为不知道用户最终会怎样使用产品所以花大量时间把产品做到完美毫无意义。最好的方式是尽快发布观察人们如何使用再快速迭代。

Alex:这个比喻有一定道理但目标成分本身是模糊的。我们大致预测未来可能发生什么但其中仍有大量不确定性。一位研究主管常说在OpenAI我们可以就一年后的未来展开高质量对话但越接近那个时间点反而越难做出理性规划。我们会构想远期未来要实现什么尤其在人工智能对齐等议题上我们必须考虑非常长期的未来。但当真正进入产品阶段后我们会开始关注战术层面的细节例如具体要构建哪些产品人们会如何实际使用。产品方面我们更依赖实证研究来验证。

Codex的定位、核心哲学与产品愿景

Lenny:那我们来聊聊Codex。你是Codex的负责人。Codex现在进展如何?你能分享一些数据吗?另外也不是所有人都清楚Codex是什么你能解释一下吗?

Alex:Codex是开源编码智能体更具体来说它是一款VS Code的IDE扩展你可以安装扩展或终端工具。……(此处省略了部分详细解释内容)

Codex的技术突破、增长动力与三层系统结构

Alex:Codex自发布以来一直呈现爆炸式增长。……(此处省略了部分详细解释内容)

写代码是模型最好的方式与编码智能体的未来

Alex:我认为未来的人工智能智能体会逐渐摆脱“被动工具”的角色转向“主动队友”的角色。……(此处省略了部分详细解释内容)

AI对软件工程与产品开发的影响

Alex:这是一个非常复杂的问题但可以从几个方向理解。……(此处省略了部分详细解释内容)

Codex如何影响产品经理的运作方式

Alex:对我来说我感受到的最大变化是“能力被大幅增强”的感觉。……(此处省略了部分详细解释内容)

衡量Codex的进步:用户留存、真实反馈与社区信号

Alex:一个我不断提醒自己的事情是像Codex这样的产品本质上是一种你必须真正使用的工具。……(此处省略了部分详细解释内容)

为什么要做浏览器、Atlas的由来、情境化助手的愿景

Alex:我之前在Atlas上工作过一段时间说一下我自己的故事。……(此处省略了部分详细解释内容)

Codex的非工程应用:设计、分析与意想不到的用途

Alex:确实有很多意想不到的用途但目前为止最明显的仍然是那些偏向技术或与编程相关的领域比如数据团队或做分析的人。……(此处省略了部分详细解释内容)

AI时代的技能、职业影响、未来AGI时间表与团队扩张

Alex:我认为学习编程依然非常重要但理由正在发生变化。……(此处省略了部分详细解释内容)