智东西1月23日讯,近日,由资深媒体人Ashlee Vance主持的Core Memory播客深度对话了OpenAI前研究副总裁Jerry Tworek。于今年1月初离职的Tworek在访谈中揭示了一个关键行业痛点:随着AI巨头竞争的白热化与组织规模的指数级增长,OpenAI正陷入一种结构性难题,导致其难以再支撑高风险的前沿研究,许多具有颠覆性的创新方向在公司内部已举步维艰。
Jerry Tworek不仅是OpenAI的功勋元老(2019年加入),更是推理模型o1、o3背后的灵魂人物。他成功地将强化学习(RL)推向技术巅峰,使其成为大模型进化的主流范式。此外,他在代码生成和智能体(Agent)领域也有着深厚造诣。
今年1月7日,Tworek在X平台官宣离职,引发了AI圈的剧烈震动,OpenAI多位核心高管纷纷留言表达惜别之情。
在这场长达70分钟的深度对谈中,Tworek分享了八项核心洞察:
1. 创新的“紧箍咒”:巨大的成本压力与增长KPI削弱了OpenAI对风险的耐受度,且庞大的组织架构阻碍了灵活的科研协作。
2. 谷歌的追击:谷歌的强势反弹很大程度上是因为OpenAI自身在执行层面犯了错,未能将领先优势转化为不可逾越的壁垒。
3. 行业同质化:全球五大AI实验室的研发路径正趋于高度一致,非主流范式的研究者在当前生态中几乎没有容身之地。
4. 人才市场浮躁化:AI人才争夺战已演变为频繁跳槽的“肥皂剧”,真正沉下心做长期研究的人正在变少。
5. 环境胜过明星:驱动创新的并非单一的明星科学家,而是公司能否提供一种允许自由探索并具备极强责任感的文化环境。
6. 专注力的缺失:阻碍前沿突破的往往不是算力不足,而是精力的分散。OpenAI目前已难以实现真正意义上的“集中力量办大事”。
7. AGI时间轴:虽然架构创新与持续学习仍是缺失的拼图,但Tworek预判AGI将在2029年左右实现。
8. 强化学习的轮回:技术史证明经典思想会周期性回归,强化学习在预训练模型之上的二次爆发将定义下一代智能。
Jerry Tworek坦言,在OpenAI的每一阶段,公司都呈现出完全不同的样貌。从最初的几十人到如今数千人的全球化组织,OpenAI在将ChatGPT推向世界的同时,也面临着严峻的转型阵痛。他指出,目前的竞争环境迫使公司必须优先考虑用户指标和GPU成本,这种压力从根本上改变了公司对风险的偏好。“有些我想做的研究,已经无法在OpenAI现有的组织架构下推进。”
Tworek认为Transformer虽然伟大,但绝非终极架构。他强调,行业不能仅仅依赖增加算力的Scaling Laws。他曾致力于通过强化学习扩展模型的推理能力,这一路径证明了在预训练之外,模型可以获得自动处理复杂任务的全新智能。他坚信,研究者应该寻找能改变游戏规则的新路径,而非陷于渐进式的微调。
让他感到遗憾的是,目前五家顶尖AI公司的技术路线如出一辙。“99.9%的用户无法分辨不同厂商模型之间的差异。”这种同质化竞争抑制了真正的科学探索。对于那些想在主流机器学习范式之外进行实验的研究员来说,现在很难找到合适的资源和支持。
虽然算力门槛极高,但Tworek认为真正稀缺的是冒险精神。高昂的薪资让研究人员变得“不敢失败”,为了绩效更倾向于追逐短期收益。他高度评价了像John Carmack和Ilya Sutskever这样愿意独立尝试激进想法的科研者,认为这才是科技进步的原动力。
关于AGI,Tworek提出了新的判断标准:持续学习能力。如果模型无法从交互数据中进行实时进化,就不能称之为真正的AGI。他预测,2026年将是持续学习和通用RL取得重大突破的节点,而文明级的AGI里程碑将在2029年前后降临。
谈到老东家与谷歌的竞争,Tworek直言:“谷歌的回归是因为OpenAI自己放慢了脚步。”在理想的执行状态下,OpenAI本应保持绝对领先。谷歌凭借强大的底层硬件优势和人才储备,利用OpenAI执行力下降的窗口期成功缩小了差距。
Tworek最后强调,AI已成为改变全球GDP和人际关系的硬核力量。对于每一行代码可能引发的连锁反应,研究者应保持敬畏。他未来计划将精力投入到“将研究从1推向100”的过程中,把实验室的初步验证转化为真正改变世界的大规模可靠智能。
本文由主机测评网于2026-04-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260433575.html