哎呀,OpenAI再度失去一名得力干将。
Kevin Lu,这位领导了4o-mini发布,并参与了o1-mini、o3发布的专家,他的研究焦点集中在强化学习、小模型和合成数据上。
Kevin Lu即将加入的是Thinking Machine Lab——由OpenAI前CTO Mira Murati创立的新AI公司,估值已达惊人的120亿美元。
据不完全统计,Thinking Machine Lab已经聚集了多位从OpenAI离职的核心研究员,包括John Schulman、Barrett Zoph和翁荔等。
Kevin Lu毕业于UC伯克利,专攻强化学习和离线序列数据建模。
毕业后,他先后加入了Hudson River Trading和Meta。2024年3月,他加入了OpenAI,入职仅3个月便带领团队完成了4o-mini项目——一个支持多模态推理的小模型。
此外,他还参与了o1-mini和o3的模型开发,专长领域显然在小模型和强化学习上。
他的论文《决策Transformer:通过序列建模进行强化学习》引用量高达2254次,是该领域的热门研究之一。
这篇论文发表于2021年,研究团队汇集了来自UC伯克利、Meta AI、UCLA、OpenAI和Google Brain的多位专家。
该研究架构将强化学习问题视为条件序列建模,通过自回归模型基于期望回报(奖励)、过去的状态和动作进行条件化,决策Transformer能够预测未来的动作。
近期,Kevin Lu在博客中发表了一篇与他研究领域相关的文章,文章标题“互联网才是唯一重要的技术”引发了广泛关注。
他认为,目前对Transformer架构的过度关注可能忽视了真正重要的东西——数据。研究者应该关注如何从互联网这样的数据源中学习和预测,因为互联网提供了大量序列相关数据,非常适合进行“下一个token预测”。
在数据稀缺的环境中,Transformer的价值将大打折扣。
他还表示,当前的强化学习难以达到GPT-1到GPT-4那样的重大突破,建议将研究重心转向产品开发。
然而,他也展望了强化学习的未来可能涉及新的数据源和奖励机制创新,这可能是AI研究的新方向。
Kevin Lu即将加入的Thinking Machine Lab是近期AI领域备受瞩目的初创公司之一。
它由OpenAI前CTO Mira Murati联合多位前OpenAI成员创立。
除了Mira本人外,团队核心成员覆盖了AI领域的主要方向:
,OpenAI联合创始人,ChatGPT架构师
oph,OpenAI前研究副总裁 翁荔,OpenAI前AI安全系统负责人
ulloch,擅长预训练&推理
etz,专注后训练
-ov,OpenAI前多模态研究负责人 ...
本文由主机测评网于2026-04-23发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439733.html