OpenAI精英流失，新创公司Think Machine Lab崛起

哎呀，OpenAI再度失去一名得力干将。

Kevin Lu，这位领导了4o-mini发布，并参与了o1-mini、o3发布的专家，他的研究焦点集中在强化学习、小模型和合成数据上。

Kevin Lu即将加入的是Thinking Machine Lab——由OpenAI前CTO Mira Murati创立的新AI公司，估值已达惊人的120亿美元。

OpenAI精英流失，新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习第1张

据不完全统计，Thinking Machine Lab已经聚集了多位从OpenAI离职的核心研究员，包括John Schulman、Barrett Zoph和翁荔等。

从Meta到OpenAI，再踏上新旅程

Kevin Lu毕业于UC伯克利，专攻强化学习和离线序列数据建模。

毕业后，他先后加入了Hudson River Trading和Meta。2024年3月，他加入了OpenAI，入职仅3个月便带领团队完成了4o-mini项目——一个支持多模态推理的小模型。

OpenAI精英流失，新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习第2张

此外，他还参与了o1-mini和o3的模型开发，专长领域显然在小模型和强化学习上。

他的论文《决策Transformer：通过序列建模进行强化学习》引用量高达2254次，是该领域的热门研究之一。

这篇论文发表于2021年，研究团队汇集了来自UC伯克利、Meta AI、UCLA、OpenAI和Google Brain的多位专家。

该研究架构将强化学习问题视为条件序列建模，通过自回归模型基于期望回报（奖励）、过去的状态和动作进行条件化，决策Transformer能够预测未来的动作。

OpenAI精英流失，新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习第3张

近期，Kevin Lu在博客中发表了一篇与他研究领域相关的文章，文章标题“互联网才是唯一重要的技术”引发了广泛关注。

他认为，目前对Transformer架构的过度关注可能忽视了真正重要的东西——数据。研究者应该关注如何从互联网这样的数据源中学习和预测，因为互联网提供了大量序列相关数据，非常适合进行“下一个token预测”。

在数据稀缺的环境中，Transformer的价值将大打折扣。

他还表示，当前的强化学习难以达到GPT-1到GPT-4那样的重大突破，建议将研究重心转向产品开发。

然而，他也展望了强化学习的未来可能涉及新的数据源和奖励机制创新，这可能是AI研究的新方向。

OpenAI精英流失，新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习第4张

Kevin Lu即将加入的Thinking Machine Lab是近期AI领域备受瞩目的初创公司之一。

它由OpenAI前CTO Mira Murati联合多位前OpenAI成员创立。

除了Mira本人外，团队核心成员覆盖了AI领域的主要方向：

，OpenAI联合创始人，ChatGPT架构师

oph，OpenAI前研究副总裁

翁荔，OpenAI前AI安全系统负责人

ulloch，擅长预训练&推理

etz，专注后训练

-ov，OpenAI前多模态研究负责人

...

本文由主机测评网于2026-04-23发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260439733.html