当前位置:首页 > 科技资讯 > 正文

OpenAI精英流失,新创公司Think Machine Lab崛起

哎呀,OpenAI再度失去一名得力干将。

Kevin Lu,这位领导了4o-mini发布,并参与了o1-mini、o3发布的专家,他的研究焦点集中在强化学习、小模型和合成数据上。

Kevin Lu即将加入的是Thinking Machine Lab——由OpenAI前CTO Mira Murati创立的新AI公司,估值已达惊人的120亿美元。

OpenAI精英流失,新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习 第1张

据不完全统计,Thinking Machine Lab已经聚集了多位从OpenAI离职的核心研究员,包括John Schulman、Barrett Zoph和翁荔等。

从Meta到OpenAI,再踏上新旅程

Kevin Lu毕业于UC伯克利,专攻强化学习和离线序列数据建模。

毕业后,他先后加入了Hudson River Trading和Meta。2024年3月,他加入了OpenAI,入职仅3个月便带领团队完成了4o-mini项目——一个支持多模态推理的小模型。

OpenAI精英流失,新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习 第2张

此外,他还参与了o1-mini和o3的模型开发,专长领域显然在小模型和强化学习上。

他的论文《决策Transformer:通过序列建模进行强化学习》引用量高达2254次,是该领域的热门研究之一。

这篇论文发表于2021年,研究团队汇集了来自UC伯克利、Meta AI、UCLA、OpenAI和Google Brain的多位专家。

该研究架构将强化学习问题视为条件序列建模,通过自回归模型基于期望回报(奖励)、过去的状态和动作进行条件化,决策Transformer能够预测未来的动作。

OpenAI精英流失,新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习 第3张

近期,Kevin Lu在博客中发表了一篇与他研究领域相关的文章,文章标题“互联网才是唯一重要的技术”引发了广泛关注。

他认为,目前对Transformer架构的过度关注可能忽视了真正重要的东西——数据。研究者应该关注如何从互联网这样的数据源中学习和预测,因为互联网提供了大量序列相关数据,非常适合进行“下一个token预测”。

在数据稀缺的环境中,Transformer的价值将大打折扣。

他还表示,当前的强化学习难以达到GPT-1到GPT-4那样的重大突破,建议将研究重心转向产品开发。

然而,他也展望了强化学习的未来可能涉及新的数据源和奖励机制创新,这可能是AI研究的新方向。

OpenAI精英流失,新创公司Think Machine Lab崛起 Think Lab OpenAI Kevin Lu 强化学习 第4张

刚刚完成20亿美元种子轮融资

Kevin Lu即将加入的Thinking Machine Lab是近期AI领域备受瞩目的初创公司之一。

它由OpenAI前CTO Mira Murati联合多位前OpenAI成员创立。

除了Mira本人外,团队核心成员覆盖了AI领域的主要方向:

,OpenAI联合创始人,ChatGPT架构师

oph,OpenAI前研究副总裁

翁荔,OpenAI前AI安全系统负责人

ulloch,擅长预训练&推理

etz,专注后训练

-ov,OpenAI前多模态研究负责人

...