当前位置:首页 > 科技资讯 > 正文

姚顺雨:从OpenAI到AI下半场的跨界奇才

引领大模型步入“下半场”的姚顺雨,同样开启了个人在人工智能领域的新征程。

近期,这位明星OpenAI华人研究员的动向引发了广泛关注。

此前有传言称他出现在扎克伯格的必挖名单中,亦有人爆料其或将加盟某中国科技巨头,甚至传出惊人的“转会费”传闻。此外,还有说法指出姚顺雨可能选择自主创业……

姚顺雨最终去向何方?目前尚无定论。

但姚顺雨已从OpenAI离职,这一消息已获多方渠道证实,仅待本人正式宣布。

他似乎正借此契机,开启个人AI生涯的下半场。

这位年仅29岁的青年,毕业于合肥一中、荣获NOI奥赛银牌、高考704分以安徽省探花身份进入清华姚班,随后在普林斯顿取得计算机博士学位(研究方向为语言与强化学习),毕业后便加入了OpenAI……

更早之前,姚顺雨已拥有多项突出且知名的科研成果,例如:

思维树(Tree of Thoughts):通过让大语言模型反复思考,显著提升其推理能力。

SWE-bench:一个用于评估大模型性能的数据集。

SWE-agent:一个开源的AI程序员工具。

ReAct…

他甚至展现出超越年龄的哲学思考,一篇题为“AI下半场”的博文在AI圈内外广为流传。

那么,姚顺雨究竟是一位怎样的年轻人?

姚顺雨的成长轨迹

2024年刚加入OpenAI不久,姚顺雨在一次访谈中推荐了一本书——《哥德尔、艾舍尔、巴赫:集异璧之大成》。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第1张

这部由人工智能先驱侯世达撰写的经典之作,巧妙融合了哥德尔的不完备定理、艾舍尔的错觉绘画和巴赫的复调卡农,揭示了这些看似无关的元素如何在计算机的通用递归系统中相互呼应,并留下一句深意之言:觅之,便有所获

正如这本书所启迪的那样,跨学科的视野与对复杂信息的开放态度,仿佛贯穿了姚顺雨的整个求学旅程,并逐渐塑造出其独特的个人风格。

与众多学霸类似,姚顺雨初中就读于合肥顶尖学府之一——合肥45中(2009—2012),之后升入合肥市第一中学

2014年,他在全国信息学奥林匹克竞赛(NOI)中以495分荣获银牌;次年高考以理科704分的成绩位列安徽省第三名,进入清华交叉信息研究院姚班,主修计算机科学。

然而,在这看似“标准学霸”的起点背后,却蕴藏着一颗与众不同、甚至略带反叛气质的心灵。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第2张

△来自清小华

姚顺雨在采访中透露,相较于其他清华姚班同学专注一点、深入挖掘的特质,他更热衷于涉猎数学、历史乃至各种庞杂领域。

他对嘻哈音乐的热爱,早已不是秘密。

艾米纳姆、蛋堡、热狗、Jcole等说唱歌手陪伴了他的初高中时光,而在清华大学,他还是学生说唱社的联合创始人。

值得一提的是,在清华大学2019年自主选拔复试的开营仪式上,姚顺雨曾向未来的学弟学妹们抛出一句颇具“freestyle”风格的理由,解释自己为何选择清华:

但是对于我来说,选择清华、北大并不是问题,因为北大没有以我姓氏命名的班级。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第3张

除了担任说唱社联合创始人,姚顺雨还曾是清华的招生志愿者和姚班联席会主席。谈及姚班对他的影响,他提到:

姚班非常注重理论基础课程的学习,像操作系统或电路设计这类课程,表面上似乎与科研无关,但如今看来却颇有助益。它们能让你对计算机科学的整体图景有基本把握

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第4张

△(姚班合影,清华招生公众号)

这种兼容并蓄、跨学科探索并从中寻获乐趣的特质,在姚顺雨身上尤为凸显。用以赛亚·伯林的比喻来说,他更像一只“狐狸”,而非“刺猬”,这一特点也延续至他的后续研究中。

(注:柏林的“刺猬”指专注单一核心理念者,将一切经验归于此中心;而“狐狸”则指涉猎广泛、灵活应对问题者,更依赖多样化策略与视角)

令人稍感意外的是,直到大三下学期,姚顺雨既未接触过AI,也未曾涉足科研。

一次赴MIT交换的机会改变了他,此后他开始跟随吴佳俊从事计算机视觉与认知科学的相关研究。

姚顺雨表示,在向吴佳俊和学长Jun-Yan Zhu学习的过程中,他不仅掌握了实验、汇报等科研基本功,更在思想上深受启发,由此认识到心理学与人工智能的交叉融合,学会了从更高维度与整体框架思考问题。

结束姚班四年学业后,2019年,他正式前往普林斯顿攻读博士学位,跨界特质再次显现。

本科阶段他主攻计算机视觉,而博士阶段,本被计算机视觉方向录取的他,却因兴趣转变,主动联系了自然语言处理(NLP)领域的导师。最终,他机缘巧合加入Karthik Narasimhan的团队,开启自然语言处理与强化学习的研究。

这相当于从视觉转向语言,但“觅之,便有所获”。姚顺雨后来回顾,这种跨界正是他的幸运之处,因为当时恰逢GPT-2兴起。因此,在博士第一年,他便开始思索如何让语言模型演化为智能体(Agent)。

对(通用)智能体的关注贯穿了他的研究历程。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第5张

姚顺雨博士生涯的首项工作名为CALM(2020),探索如何利用语言模型作为智能体进行语言游戏。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第6张

在CALM中,语言充当了媒介:它将人类经验与语义模式转化为可操作的动作候选,同时承载上下文信息,使智能体能在庞杂的动作空间中高效决策。

姚顺雨坦言,尽管这项工作不如SWE-bench、ReAct或思维树那般广为人知,但对他而言意义非凡。

在张小珺的对话中,我们发现姚顺雨对语言的关注早在五年前的这篇论文中已初现端倪。

语言是人类为实现泛化而发明的工具,这一点比其他因素更为本质。

换言之,利用语言进行游戏是无限的,智能体可凭借语言进行推理与组合,在不同语境中寻找合适动作,从而实现泛化。

换句话说,智能体也需具备“跨界”能力,而语言正是绝佳媒介。

然而,姚顺雨也意识到,若缺乏有意义的任务或环境,即使“游戏”得分再高,也徒劳无益。

基于此思,他的第二项工作WebShop构建了一个大规模模拟电商环境,使智能体通过理解复杂文本指令,在网页中导航与操作,从而推动语言理解与决策能力在真实任务中的应用与验证。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第7张

同样,后来的经典工作SWE-BenchSWE-agent也是针对现实编程这类有意义任务,展开对智能体能力的验证。

而当时间来到2022年,GPT-3.5的出现彻底改变了一切。

众所周知,让一张白纸反复试错效率极低,而在传统强化学习中,这种低效尝试却司空见惯:智能体通常要么受限单一任务(如围棋),要么在庞大动作空间中盲目探索。

GPT-3.5让人们意识到,此前缺失的是先验知识:通过强大的语言预训练,将常识与语言知识融入模型,再经微调,它方能成为具备跨界特质、拥有泛化能力的智能体。

正如姚顺雨所言:若预训练已涵盖万事万物,那么强化学习仅是激发这些能力的技能。

受GPT-3.5启发,姚顺雨随后提出ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),让大语言模型在与外部环境交互时,同步进行“推理”与“行动”。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第8张

姚顺雨后来评价,这是他最钟爱的工作(也是目前被引次数最高的工作)。基于此,他的研究逐渐聚焦两大核心:一是如何设计有价值、更贴近现实世界的任务与环境;二是如何开发简洁而通用的方法。

不过,为实现通用与泛化,必须掌握推理能力。语言模型恰好提供了足够强的先验,此先验支持推理,而推理又能在不同环境间泛化。

于是,在GPT、思维链等工作基础上,思维树(Tree of Thoughts, ToT)让语言模型通过多路径探索与自我评估,实现比传统从左到右推理更高效的复杂问题解决能力。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第9张

回顾姚顺雨的求学与研究历程,不难发现,无论是对通用智能体的追求,还是对语言作为认知与决策媒介的热忱,都是对跨界思维与泛化能力的持续探寻。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第10张

28岁的九局下半

相较于热狗的23岁,28岁博士毕业进入OpenAI的姚顺雨,才真正迎来属于自己的“九局下半”。

2024年8月1日,姚顺雨宣布加入OpenAI,一时间可谓万众瞩目。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第11张

注:谈及姚顺雨与OpenAI的渊源,一个不太冷的冷知识是:其导师Karthik Narasimhan乃GPT‑1的第二作者。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第12张

在OpenAI的一年多时间里,姚顺雨最出圈之举莫过于今年4月发表的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。

(是的,AI也迎来了自身的九局下半)

姚顺雨指出:AI发展分为上下两阶段。上半场以模型与方法为核心,侧重构建模型与训练方法;随着AI技术成熟,下半场重点转向如何定义有现实意义的任务、如何有效评估AI系统表现。

新的评估应贴近现实世界任务、优化模型配方以解决问题,从而形成新的正向循环。

由此,我们不难看出姚顺雨姿态的转变:从专注求解的科研工作者,逐渐成长为善于洞察需求的“产品经理”。

据近期曝光的与张小珺访谈中,姚顺雨亦谈到创业的底层逻辑:

毕业前我常思考,如何创造一位爱因斯坦?那时我较为学院派——身处普林斯顿,偶像是冯诺依曼、爱因斯坦——自然,能想到最有趣的任务是:我能否发现下一个相对论?这无疑标志着AGI或ASI(超人工智能)的实现。后来,我来到硅谷,进入加州公司后,发现人类组织亦有趣味。若能创立一家新公司,打造一个万亿美元级、基于智能体的企业,将极具意义。

谈及是否会创业时,姚顺雨更坦率表示:OpenAI多数人都会考虑创业。他需挑战更有意义之事,创业自是自然选择。当然,仍应寻得合适方向。他偏好深思熟虑后再行动。

当然,离开OpenAI未必意味创业,如其导师Karthik Narasimhan,在OpenAI一年后选择离开,重返普林斯顿延续象牙塔科研。

如今,姚顺雨加入OpenAI已满一年。

曾有爆料称“姚顺雨以上亿薪资入职腾讯”,但已遭腾讯官方辟谣否认。

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第13张

另有一家全新创业公司近期注册,法人代表正是“姚顺雨”——

姚顺雨:从OpenAI到AI下半场的跨界奇才 姚顺雨 OpenAI离职 AI下半场 思维树 第14张

但目前仍难确定此“姚顺雨”是否即我们所谈论的姚顺雨,毕竟“尧舜禹”这类佳名,在AI领域不止一人……

总之,祝福姚顺雨开启精彩的下半场。

参考链接:

[1]https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com

[2]https://ysymyth.github.io/?utm_source=chatgpt.com

[3]https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com