当前位置:首页 > 科技资讯 > 正文

姚顺雨:开启AI下半场的科技新星

引领大模型“下半场”的姚顺雨,正开启他个人AI生涯的新篇章。

近期,这位备受瞩目的OpenAI华人研究员的动态引起了广泛关注。

有人传言他出现在小扎的必挖名单,也有人爆料他将加盟中国科技巨头,且“转会费”惊人。还有一种说法是,姚顺雨选择自主创业……

姚顺雨究竟何去何从?尚不得而知。

但他离开OpenAI的消息已从不同渠道得到证实,只待官方宣布。

他似乎正步入个人AI生涯的下半程。

这位年仅29岁的青年,毕业于合肥一中、NOI奥赛获银牌、高考704分位列安徽探花,后入读清华姚班,最终在普林斯顿获得计算机博士(语言和强化学习方向),毕业后加入OpenAI……

更早之前,姚顺雨便拥有突出的科研成果,例如:

思维树(Tree of Thoughts):使LLM反复思考,大幅提升推理能力

SWE-bench:大模型能力评估数据集

SWE-agent:一个开源AI程序员

ReAct...

他还撰写了一篇关于“AI下半场”的博文,在AI圈内广为流传。

那么,姚顺雨究竟是怎样一位青年呢?

姚顺雨的成长之路

在2024年刚加入OpenAI不久,姚顺雨在一次采访中推荐了一本书——《哥德尔、艾舍尔、巴赫:集异璧之大成》。

姚顺雨:开启AI下半场的科技新星 姚顺雨 OpenAI 跨界思维 AI下半场 第1张

这部由人工智能先驱侯世达撰写的经典著作,将哥德尔的不完备定理、艾舍尔的错觉绘画和巴赫的复调卡农巧妙融合,展现了这些看似无关的元素如何在计算机的通用递归系统中彼此呼应,并留下了一句意味深长的话:觅之,便有所获

正如这本书所启发的那样,跨学科的眼光与对复杂信息的开放态度,似乎贯穿了姚顺雨的整个求学生涯,并逐渐形成一种独特的个人风格。

和所有学霸一样,姚顺雨初中就读于合肥最好的学校之一——合肥45中(2009—2012),初中毕业后升入合肥市第一中学

2014年,他在全国信息学奥林匹克竞赛(NOI)中以495分斩获银牌;次年高考以理科704分的成绩位列安徽省第三,进入清华交叉信息研究院姚班,主修计算机科学。

然而,这看似“标准学霸”的开局背后,其实孕育着一颗不同凡响、甚至略带反叛的气质。

姚顺雨:开启AI下半场的科技新星 姚顺雨 OpenAI 跨界思维 AI下半场 第2张

△来自清小华

姚顺雨在采访中透露,相较于其他清华姚班的同学专注于一点、不断深挖的品质,他更喜欢涉猎各种数学、历史乃至五花八门的知识。

他对嘻哈音乐的热爱也早已不是新闻。

艾米纳姆、蛋堡、热狗、Jcole等说唱歌手陪伴了他的初高中时光,而在清华时,他还是清华大学学生说唱社联合创始人。

值得一提的是,在清华大学2019年各类型自主选拔复试的开营仪式上,姚顺雨给未来的学弟学妹们甩出了一句堪称“freestyle”的理由,解释自己为何选择清华:

“但是对于我来说,选择清华、北大不是问题,因为北大没有以我的姓氏命名的班级。”

姚顺雨:开启AI下半场的科技新星 姚顺雨 OpenAI 跨界思维 AI下半场 第3张

除了担任说唱社联合创始人外,姚顺雨还担任清华的招生志愿者和姚班联席会主席。在谈及姚班对他的影响时,他提到:

“姚班很注重理论基础课程的学习,像操作系统或电路设计相关的课,看上去和科研好像没有任何关系。但现在看来还是有些帮助的。它能使你对计算机科学的全貌有基本了解。”

姚顺雨:开启AI下半场的科技新星 姚顺雨 OpenAI 跨界思维 AI下半场 第4张

△(姚班合影,清华招生公众号)

这种兼容各类信息、涉猎不同学科并从中寻找乐趣的跨界气质在姚顺雨身上尤为明显。用伯林的话来说,他更像是一只“狐狸”,而不是一只“刺猬”,这也体现在他后续的研究中。

(注:柏林的“刺猬”比喻那些专注于单一核心理念的人,他们将所有经验都套用到这个中心观点上;而“狐狸”则指那些涉猎广泛、善于灵活应对不同问题的人,更依赖多样化的策略和视角)

令人惊讶的是,在大三下学期之前,姚顺雨既未接触过AI,甚至没做过科研。

一次交换机会让他去了MIT,之后他开始跟随吴佳俊做计算机视觉及认知科学的研究。

姚顺雨表示,在跟随吴佳俊和学长Jun-Yan Zhu学习时,他不仅掌握了实验、汇报等研究入门的基本功,还深受其思想影响。他由此认识到心理学与人工智能的交叉点,学会了从更高维度和整体框架去思考问题。

结束姚班四年的学习后,2019年他前往普林斯顿攻读博士。跨界气质再次显现。

本科阶段他主要研究计算机视觉,而博士阶段他本被计算机视觉方向录取。但因兴趣转向自然语言处理(NLP)领域。最终他因机缘巧合加入了Karthik Narasimhan的团队,开始从事自然语言处理与强化学习研究。

(这等于从视觉转向语言,“觅之,便有所获”。事后回顾时,姚顺雨认为这种跨界也是他的幸运之处。因为彼时正是GPT-2兴起之际。博士第一年他就开始思考如何让language model变成Agent)