【探索之旅】在高中时期初识深度学习,本科期间投身机器人创业,实习助力Gemini 2.0开发,横跨AI与哲学的双领域……如今,他仅用不到4年时间便完成了MIT博士学业,并顺利答辩。在OpenAI,他将继续深耕「世界模型」——这一可能重塑通用人工智能路径的前沿技术。
不到4年的时间,他完成了顶级AI实验室的博士学业,并辅修了哲学。作为GPT图像生成核心研究团队的5人成员之一,以及OpenAI视频生成模型Sora小组的核心成员……
近日,OpenAI的华人研究科学家陈博远,成功完成了他在MIT的博士论文答辩!
他激动地表示:
能在工业界继续推进世界模型的发展,我深感兴奋——现在我已加入GPT图像生成和Sora视频团队。
没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
在如此重要的时刻,他自然感谢了导师和亲友,并收获了满满的祝福。
最后,他强调:视觉世界模型对于具身智能将起到至关重要的作用。
此外,他承诺将继续与社区分享知识。
陈博远(Boyuan Chen),现任OpenAI研究科学家,是训练GPT图像生成技术的五位研究人员之一,同时也是Sora视频生成团队的成员。
他拥有麻省理工学院(MIT)电子工程与计算机科学(EECS)博士学位,并辅修哲学。
他的研究专注于世界模型、具身人工智能和强化学习。
他认为,结合这些领域,AI将能更好地理解并与物理世界互动。
2023年5月至8月,在谷歌DeepMind实习期间,他跟随Fei Xia博士学习。
在DeepMind,他主要参与了基于大规模合成数据的多模态大语言模型(MLLM)训练项目;构建了完整的数据合成pipeline,其指令微调技术后续被Gemini 2.0采用。
在博士答辩中,陈博远特别感谢了DeepMind的导师Fei Xia。
早在高中时期,陈博远就参加了一个夏令营。
这是两人第一次见面,Fei Xia就向陈博远介绍了深度学习——当时他甚至还不懂Python和NumPy。
这成为了他踏入AI领域的起点,Fei Xia就像他的「吴恩达」。
Fei Xia两次邀请他到谷歌DeepMind完成高含金量实习。
读博第一年,陈博远因没有论文产出而陷入低谷。这是他读博最艰难的阶段,而Fei Xia协助他发表了首个爆款研究NLMap。
项目地址:https://nlmap-saycan.github.io/
此后,两人还合作了SpatialVLM。
论文链接:https://arxiv.org/abs/2401.12168
他发表的多篇论文在学术界和工业界均获得认可,包括《Diffusion Forcing》、《SpatialVLM》和《History Guidance》等。
在去年的博客中,他对具身智能做出了乐观的判断:
我可以负责任地告诉大家具身智能一定是下一个一百年最令人激动的技术,并且我们在有生之年很有希望见证通用机器人的诞生。
同时,他也更愿意看到社会细水长流地投入通用机器人的发展——
看到科研工作者,如我导师Russ所说的那样,「可以以结果为导向的科研,但不可以网红视频为导向」;
看到政府和投资人在长线看好具身智能的同时,不因为硬件公司的融资需要而盲目相信机器人大模型;
看到创业者勇往直前,用细分领域的成功为真正的通用机器人铺路。
在随笔最后,他表示,「自己也愿意用自己的一生给世界带来真正的通用机器人」
而OpenAI被曝出:在通往通用人工智能(AGI)的竞赛中,加大了机器人技术的工作力度,正在组建一个能够开发控制机器人算法的团队,并且似乎正在聘请专门从事人形机器人研究的机器人专家。
在2021年至2025年期间,他在MIT计算机科学与人工智能实验室(MIT CSAIL)攻读博士学位,师从Russ Tedrake教授和Vincent Sitzmann教授。
在加州大学伯克利分校本科阶段(2017年至2021年),他师从机器人领域专家Pieter Abbeel教授,获计算机科学荣誉专业(EECS荣誉班)、应用数学双学位。
他本科毕业于加州大学伯克利分校,主修计算机科学和数学,并在伯克利学过一年哲学。
在读本科期间(2017年11月至2020年3月),他还创办了一家面向中小学的机器人教育公司,主导竞赛用机器人套件的软硬件开发,产品直接面向参赛学生群体。
本文由主机测评网于2026-04-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441445.html