当前位置:首页 > 科技资讯 > 正文

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程

近日,人工智能领域的杰出研究员Danijar Hafner正式宣布,他将结束在谷歌长达近十年的职业生涯,这位以开发『Dreamer』系列而闻名的科学家,在强化学习和世界模型领域做出了重大贡献。

离职前,Danijar担任Google DeepMind旧金山分部的资深研究科学家(Staff Research Scientist),专注于前沿AI探索。

他的核心研究目标是『构建能够理解世界并与世界互动的通用智能体』,致力于推动机器智能的边界。

作为谷歌在世界模型领域的权威人物,Danijar曾主导或联合主导了Dreamer系列(包括Dreamer、DreamerV3、Dreamer4等)的开发,这些工作为基于模型的强化学习奠定了坚实基础。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第1张

Danijar Hafner

他在推文中写道:『今天是我在DeepMind的最后一天』,表达了对这段旅程的感慨。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第2张

回顾在Google和DeepMind将近10年的工作经历,Danijar认为『一个重要的篇章走到了终点』,这标志着他职业发展的转折点。

Danijar在谷歌的早期生涯中,多是以研究员的身份参与谷歌研究院、DeepMind、Brain Team等团队的工作,积累了丰富的实践经验。

从他的教育经历中,也能清晰看出他的职业发展轨迹,体现了学术与工业的紧密结合。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第3张

从2016年起,他就开始参与Brain团队的实习,开启了在谷歌的探索之路。

据Danijar回忆,2016年他第一次在山景城参与谷歌Brain团队的实习,与James Davidson以及Vincent Vanhoucke一起共事,专注于早期AI项目。

因为当时尚无可运行的PPO实现,团队就在TensorFlow的静态图框架下进行调试和实验,展现了技术攻坚的毅力。

2017-2018年,Danijar在伦敦大学读硕士,期间他就在伦敦的DeepMind工作,深入参与深度强化学习研究。

2018-2023年,Danijar在多伦多大学读博士,因此他就在多伦多的Brain Team工作了相当长一段时间,推动了多项创新。

他与该团队另一位资深研究科学家Mohammad Norouzi共同开发了多个版本的Dreamer,建立了长期合作关系。

初识Transformer

但「并未在意」

Danijar还记得Łukasz Kaiser第一次向他们展示一个由『大型』LSTM生成的维基百科页面时的情形,这体现了早期生成模型的潜力。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第4张

Łukasz Kaiser

Łukasz是一位机器学习研究员,他最初在Google Brain团队工作,后来加入OpenAI,在AI领域多有建树。

Google Brain团队曾于2018年发表《Generating Wikipedia by Summarizing Long Sequences》,Łukasz Kaiser是作者之一,主题就是端到端生成维基百科条目,展示了长序列建模的进展。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第5张

https://arxiv.org/abs/1801.10198?utm_source=chatgpt.com

Danijar还提到他『错过』Transformer的一段插曲,这成为了他研究历程中的趣事。

当时,Ashish Vaswani曾经兴奋地向他介绍一种新架构在计算效率上的优势,并建议他将其应用在强化学习上,但那时Danijar却并未在意(我当时没试),反映了研究中的机遇与选择。

后来这种架构被命名为Transformer,彻底改变了自然语言处理领域。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第6张

Ashish Vaswani

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第7张

https://arxiv.org/abs/1706.03762?utm_source=chatgpt.com

Ashish Vaswani是一位在AI领域颇具影响力的科学家与创业者,他的工作推动了技术进步。

他是Essential AI的联合创始人,但更为人熟知的是参与提出了那篇著名的《Attention Is All You Need》的开创性论文,该论文引领了AI新潮流。

该论文提出了一种『彻底摒弃循环和卷积结构,仅用注意力机制』的全新简单网络架构Transformer,可以实现更强的并行性和更快的训练速度,为后续模型奠定了基础。

前面提到的Łukasz Kaiser也是这篇开创性论文的主要作者之一,彰显了团队合作的力量。

深度学习研究

2017-2018年,Danijar在伦敦大学攻读硕士,这段时期他深化了学术素养。

这段时间他在伦敦的DeepMind工作,有机会参与到深度强化学习和生成式模型的研究,并与Timothy Lillicrap(DeepMind)以及Ian Fischer(Google Research)合作,拓展了研究视野。

这段经历促成了他们共同完成了PlaNet(一种基于模型的强化学习算法,能从像素观测学习潜在世界模型,并在潜空间中进行规划与动作选择),这是一项重要突破。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第8张

Timothy Lillicrap

随后,Danijar与Nicolas Heess、DeepMind的Adaptive Agents团队长期交流,系统梳理并实践Karl Friston的自由能原理(Free Energy Principle, FEP),探索智能的理论基础。

开发Dreamer

曾获辛顿指导

2018-2023年,Danijar在多伦多大学读博士,这段时期他还在加州大学伯克利分校以联合培养博士生的身份开展研究,融合了多方资源。

在多伦多大学读博期间,Danijar的主要导师是Jimmy Ba,同时还获得了辛顿(Jeffrey Hinton)的指导,这对他影响深远。

在此期间,Danijar还在多伦多的Brain Team工作了相当长一段时间,积累了丰富的工业经验。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第9张

Mohammad Norouzi

他与Google Brain多伦多分部的资深研究科学家Mohammad Norouzi共同开发了多个版本的Dreamer,通过紧密合作取得了显著成果。

他们参与各种合作项目,还一起庆祝了辛顿获得图灵奖的时刻,分享了学术喜悦。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第10张

2018年的图灵奖授予Yoshua Bengio、Geoffrey Hinton和Yann LeCun,这标志着AI领域的里程碑。

过去几年,Danijar一直在伯克利和旧金山之间,与Wilson Yan合作深入研究世界模型,推动了技术的边界。

在Count Zero和Koray Kavukcuoglu的大力支持下,他得以充分利用顶级的算力与资源,推动了一系列前沿探索,展现了团队支持的重要性。

从Dreamer到DreamerV3,再到能够在想象中自主学习、甚至在纯离线环境下完成复杂任务的Dreamer4,这一系列成果令Danijar激动,体现了持续创新的精神。

在Danijar的个人官网主页上,他的个人愿景十分醒目:『构建能够自主理解世界并与世界互动的智能机器。』这概括了他的研究追求。

世界模型大牛Danijar Hafner离开谷歌,结束十年旅程 Danijar Hafner  Dreamer系列 世界模型 谷歌DeepMind 第11张

对他而言,世界模型不仅是技术突破,更是理解智能本质的一扇窗口,这反映了他的哲学思考。

如今,Danijar即将结束他在Google/DeepMind的十年旅程,带着复杂的心情和满怀期待,迎接新的篇章,未来值得关注。

参考资料:

https://x.com/danijarh/status/1985436821405516031%20

https://danijar.com/?utm_source=chatgpt.com