当前位置:首页 > 科技资讯 > 正文

MIT博士肖光烜加盟,大模型预训练再掀科技风暴

MIT天才博士肖光烜宣布,正式加入Thinking Machines,未来主攻大模型预训练领域。

这位MIT博士一毕业,便迅速加入由OpenAI前CTO创立的初创公司!

近日,肖光烜(Guangxuan Xiao)在社交媒体上宣布,自己刚刚完成了MIT的博士学位。

接下来,他将加入Thinking Machines,致力于大模型预训练的研究工作。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第1张

在评论区,英伟达科学家、xAI研究员、UCSD等众多行业大佬纷纷向他表示祝贺。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第2张

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第3张

清华双学位学霸,MIT博士的卓越人生

查看他的个人主页,可以看到其多元且丰富的经历。

肖光烜本科毕业于清华大学,获得双学位,主修计算机科学,辅修金融学。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第4张

在校期间,他获得了多项奖学金和竞赛奖项,包括清华大学综合优秀奖学金(2019)、全国大学生数学建模竞赛(CUMCM)一等奖(2020)等。

他还曾作为访问学生,前往斯坦福大学计算机系进行科研工作。

2022年,肖光烜加入MIT攻读博士学位,导师为韩松(Song Han)教授。

他的研究方向聚焦于深度学习的高效算法与系统,特别是大规模基础模型(Foundation Model)。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第5张

在MIT EECS担任全职研究助理期间(2022年9月至2026年1月),他积累了丰富的工业研发经验。

读博期间,肖光烜还在全球顶级科技大厂进行了多次前沿研究实习。

例如,在Meta实习期间,他研究了「流式语言模型的高效注意力机制」,相关成果发表在arxiv上。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第6张

论文地址:https://arxiv.org/pdf/23...

破解LLM三大难题,博士论文显神威

比起耀眼的履历,肖光烜的博士论文本身更值得深入研析与拆解。

MIT博士肖光烜加盟,大模型预训练再掀科技风暴 肖光烜 MIT博士 大模型预训练 Thinking Machines 第7张...