当前位置:首页 > 科技资讯 > 正文

Meta AI之路:从Llama的辉煌到滑铁卢

2025年10月底,Meta AI部门宣布裁员600个职位,甚至核心部门的研究总监,同时掌管AI业务的高管纷纷离职、被边缘化,就连图灵奖得主Yann LeCun也被认为自身难保。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第1张

一方面扎克伯格在用上亿美元的年薪挖AI人才,但同时又如此决绝的裁员,这样割裂的行为背后是因为什么?

于是我们采访了Meta的前FAIR研究总监AI科学家田渊栋、参与了Llama 3后训练的前Meta员工Gavin Wang、硅谷资深HR专家以及一些匿名人士,试图还原一下Meta的Llama开源路线到底发生了什么:

为什么Llama 3还让众人惊艳,而仅一年之后的Llama 4就如此拉胯?中间发生了什么?Meta的开源路线从一开始就注定是个错误吗?AI大模型激烈对战的当下,一个乌托邦式的AI研究实验室还能够存在吗?

01 FAIR与GenAI的诞生:Meta的AI十年布局与架构搭建

首先来看看Meta对AI布局的整个公司架构。

2013年年底,扎克伯格开始搭建Meta的AI团队。当时,谷歌收购了Geoffrey Hinton的DNN团队,将Hinton招入麾下,同一时间,Meta将Yann Lecun请来坐镇AI的发展。至此,图灵奖三巨头的两位开始步入商业科技来主导AI研发。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第2张

在扎克伯格邀请Yann LeCun加入Meta的时候,后者提过三个条件:

1.不从纽约搬走;

2.不会辞去在纽约大学的工作;

3.必须开展开放的研究,公开发布所做的所有工作,并将代码开源。

所以,一开始Meta的路线就是开源的。Yann LeCun进入Meta之后,开始着手前沿的AI研发,组建了Fundamental AI Research实验室,也就是大名鼎鼎的FAIR实验室,主导人工智能的前沿研究。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第3张

田渊栋

前Meta基础AI研究(FAIR)团队研究总监:

FAIR是负责前沿研究的,就是做一些现在目前看起来没有特别大的应用,但是新的想法、新的思路、新的算法、新的框架、新的模型架构。这样的探索之后可能会有一些大的突破,大概是这样的一个逻辑。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第4张

但是对于Meta来说,最终还是要看到AI在自身产品上的进展。于是和FAIR组平行设置了一个组叫“Generative AI”,简称“GenAI”组。

这个组里面分别有不同的功能团队,包括了Llama开源模型的研发,将AI能力运用到产品上的Meta AI团队,还有AI算力基建的数据中心团队,其它的还有一些小部门,比如说Search(搜索),Enterprise(企业服务),Video-gen(文生视频)模型等等。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第5张

GenAI和FAIR是平行关系,这像是一个天平,一边是前沿科研,一边是产品化。理想情况下,前沿研究能带来更好的产品力,而产品赚钱了能让管理层有更大的动力拨款给FAIR去做研发。

田渊栋

前Meta基础AI研究(FAIR)团队研究总监:

比如FAIR会提供一些很好的想法和工作给GenAI去用,让GenAI把这些想法和工作放进生产,然后在下一代模型中使用出来。

很多人的初心就是说想做一些不一样的东西,或者是与众不同的方向、工作。能不能真正地实现AGI(通用人工智能)?这其实是个比较大的问题。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第6张

陈茜

硅谷101联合创始人:

所以FAIR的目的是AGI,但是GenAI它的目的是怎么把AI放在Meta现有的产品中,让AI发生效应。

田渊栋

前Meta基础AI研究(FAIR)团队研究总监:

对,应该说主要一方面是Llama,Llama是一个很大的模型。还有就是怎么样把AI比较好地用在一些具体的应用上。

但是,让这样的天平始终保持平衡,是一个很理想化的乌托邦状态。而这个乌托邦状态的前提是,Meta的AI模型水平一直是要保持最领先的,或者说,至少是在开源赛道最领先,且不落后闭源模型太多的。

Meta AI之路:从Llama的辉煌到滑铁卢 AI Llama模型 开源路线 AI大模型 第7张

陈茜

硅谷101联合创始人:

你觉得在FAIR最快乐的一段时光是什么时候?

田渊栋
前Meta基础AI研究(FAIR)团队研究总监:
“我觉得从我入职FAIR之后一直到2022年,这段时间是很开心的。因为大语言模型来了之后,整个生态或者说研究者之间的关系发生了一些变化。因为大语言模型来了之后,算力成了很重要的一个因素。因为算力是有限的,所以就会产生各种问题、各种矛盾。大家都要训练一个很大的模型,如果是这样的话,相互之间就开始有一些问题。”
“因为卡不多就没办法训练出很好的模型,”
“所以在2023年之后这段时间之内,状态肯定不会像以前那么好。”

从Llama 3到Llama 4:Model vs. Product的抉择

“开源之光”:Llama的昔日骄傲与滑铁卢?