当前位置:首页 > 科技资讯 > 正文

AI巨头转向:从语言模型到世界模型

2025年11月19日,图灵奖得主Yann LeCun宣布将离开Meta,转而创办一家专注于Advanced Machine Intelligence(AMI)的新公司。

这并非普通的高管离职,而是一次技术路线的重大转变。

AI巨头转向:从语言模型到世界模型 Yann LeCun LLM 世界模型 JEPA 第1张

(CNBC:Yann LeCun即将离职,创立自己的初创公司)

这位图灵奖得主没有加入LLM(大语言模型)的竞赛,而是投身于一个被忽视多年的领域:世界模型。

LeCun直言不讳地称LLM是通往人类智能的“死胡同”。

在11月23日的一场题为《Do LLMs Understand?》的公开对话中,他明确指出:LLM擅长语言表达,但缺乏对真实世界的理解。

几乎同时,OpenAI前首席科学家Ilya Sutskever也在11月25日的播客中提出:“Just Add GPUs”的时代已结束。

在短短一周内,两位深度学习先驱不约而同地对主流路线提出质疑。

这不是偶然,而是技术路线集体转向的信号:后LLM时代正在成形。

第一节 | 为什么他说大模型是死胡同?

在讨论世界模型之前,我们首先要了解为什么Yann LeCun会将LLM称为“死胡同”。

他给出的答案比外界所认为的更系统。

① 模型越来越大,但理解没有跟上

LeCun表示:LLM在语言层面表现不错,但它们并不理解世界。没有常识,也没有因果关系,只是大量统计相关性的堆叠。

换句话说:规模能让模型更像会说话的人,但不能让它更像懂世界的人。

② LLM的能力天花板,已经在实验室里显露

他在公开对话中强调:性能正在饱和。更大的模型不一定带来更高的真实智能。

③ 语言只是副产品,物理世界才是智能核心

他的核心观点是:语言是人类智能的副产品,不是核心机制。

第二节 | 世界模型:下一代AI要如何看世界?

如果语言模型无法理解世界,那么如何建造真正的智能?

LeCun的答案是:让AI学会看世界。

① 什么是世界模型?

LeCun解释说:我们用预测下一个词来训练语言模型,是因为语言中词汇有限。但真实世界无限丰富,预测像素级别的未来根本不成立。

第三节 | 不只LeCun:另一个方向也在探索

在质疑LLM这条路的,不只LeCun一个人。Sutskever也认为,缩放时代已经结束,下一代智能需要新的架构基础。

第四节 | 一场转向,正在发生

① 工业界的悄然转向

虽然LLM仍在快速发展,但一些关键变化已经在发生。