当前位置:首页 > 科技资讯 > 正文

AI智能增长瓶颈:算力与智能跃迁的焦虑

2026年的AI界,最大的焦虑源自何方?

自2022年底ChatGPT横空出世,AI圈内便潜藏着一个令人不安的「幽灵」——Scaling Law。

从ChatGPT到DeepSeek,再到Gemini 3、GPT-5.2等顶级模型,无一不受到这个幽灵的影响。然而,这个幽灵是否即将或已经「撞墙」了,令所有人倍感焦虑。

Scaling Law是否已失效?

行业内大佬们的观点出现了前所未有的分歧。

Ilya Sutskever公开表示,单纯堆砌预训练算力的时代正在进入平台期,智能的增长需要转向新的「研究时代」。

AI智能增长瓶颈:算力与智能跃迁的焦虑 Scaling Law 智能增长 算力瓶颈 AI模型 第1张

Yann LeCun则直言不讳,认为当前的大语言模型无论怎么扩展都无法触及真正的AGI。

AI智能增长瓶颈:算力与智能跃迁的焦虑 Scaling Law 智能增长 算力瓶颈 AI模型 第2张

即便是Sam Altman,也在公开场合含蓄地承认,仅靠更多的GPU已无法带来同比例的智能跃迁。

AI智能增长瓶颈:算力与智能跃迁的焦虑 Scaling Law 智能增长 算力瓶颈 AI模型 第3张

当全行业都在为「数据枯竭」和「算力报酬递减」而苦恼时,大家都在问:

算力还在涨,为何智能的跃迁却变慢了?

在知乎上,我读到了一篇由新加坡国立大学校长青年教授、潞晨科技创始人尤洋(Yang You)撰写的深度长文《智能增长的瓶颈》。(文末附有原文链接)

这篇文章视角独特,尤洋从基础设施与计算范式的底层出发,探讨了一个更本质的问题:

算力是如何转化为智能的,以及这种转化机制是否正在失效。

尤洋在文中提出了一个引人深思的观点:

过去10年,AI大模型的技术本质,是把电力能源通过计算过程转化为可复用的智能。

AI智能增长瓶颈:算力与智能跃迁的焦虑 Scaling Law 智能增长 算力瓶颈 AI模型 第4张

文章系统性地梳理了过去十年大模型成功背后的「隐含假设」,并指出这些假设正在接近边界。

一、智能的起源

尤洋对「智能」的定义相当通俗易懂,即模型的预测与创作能力

在此基础上,他进一步提出:

「过去10年,AI大模型的技术本质,是把电力能源通过计算过程转化为可复用的智能。」

这与强化学习教父Richard S. Sutton的观点类似。

AI智能增长瓶颈:算力与智能跃迁的焦虑 Scaling Law 智能增长 算力瓶颈 AI模型 第5张

尤洋在叙述中强调了三个关键共识:

  1. 预训练是智能的主要来源

微调、强化学习等阶段的贡献有限,根本原因在于能源(算力)投入规模不在一个数量级。

  1. Next-Token Prediction是一个极其成功的Loss设计

它最大化减少了人为干预,为AI大模型提供了近乎无限的训练数据。

  1. Transformer的胜出,是因为其高度并行计算特性。

Transformer并非「更像人脑」,而是更像GPU——高度并行、计算密集、通信可控。

正是这三点共同作用,使得从GPT-1、BERT、GPT-2、GPT-3,到ChatGPT与Gemini,大模型得以在十余年间持续放大算力投入,并将其稳定转化为可感知的智能提升。

二、真正的「瓶颈」何在?

在《智能增长的瓶颈》中,尤洋重新界定了「瓶颈」的涵义,并明确区分了两类经常被混淆的进展:

  • 效率提升