2026年的AI界,最大的焦虑源自何方?
自2022年底ChatGPT横空出世,AI圈内便潜藏着一个令人不安的「幽灵」——Scaling Law。
从ChatGPT到DeepSeek,再到Gemini 3、GPT-5.2等顶级模型,无一不受到这个幽灵的影响。然而,这个幽灵是否即将或已经「撞墙」了,令所有人倍感焦虑。
Scaling Law是否已失效?
行业内大佬们的观点出现了前所未有的分歧。
Ilya Sutskever公开表示,单纯堆砌预训练算力的时代正在进入平台期,智能的增长需要转向新的「研究时代」。
Yann LeCun则直言不讳,认为当前的大语言模型无论怎么扩展都无法触及真正的AGI。
即便是Sam Altman,也在公开场合含蓄地承认,仅靠更多的GPU已无法带来同比例的智能跃迁。
当全行业都在为「数据枯竭」和「算力报酬递减」而苦恼时,大家都在问:
算力还在涨,为何智能的跃迁却变慢了?
在知乎上,我读到了一篇由新加坡国立大学校长青年教授、潞晨科技创始人尤洋(Yang You)撰写的深度长文《智能增长的瓶颈》。(文末附有原文链接)
这篇文章视角独特,尤洋从基础设施与计算范式的底层出发,探讨了一个更本质的问题:
算力是如何转化为智能的,以及这种转化机制是否正在失效。
尤洋在文中提出了一个引人深思的观点:
过去10年,AI大模型的技术本质,是把电力能源通过计算过程转化为可复用的智能。
文章系统性地梳理了过去十年大模型成功背后的「隐含假设」,并指出这些假设正在接近边界。
尤洋对「智能」的定义相当通俗易懂,即模型的预测与创作能力。
在此基础上,他进一步提出:
「过去10年,AI大模型的技术本质,是把电力能源通过计算过程转化为可复用的智能。」
这与强化学习教父Richard S. Sutton的观点类似。
尤洋在叙述中强调了三个关键共识:
微调、强化学习等阶段的贡献有限,根本原因在于能源(算力)投入规模不在一个数量级。
它最大化减少了人为干预,为AI大模型提供了近乎无限的训练数据。
Transformer并非「更像人脑」,而是更像GPU——高度并行、计算密集、通信可控。
正是这三点共同作用,使得从GPT-1、BERT、GPT-2、GPT-3,到ChatGPT与Gemini,大模型得以在十余年间持续放大算力投入,并将其稳定转化为可感知的智能提升。
在《智能增长的瓶颈》中,尤洋重新界定了「瓶颈」的涵义,并明确区分了两类经常被混淆的进展:
本文由主机测评网于2026-06-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647338.html