当前位置：首页 > 科技资讯 > 正文

AI未来：从规模扩张转向真正研究

主机测评网
科技资讯
2026-05-18
395

AI未来：从规模扩张转向真正研究人工智能研究规模扩张泛化能力第1张

近期，伊利亚·苏茨克沃（Ilya Sutskever）在访谈中谈及他新创立的“安全超级智能公司（SSI）”，虽然访谈有明显的“PR”意图，但其中对人工智能产业演进的思考却颇为深刻，值得再度强调与广泛讨论。

这位前OpenAI的首席科学家断言，当前的人工智能热潮正朝着错误的方向前进。他认为，这不是小细节上的偏差，而是根本性的方向错误。

他提出一个令人不寒而栗的观点，让那些忙于签署数十亿美元计算合同的实验室老板们脊背发凉：依赖堆算力、拼规模的时代，已经宣告结束。接下来要想取得突破，整个行业必须重拾一件被遗忘已久的东西——真正的研究。

“我们生活在一个公司数量远超主意的世界中，”苏茨克沃的言辞颇为不客气，“而且多得多。”尽管他参与打造了如AlexNet、GPT-3这样的技术，用整整十年时间支持了‘规模就是王道’的理念，但他现在却表示，这条路已经行不通了。

他的核心观点包括：

靠堆算力、拼规模的Scaling时代（2020-2025），已经结束
算力悖论：理论正确时，算力可控；理论错误时，再强算力也无济于事
现有方法无法产生真正智能，根本问题在于模型泛化能力远逊于人类，显示基础架构存在缺陷
突破大模型时代的第一个平台期，整个产业竞争将回归“真正的研究”

通常，我们对一个人的理论观点见仁见智、和而不同。但苏茨克沃的见解之所以应被重视，是因为谷歌在大模型领域的最新进展基本印证了他的思考：谷歌在多个技术栈上追平甚至超越OpenAI的事实证明，理论正确时，不仅算力可控，而且算力模式也是可控的（从GPU到TPU）。这进一步预示着，谷歌在大模型理论研究上取得了三年来的重要突破，未来“软硬一体”的公司竞争模型将成为所有AI公司的必经之路。

这在很大程度上为2026年的AI产业竞争定下了基调。在我们深入研究未来之前，不妨先回顾一下访谈的核心内容。

Scaling的尽头

苏茨克沃的论证起点是语言。他认为，“Scaling”这个词逐渐成为整个行业的战略指南针。人们相信，只要向计算和数据砸钱，回报就板上钉钉。预训练给出了清晰的配方：按固定比例混合算力、数据和模型参数，性能就能稳定提升。

这种确定性吸引了海量投资。研究有风险，扩张只需花钱——当你有数十亿美金时，这区别至关重要。

然而，配方会过期。高质量的训练数据快见底了，互联网上的文本几乎被刮干净。合成数据虽能帮忙，但收益递减的拐点已经到来。所有大实验室都面临同样的问题：当扩张曲线走平，接下来怎么办？

他的答案可能不太中听。现有路径“能再走一段，但之后就没后劲了。它会继续改进，但不会成为真正的智能。”我们想要展现真正智能的系统需要另一种方法。“而我们还没学会怎么造它们。”

这并不是在抱怨“算力不够”。他是在质疑当前的智能架构本身。

泛化能力：那个老难题

苏茨克沃理论的核心是泛化能力。现在的模型在基准测试中风光无限，但一遇到真实场景就暴露缺陷。

他描述了一个使用代码助手的人熟悉的抓狂场景：你遇到一个程序漏洞，让模型修复，它带着诚恳的歉意却给你塞入一个新漏洞。你指出新问题，最初的漏洞又回来。它好像完全意识不到自己陷入死循环。可同样是这个系统，在编程竞赛排行榜上却能碾压人类。这说不通。

他给出了两种解释。

第一，强化学习训练出的是狭隘的专注，模型为了特定奖励信号被过度优化，失去广泛能力。第二点更麻烦：研究者们会不自觉地“为考核而训练”。团队设计的强化学习环境无意中受到评估方式的影响。当基准测试和实际效用脱节时，往往为时已晚。

他用类比点明关键：想象两个学编程的学生。一个花一万小时死磕竞赛编程，另一个花一百小时学到还不错就转学别的。谁未来发展更好？几乎总是那个通才。

现在的模型就像偏执的专才。在狭窄领域投入巨量强化学习，产出的是基准测试冠军，却在相邻任务上步履蹒跚。

“这些模型的泛化能力不知怎的就是比人差一大截，”苏茨克沃说，“这太明显了。”

SSI的另类算法

对苏茨克沃“研究优先”思路的质疑是：SSI筹了30亿美元，听说OpenAI一年实验要花50到60亿（还不算推理成本）。小团队怎么拼？

他的算法挑战了行业默认假设。在他看来，前沿实验室的开支被各种需求分散：推理基础设施吞掉巨额资本，产品工程、销售团队和功能开发又吃掉一大块研究预算。

“当你看看真正留给研究的还剩多少时，差距就小得多了。”

AGI：一个被高估的概念？

访谈中还埋着一个更激进的观点：人类本身也不是AGI（通用人工智能）。这话听着离谱，但细想之下有深意。

AGI概念最初是为了区别于“窄AI”，承诺一个能同时干所有事的系统。预训练强化了这一想法，因为更多训练似乎均匀提升所有任务能力。但人类智能不这么工作。我们先掌握基础能力再通过经验学习具体技能。

未来的模样

苏茨克沃预测：具备当前模型所缺乏的泛化能力的类人学习系统将在5到20年内出现。这个时间范围体现的是“哪条路能走通”的不确定。

他预言随着AI能力越来越明显行业行为会改变：对手会在安全上合作政府会更深介入当AI开始“让人感觉到它的强大”时公司们会对安全“变得偏执得多”。

云服务器阿里云服务器

本文由主机测评网于2026-05-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260545330.html

AI未来：从规模扩张转向真正研究

Scaling的尽头

泛化能力：那个老难题

SSI的另类算法

AGI：一个被高估的概念？

未来的模样

2025手机市场激战：小米三星再掀科技风暴

HDR：从专业到大众的影像技术进化

AI未来：从规模扩张转向真正研究

Scaling的尽头

泛化能力：那个老难题

SSI的另类算法

AGI：一个被高估的概念？

未来的模样

2025手机市场激战：小米三星再掀科技风暴

HDR：从专业到大众的影像技术进化

相关文章