
近期,伊利亚·苏茨克沃(Ilya Sutskever)在访谈中谈及他新创立的“安全超级智能公司(SSI)”,虽然访谈有明显的“PR”意图,但其中对人工智能产业演进的思考却颇为深刻,值得再度强调与广泛讨论。
这位前OpenAI的首席科学家断言,当前的人工智能热潮正朝着错误的方向前进。他认为,这不是小细节上的偏差,而是根本性的方向错误。
他提出一个令人不寒而栗的观点,让那些忙于签署数十亿美元计算合同的实验室老板们脊背发凉:依赖堆算力、拼规模的时代,已经宣告结束。接下来要想取得突破,整个行业必须重拾一件被遗忘已久的东西——真正的研究。
“我们生活在一个公司数量远超主意的世界中,”苏茨克沃的言辞颇为不客气,“而且多得多。”尽管他参与打造了如AlexNet、GPT-3这样的技术,用整整十年时间支持了‘规模就是王道’的理念,但他现在却表示,这条路已经行不通了。
他的核心观点包括:
通常,我们对一个人的理论观点见仁见智、和而不同。但苏茨克沃的见解之所以应被重视,是因为谷歌在大模型领域的最新进展基本印证了他的思考:谷歌在多个技术栈上追平甚至超越OpenAI的事实证明,理论正确时,不仅算力可控,而且算力模式也是可控的(从GPU到TPU)。这进一步预示着,谷歌在大模型理论研究上取得了三年来的重要突破,未来“软硬一体”的公司竞争模型将成为所有AI公司的必经之路。
这在很大程度上为2026年的AI产业竞争定下了基调。在我们深入研究未来之前,不妨先回顾一下访谈的核心内容。
苏茨克沃的论证起点是语言。他认为,“Scaling”这个词逐渐成为整个行业的战略指南针。人们相信,只要向计算和数据砸钱,回报就板上钉钉。预训练给出了清晰的配方:按固定比例混合算力、数据和模型参数,性能就能稳定提升。
这种确定性吸引了海量投资。研究有风险,扩张只需花钱——当你有数十亿美金时,这区别至关重要。
然而,配方会过期。高质量的训练数据快见底了,互联网上的文本几乎被刮干净。合成数据虽能帮忙,但收益递减的拐点已经到来。所有大实验室都面临同样的问题:当扩张曲线走平,接下来怎么办?
他的答案可能不太中听。现有路径“能再走一段,但之后就没后劲了。它会继续改进,但不会成为真正的智能。”我们想要展现真正智能的系统需要另一种方法。“而我们还没学会怎么造它们。”
这并不是在抱怨“算力不够”。他是在质疑当前的智能架构本身。
苏茨克沃理论的核心是泛化能力。现在的模型在基准测试中风光无限,但一遇到真实场景就暴露缺陷。
他描述了一个使用代码助手的人熟悉的抓狂场景:你遇到一个程序漏洞,让模型修复,它带着诚恳的歉意却给你塞入一个新漏洞。你指出新问题,最初的漏洞又回来。它好像完全意识不到自己陷入死循环。可同样是这个系统,在编程竞赛排行榜上却能碾压人类。这说不通。
他给出了两种解释。
第一,强化学习训练出的是狭隘的专注,模型为了特定奖励信号被过度优化,失去广泛能力。第二点更麻烦:研究者们会不自觉地“为考核而训练”。团队设计的强化学习环境无意中受到评估方式的影响。当基准测试和实际效用脱节时,往往为时已晚。
他用类比点明关键:想象两个学编程的学生。一个花一万小时死磕竞赛编程,另一个花一百小时学到还不错就转学别的。谁未来发展更好?几乎总是那个通才。
现在的模型就像偏执的专才。在狭窄领域投入巨量强化学习,产出的是基准测试冠军,却在相邻任务上步履蹒跚。
“这些模型的泛化能力不知怎的就是比人差一大截,”苏茨克沃说,“这太明显了。”
对苏茨克沃“研究优先”思路的质疑是:SSI筹了30亿美元,听说OpenAI一年实验要花50到60亿(还不算推理成本)。小团队怎么拼?
他的算法挑战了行业默认假设。在他看来,前沿实验室的开支被各种需求分散:推理基础设施吞掉巨额资本,产品工程、销售团队和功能开发又吃掉一大块研究预算。
“当你看看真正留给研究的还剩多少时,差距就小得多了。”
访谈中还埋着一个更激进的观点:人类本身也不是AGI(通用人工智能)。这话听着离谱,但细想之下有深意。
AGI概念最初是为了区别于“窄AI”,承诺一个能同时干所有事的系统。预训练强化了这一想法,因为更多训练似乎均匀提升所有任务能力。但人类智能不这么工作。我们先掌握基础能力再通过经验学习具体技能。
苏茨克沃预测:具备当前模型所缺乏的泛化能力的类人学习系统将在5到20年内出现。这个时间范围体现的是“哪条路能走通”的不确定。
他预言随着AI能力越来越明显行业行为会改变:对手会在安全上合作政府会更深介入当AI开始“让人感觉到它的强大”时公司们会对安全“变得偏执得多”。
本文由主机测评网于2026-05-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545330.html