Meta首席执行官马克·扎克伯格近期批准了一项涉及约600名员工的AI部门裁员计划,这是Meta在人工智能领域今年规模最大的一次调整,主要波及公司核心研发机构。
时任Meta FAIR团队负责人的田渊栋在社交媒体上证实:“我和我的部分团队成员也受到此次裁员影响”。作为“超智能实验室”(MSL)科研体系中的核心支柱之一,田渊栋的离开也引发了业界的广泛关注。
在此消息公布后,田渊栋首次公开露面,接受了腾讯科技特约作者的独家深度访谈。
面对行业中的质疑,田渊栋在此做出澄清和“正名”:他的团队在Meta大模型开发中也做出了大量贡献和重要工作。然而,他们面临的最大挑战并非技术本身,而是如何说服产品团队。
随后,访谈重心转向了田渊栋的近期研究成果,着重探讨了有关AI大模型的“顿悟(Grokking)”。
“Grokking”源自科幻作家罗伯特·海因莱因,意指对事物本质的深刻理解。大语言模型的高分不意味着智慧,真正的临界点在于它第一次学会“思考”的那一刻。
今年9月,田渊栋发表了一篇独立论文,指出Grokking不是神秘涌现,而是可计算的能量景观动力学。
田渊栋的研究揭示了AI学习的核心突破:在群运算任务中,任务复杂度为M(如词汇量或概念数),传统认为模型需穷举M²种组合才能学会规律,数据需求随M平方增长。而他以严格数学证明,模型仅需O(M log M)个样本即可实现泛化——近乎线性增长。以M=1000为例,以往需百万级样本,而新理论仅约7000个。
这意味着,AI无需“看遍世界”式的暴力学习,也能像人类一样,从极少样本中顿悟深层结构,为数据受限时代的高效训练提供了理论依据。
在这场访谈中,田渊栋解读了Grokking的研究,揭示了AI学习从“记忆式拟合”跃迁到“结构化泛化”的内在机制。
此外,田渊栋在访谈中透露,AI对这篇论文的贡献也很大,其中的一些思考是他和GPT-5进行对话后产生的。他调侃道:“这听起来有点像self-play(自娱自乐)。不过在对话的过程中,需要给它一些insight(洞察)和思考,它才会有不一样的输出”。
以下为完整版访谈内容,腾讯科技在不改变原意的情况下进行了精编整理:
课代表立正:最近看到了一些关于你(离开 Meta)的消息。
田渊栋:是的,现在算是比较“自由”吧,可以做任何想做的事情了。
课代表立正:恭喜!我是在准备这次访谈的时候才注意到,你已经在 Meta 工作了整整十年。
田渊栋:我加入的时候大概有一万多人。
课代表立正:其实那个时候 Meta 也不算是小公司了。我记得它是2012年上市的?
田渊栋:对,现在应该大约近8万人左右。
课代表立正:我们今天的访谈可以从你的论文聊起,也可以顺便聊聊最近的一些动向。
田渊栋:都可以。我更愿意聊论文。我之所以近期会在 X平台上发声,是因为看到有人站出来猜测和质疑是否是因为没有做出公司预期的成果。对此我必须要为我的团队澄清一下:我们团队做了很多非常重要的工作,不能把责任推到我们身上。这一点必须说清楚。
课代表立正:作为研究团队你们并没有被完全信任的原因是什么?沟通时接触的大模型团队是怎样的?
田渊栋:他们的整体经验确实非常丰富。但在某些实验中出现了程序错误(bug),由此做出了错误判断。我们这边虽然没有直接参与超大模型的训练,但一直在做大模型相关的研究。
真正的难点在于如何说服别人。我们需要花很多时间和精力去解释、论证这些问题的存在
“顿悟”发生在reasoning或其他任务之下的“共同底层”机制——representation learning(表征学习)。
本文由主机测评网于2026-05-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543722.html