【探索】我们以为语言是语法、规则、结构。但最新Nature研究揭示了令人惊讶的真相:GPT的层级结构与大脑内的「时间印记」惊人一致。当浅层、中层、深层在脑中依次点亮,我们发现:理解语言,或许从来不是解析,而是预测。
长久以来,我们深信人类大脑依靠严谨的规则、语法和结构分析来理解语言,这一观念根深蒂固且复杂。
然而,这一共识在Nature Communications上发表的一项颠覆性研究后,被彻底打破。
论文链接:https://www.nature.com/articles/s41467-025-65518-0
研究者们让受试者聆听30分钟的故事,并使用毫秒级的脑电技术,精准捕捉大脑对每个词语的反应。
随后,他们将同样的故事文本输入大语言模型(如GPT-2和Llama-2),提取模型每一层对文本的内部理解表示。
实验结果令人震惊:GPT那看似冰冷的层级结构,竟在人类大脑里找到了完美的时间对应关系。
过去,我们总以为GPT在模仿人类。但这个实验给出了一个震撼的暗示:
或许,我们的大脑天然就具有「GPT」的结构。
要理解这项研究的颠覆性,关键在于它如何将GPT的48层结构逐层对齐到人脑的时间序列。
研究团队选取了9名因癫痫接受术前监测的病患,他们的大脑皮层上已植入高密度的ECoG电极。
这种设备能以毫秒级精度记录大脑真实的电活动。
受试者聆听了一段30分钟的播客,研究者同步采集了围绕每个词出现时刻的高伽马脑电信号。
这些信号覆盖了语言通路中的关键区域:从掌管听觉的mSTG、aSTG,到负责语言整合的IFG,再到高级语义区的TP。
与此同时,研究者将同一段文本输入GPT-2 XL和Llama-2。
每当模型处理到一个词时,他们就「暂停」,抽取这个词在模型内部从第一层到最后一层的所有内部理解表示。
随后,他们将模型每一层的表示通过CA降维简化,再用线性模型尝试预测人脑在那一毫秒的脑电活动。
如果GPT的层级结构与人脑无关,那么将模型层级对齐到大脑的时间轴上,结果必然是一团乱麻。但实验结果显示,二者存在某种结构对应,在脑电时间轴上我们看到了清晰的秩序。
实验初期,研究者仅想验证一个简单假设:
如果大语言模型的层级结构与大脑的某个处理阶段相对应,那么这种对应应像接力跑一样,在时间轴上依次出现。
研究者将GPT的每一层语义表示丢进线性模型里,试图预测大脑在听到每个词时,高伽马活动会在哪一毫秒达到峰值。
结果显示,这张「时间阶梯图」清晰揭示了大脑的秘密:越靠近高阶语义的区域,越像GPT的深度结构。
GPT的48层在大脑语言通路中呈现出清晰的「时间—深度」对应结构。浅层(暖色)在更早的时间点达到峰值,深层(冷色)在更晚时间出现。TP、aSTG、IFG等高阶区域表现出强线性关系(r=.93 / .92 / .85),而mSTG(近听觉皮层)几乎没有层级结构(r≈0)。
如果GPT的层级结构真能在大脑里找到对应,一个更尖锐的问题随之而来:
那些我们以为描述语言「最准确」的传统模型——音位、词素、句法、语义,它们构建的语言理解框架会呈现出同样的时间结构吗?
研究团队将这四类符号语言学模型全部纳入测试。
如果人类语言真的依赖这些规则,它们理应比GPT更能精确预测大脑的反应。
然而结果很快给出了答案:传统符号模型确实能预测一部分脑电活动,但与GPT的「像不像」程度差得非常远。
当GPT的层级能在人脑里找到清晰的时间对应时,这项研究的意义已超越了单纯的模型比拼。
它指向了一个更底层、更古老的问题:语言到底是什么?
过去几十年,我们用语法规则解释句子,用语义网络解释概念,用树状结构描述语言的逻辑关系。
这些框架强调「结构、类别、层次」,却很少讨论语言在大脑中的即时生成方式:它如何在毫秒级连续变化?如何在瞬间整合过去与未来?
这次的结果彻底呈现出一种截然不同的景象——大脑处理语言根本不像在执行规则,而更像是在沿着一条不断压缩、预测、更新的轨道向前推进。
本文由主机测评网于2026-05-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546107.html