LLM(大型语言模型)智能体正在成为解决复杂问题的强大工具,但其运作机制仍然笼罩在神秘之中。尽管我们在实践中取得了成功,但对其宏观层面的运作原理知之甚少。
为了揭开这个黑箱,北京大学物理学院等研究机构跨界引入了物理学中的最小作用量原理。他们提出的新方法成功揭示了嵌入在智能体中的LLM隐秘的生成方向性,并发现了AI生成过程背后可能存在的“物理定律”。
论文标题:Detailed balance in large language model-driven agents论文地址:https://arxiv.org/pdf/2512.10047
简而言之,他们通过实验测量了LLM生成状态之间的转移概率,并发现了其中的细致平衡现象。这表明LLM的生成可能不是通过简单学习规则集和策略来实现的,而是隐式学习一类潜在的势函数。
该团队表示:“据我们所知,这是首次在不依赖特定模型细节的情况下,发现LLM生成动力学中的宏观物理定律。”
通俗来说,该团队发现AI的思考并不是死记硬背,而是像水往低处流一样遵循“物理本能”。
在解决问题时,LLM智能体的行为模式并非仅仅是匹配规则或随机尝试,而是隐约看到了一张无形的地形图(势函数)。在这个地形图中,错误的答案就像是高地,而正确的答案则是谷底。智能体的每一次推理和生成,实际上都是在最小作用量原理的驱动下,自然而然地向着势能更低、质量更好的状态流动。
这意味着AI能够解决复杂问题,是因为它在海量参数中内化出了一种全局的“直觉”,这也是科学家首次在AI生成过程中发现了不依赖于特定模型的宏观物理定律。
这一发现将AI研究从“炼金术”提升到了可量化的“物理科学”高度。通过验证物理学中的“细致平衡”现象,该团队证实了AI的思维跳跃并非无迹可寻,而是像热力学平衡系统一样有着严格的数学比例。
这让我们可以用物理指标来给不同的大模型画像。例如,研究发现:
Claude-4 像个急于交卷的优等生,倾向于快速收敛到某个答案(势井),但也容易固执己见;
GPT-5 Nano 则像个探险家,虽然收敛慢,但更愿意在状态空间中多走走,探索未知的可能性。
这一理论框架让我们可以用科学测量的手段去预测和控制AI的行为,而不再仅仅依赖盲目的工程试错。看起来,正如谷歌前些天的一篇论文展现的那样(参阅报道《谷歌发布智能体 Scaling Law:180 组实验打破传统炼金术》),AI智能体的研究不再只是简单的工程实践,而是正在提升为建立在有效测量基础上的、可预测且可量化的科学。
下面具体来看看这个北大团队究竟发现了什么。
为了严谨地表述这一问题,该团队研究的是一个核心由一个或多个LLM组成的智能体。
该智能体将其当前状态f作为输入,通过一系列确定性的步骤对状态进行组织和评估,从而生成一个相关的提示词。随后,该提示词被输入到一个或多个LLM中,其结构化的输出经解析后得到一个新的状态g。该状态是研究LLM动力学的最小单位。
这种生成过程可以被视为状态空间𝒞中的一个马尔可夫转移过程,其转移核为P(g|f),保留了LLM生成的多样性和适应性。状态由智能体在每个时间步保留的完整信息定义。
基于LLM的智能体的特征在于其状态转移并非完全随机,而是表现出某种结构化的偏好。具体而言,智能体倾向于从当前状态f转移到从智能体视角来看“更好”的状态g。
为了捕捉这一现象,假设存在一个潜在的势函数V_𝒯:𝒞→ℝ,它为每个状态分配一个标量值以反映其“质量”。由于特定的势函数通常难以直接计算,研究者提出了一种有效估计该势函数的方法。
...(省略了中间部分细节)...
...(省略了中间部分细节)...
本文由主机测评网于2026-05-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546404.html