当前位置：首页 > 科技资讯 > 正文

Meta新突破：AI推理效率飙升，思维更精简

主机测评网
科技资讯
2026-05-04
178

Meta 在 AI 推理领域再次取得重大进展，实现了一场“效率革命”。

最新论文揭示，Meta 研究团队找到了一种方法，让大模型在“用更少思维，想得更清楚”的轨道上前行。

这篇题为《Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors》的论文，于 2025 年 9 月 17 日发布，由 Meta 团队与普林斯顿大学、蒙特利尔大学联合研究。

Meta新突破：AI推理效率飙升，思维更精简 Meta AI推理行为复用元认知路径第1张

作者包括 Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 与 Sanjeev Arora。

论文地址：https://arxiv.org/abs/2509.13237

论文提出了一项新机制，让大语言模型（LLM）在每次推理后，总结自己重复使用的步骤，并将它们保存为简短指令，称为“行为（Behavior）”。

下一次遇到类似问题，模型不再重复推理，而是直接调用这些“行为”。

效果令人惊叹。

在数学推理任务中，Meta 团队实测：模型在准确率不下降的前提下，推理所需的 token 数量最多减少 46%。

这意味着，同样一道题，模型少想一半，却答得一样准确。

研究团队称，这让模型“学会记得自己怎么思考”，相当于给 LLM 装上了“思维缓存”。

思维有手册：AI的“行为记忆术”

Meta新突破：AI推理效率飙升，思维更精简 Meta AI推理行为复用元认知路径第2张

“行为复用”（Metacognitive Reuse）框架

Meta 将这个机制称为“行为手册（Behavior Handbook）”。

当模型解决问题时，它会记录下自己的整个推理过程。

然后回头反思，分析哪些步骤是常见套路，比如“容斥原理”“有理化分母”“代入后先化简”。

模型会为这些套路起名、写说明，变成一条条“行为指令”。

这些指令被收进一本不断扩充的手册里。

论文将这种机制称为“元认知路径（Metacognitive Pathway）”，意味着模型在“思考自己的思考”。

举个例子：当模型遇到一道掷骰子概率题，它可能调用 behavior_total_outcomes（计算所有可能结果）和 behavior_inclusion_exclusion（用容斥原理避免重复计数）。

调用完就不再多说废话，答案照出。

所以，每个行为都是一段压缩的思维过程。它把原本需要几十步才能重建的推导，浓缩成一句话。

论文展示了多个实验结果。在 MATH 数据集上，行为调节推理（Behavior-conditioned Inference）让模型的推理 token 平均减少近一半；在 AIME–24/25 高难数学题上，模型在低预算（2048–8192 tokens）下仍保持稳定精度。

自我复盘，像人一样“省思考”

长期以来，大模型被诟病“啰嗦”：每解一道题，都要展开冗长的 chain-of-thought，把所有中间步骤重新铺一遍。

这不仅浪费 token，也降低了模型吞吐量。Meta 让模型自己反思、自己提炼、自己精简。

Meta新突破：AI推理效率飙升，思维更精简 Meta AI推理行为复用元认知路径第3张

行为提取提示设计

论文设计了三种模式：

第一种是“行为调节推理”（Behavior-conditioned Inference）。模型从手册里调出相关行为提示，带着它们去解题。

第二种是“行为引导自我改进”（Behavior-guided Self-improvement）。模型用自己总结的行为来指导下次推理。

第三种是“行为调节监督微调”（Behavior-conditioned SFT）。Meta 研究者用带有行为提示的推理数据去训练学生模型。

实验中，Meta 使用了 R1-Llama-70B 作为“元认知策略师”，并测试了 Qwen3-32B、Llama-3.1-8B 等多个学生模型。

几乎所有模型都出现了相同现象：推理 token 直线下滑，性能保持平稳。

研究者将这一现象形容为：“模型从慢推导变成快反应。”它不再每次都重写思维，而是像人一样，学会了用经验来省思考。

免费服务器性价比vps 高防服务器

本文由主机测评网于2026-05-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260542654.html

Meta新突破：AI推理效率飙升，思维更精简

思维有手册：AI的“行为记忆术”

nanochat：极致精简的ChatGPT复现工具链

iPhone 17系列新机激活难题，苹果紧急处理

Meta新突破：AI推理效率飙升，思维更精简

思维有手册：AI的“行为记忆术”

nanochat：极致精简的ChatGPT复现工具链

iPhone 17系列新机激活难题，苹果紧急处理

相关文章