当前位置:首页 > 科技资讯 > 正文

AI的新突破:递归语言模型让AI“返工”以优化表现

你是否注意到,当你让AI阅读一篇长文章时,它往往读着读着就忘了前面的内容? 当你让它处理一份超长的文档时,它给出的答案可能完全偏离了主题? 这种现象,在学术界被称为上下文腐化。这也是目前AI的一个普遍问题:大模型的记忆力太差了,文章越长,模型的表现就越差!

2025年最后一天,麻省理工学院(MIT)发表了一篇重磅论文,旨在解决这一问题。

这篇论文名为《Recursive Language Models》,即递归语言模型。

听起来很学术,但简单来说就是:让AI再做一遍,效果会显著提升。

AI的新突破:递归语言模型让AI“返工”以优化表现 递归语言模型 AI优化 上下文腐化 超长文档处理 第1张

论文地址:https://arxiv.org/pdf/2512.24601

先透露两个核心数据:

在复杂推理任务上,仅仅让模型多过2-4遍,正确率就能提升10%-25%

在超长文档处理上,RLM(递归语言模型)在1000万+token的规模下,依然保持稳定表现,而传统模型直接崩溃!

这什么概念?

AI的新突破:递归语言模型让AI“返工”以优化表现 递归语言模型 AI优化 上下文腐化 超长文档处理 第2张

以前我们认为,AI不够聪明,那就给它堆参数、加显卡、买更多GPU。

MIT这篇论文直接打破常规:别堆参数了,让它返工重写一遍,效果可能更好。

原来解决问题的方法就这么简单!

并且X上很多大佬纷纷点赞~

AI的新突破:递归语言模型让AI“返工”以优化表现 递归语言模型 AI优化 上下文腐化 超长文档处理 第3张

AI的新突破:递归语言模型让AI“返工”以优化表现 递归语言模型 AI优化 上下文腐化 超长文档处理 第4张

从一个让人崩溃的问题说起

你有没有这种经历:

让ChatGPT帮你写一篇文章,它写了三千字,你却发现它完全离题万里。

或者让它帮你写代码,它写完了,但一运行全是bug。

但神奇的是,你让它再检查一遍、重新想想,有时候它就突然能改对了。

MIT的研究人员发现,这不是玄学,这是有规律的。

大多数AI犯的错,不是因为它不懂,而是因为它初稿写得太快了。

就像你写论文,第一稿总是稀烂,但改个三四遍,就像换了个人写的。

AI也是一样。

问题是:现在的大模型基本都是一遍过的模式,你输入问题,它输出答案,然后结束。

它自己不会主动返工、不会自我检查、不会反复推敲。

AI的真正瓶颈:不是脑子不够大,是记性太差

在聊MIT的解决方案之前,我得先跟你说清楚,为什么这件事这么重要。

你可能听说过一个词,叫上下文窗口。

啥意思呢?

你可以把AI大模型想象成一个天才,但这个天才有个致命缺陷——他的工作台太小了。

你给他一份超长的资料,让他帮你分析,但他只能把资料的一小部分放到工作台上看。

超过工作台大小的部分?看不到,直接忽略。

MIT的天才想法:把资料放到抽屉里

好了,问题讲清楚了,现在来看MIT的解决方案。

传统做法是:你把资料直接塞进AI的脑子里。

MIT的做法是:别塞进去了,放抽屉里吧。

效果到底有多猛?

实验一:超长文档理解

AI的新突破:递归语言模型让AI“返工”以优化表现 递归语言模型 AI优化 上下文腐化 超长文档处理 第5张

实验二:超超超长文档(1000万+token)

实验三:成本对比

未来展望

彩蛋