你是否注意到,当你让AI阅读一篇长文章时,它往往读着读着就忘了前面的内容? 当你让它处理一份超长的文档时,它给出的答案可能完全偏离了主题? 这种现象,在学术界被称为上下文腐化。这也是目前AI的一个普遍问题:大模型的记忆力太差了,文章越长,模型的表现就越差!
2025年最后一天,麻省理工学院(MIT)发表了一篇重磅论文,旨在解决这一问题。
这篇论文名为《Recursive Language Models》,即递归语言模型。
听起来很学术,但简单来说就是:让AI再做一遍,效果会显著提升。
论文地址:https://arxiv.org/pdf/2512.24601
先透露两个核心数据:
在复杂推理任务上,仅仅让模型多过2-4遍,正确率就能提升10%-25%
在超长文档处理上,RLM(递归语言模型)在1000万+token的规模下,依然保持稳定表现,而传统模型直接崩溃!
这什么概念?
以前我们认为,AI不够聪明,那就给它堆参数、加显卡、买更多GPU。
MIT这篇论文直接打破常规:别堆参数了,让它返工重写一遍,效果可能更好。
原来解决问题的方法就这么简单!
并且X上很多大佬纷纷点赞~
你有没有这种经历:
让ChatGPT帮你写一篇文章,它写了三千字,你却发现它完全离题万里。
或者让它帮你写代码,它写完了,但一运行全是bug。
但神奇的是,你让它再检查一遍、重新想想,有时候它就突然能改对了。
MIT的研究人员发现,这不是玄学,这是有规律的。
大多数AI犯的错,不是因为它不懂,而是因为它初稿写得太快了。
就像你写论文,第一稿总是稀烂,但改个三四遍,就像换了个人写的。
AI也是一样。
问题是:现在的大模型基本都是一遍过的模式,你输入问题,它输出答案,然后结束。
它自己不会主动返工、不会自我检查、不会反复推敲。
在聊MIT的解决方案之前,我得先跟你说清楚,为什么这件事这么重要。
你可能听说过一个词,叫上下文窗口。
啥意思呢?
你可以把AI大模型想象成一个天才,但这个天才有个致命缺陷——他的工作台太小了。
你给他一份超长的资料,让他帮你分析,但他只能把资料的一小部分放到工作台上看。
超过工作台大小的部分?看不到,直接忽略。
好了,问题讲清楚了,现在来看MIT的解决方案。
传统做法是:你把资料直接塞进AI的脑子里。
MIT的做法是:别塞进去了,放抽屉里吧。
实验一:超长文档理解
本文由主机测评网于2026-06-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647438.html