当前位置:首页 > 科技资讯 > 正文

套娃模型崛起:递归推理重塑AI长文本处理

推理模型即将退役?

顶尖GPT-5模型竟被一篇博士论文突袭,上下文窗口被甩出两个数量级。

新方案在处理长文本时,“上下文腐烂”现象也大幅减少,而且成本更低。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第1张

这是MIT最新论文提出的“套娃模型”新范式,预测将成为今年的主流。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第2张

“套娃模型”正式名称为递归模型,核心流程是将文本存入代码环境,让模型编写程序拆解并递归调用自身处理。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第3张

有网友评价说,递归模型不仅节省Token,更是在改变交互方式。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第4张

从各项指标来看,推理模型,似乎真的不香了。

代码驱动的递归推理

递归语言模型(RLM)不再将长文本直接输入神经网络,而是采用一种“环境化”的处理范式。

核心逻辑在于将自然语言处理任务重构为交互式编程任务,引入Python REPL(读取-求值-输出循环)环境,将超长文本作为静态字符串变量存储在内存中

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第5张

在具体执行流程中,RLM建立了一套基于代码的认知循环。

系统接收长文本任务后,启动Python环境并将文本载入变量P,随后模型进入迭代循环,观察环境状态,编写代码探测文本。

这些代码在REPL环境中执行后,运行结果反馈模型。

“编写代码-观察执行结果”的循环,使模型以极低计算成本在庞大文本数据中索引和定位,仅在必要时读取关键段落,实现高效上下文管理。

突破千万级Token的性能极限

实验数据显示,RLM有效处理规模已达1000万Token级别,超出GPT-5等前沿模型原生上下文窗口两个数量级。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第6张

由于RLM将Prompt视为外部环境,选择性读取相关片段,而非全量摄入,因此改变了“上下文越长成本越高”的线性规律。

作者简介

本文第一作者为MIT CASIL实验室博士生Alex Zhang。

套娃模型崛起:递归推理重塑AI长文本处理 递归模型 文本处理 长文本 AI 第7张