RAG进化与革新：智能体检索的未来

在科技迅猛发展的今天，每隔一段时间都会听到「XX已死」的论调。「搜索已死」、「Prompt已死」的余音未了，如今矛头又直指RAG。

向量数据库Chroma创始人兼CEO Jeff Huber在播客与访谈中提出了「RAG已死，上下文工程当立」的观点，主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。

RAG进化与革新：智能体检索的未来 RAG 智能体检索 Agentic Retrieval 上下文工程第1张

对于众多AI应用开发者而言，RAG并不陌生。自2022年以来，为解决LLM输入长度有限（如GPT-3.5的4K tokens）的问题，RAG作为一种「外挂」知识库的解决方案，迅速成为行业标准。

其核心逻辑如同搜索引擎：将庞大文档切分成小块，通过向量嵌入和相似度搜索，找到与用户问题最相关的片段，再喂给LLM生成答案。

作为近几年最炙手可热的LLM应用范式之一，RAG似乎正在经历一场生存危机。长上下文窗口的崛起和Agent能力的进化，正在动摇着它的核心地位。

那么，RAG真的过时了吗？我们从三篇代表性文章中，梳理了业界对RAG「生死问题」的不同回答。

RAG未死，它在进化为「智能体检索」

来自RAG基础设施巨头LlamaIndex的这篇文章提供了一种演进主义的视角。它不认为RAG正在被替代，而是正在经历一个演进阶段，其中AI智能体成为一种全新的、更强大的RAG架构的核心。

文章指出，RAG技术已经超越了早期「朴素的区块检索」阶段，进入了一个以「Agentic策略」为核心的新时代。现代AI工程师需要掌握一系列复杂的数据检索技术，如混合搜索、CRAG、Self-RAG等。

作者以LlamaCloud的检索服务为例，系统性地展示了如何从基础的RAG逐步构建一个能够智能查询多个知识库的、完全由agent驱动的高级检索系统。

这是RAG技术的起点。其工作原理如下：

RAG进化与革新：智能体检索的未来 RAG 智能体检索 Agentic Retrieval 上下文工程第2张

作者还提及，在LlamaCloud的实现中，除了默认的按区块检索（chunk模式），还提供了两种额外的文件级检索模式：

files_via_metadata：当查询明确提及文件名或路径时（例如，「2024_MSFT_10K.pdf这份文件说了什么？」），此模式直接检索整个文件。
files_via_content：当查询是关于某个主题的宽泛问题，但需要完整文件作为背景时（例如，「微软的财务前景如何？」），此模式会根据内容相关性检索整个文件。

RAG进化与革新：智能体检索的未来 RAG 智能体检索 Agentic Retrieval 上下文工程第3张