在科技迅猛发展的今天,每隔一段时间都会听到「XX已死」的论调。「搜索已死」、「Prompt已死」的余音未了,如今矛头又直指RAG。
向量数据库Chroma创始人兼CEO Jeff Huber在播客与访谈中提出了「RAG已死,上下文工程当立」的观点,主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。
对于众多AI应用开发者而言,RAG并不陌生。自2022年以来,为解决LLM输入长度有限(如GPT-3.5的4K tokens)的问题,RAG作为一种「外挂」知识库的解决方案,迅速成为行业标准。
其核心逻辑如同搜索引擎:将庞大文档切分成小块,通过向量嵌入和相似度搜索,找到与用户问题最相关的片段,再喂给LLM生成答案。
作为近几年最炙手可热的LLM应用范式之一,RAG似乎正在经历一场生存危机。长上下文窗口的崛起和Agent能力的进化,正在动摇着它的核心地位。
那么,RAG真的过时了吗?我们从三篇代表性文章中,梳理了业界对RAG「生死问题」的不同回答。
来自RAG基础设施巨头LlamaIndex的这篇文章提供了一种演进主义的视角。它不认为RAG正在被替代,而是正在经历一个演进阶段,其中AI智能体成为一种全新的、更强大的RAG架构的核心。
文章指出,RAG技术已经超越了早期「朴素的区块检索」阶段,进入了一个以「Agentic策略」为核心的新时代。现代AI工程师需要掌握一系列复杂的数据检索技术,如混合搜索、CRAG、Self-RAG等。
作者以LlamaCloud的检索服务为例,系统性地展示了如何从基础的RAG逐步构建一个能够智能查询多个知识库的、完全由agent驱动的高级检索系统。
这是RAG技术的起点。其工作原理如下:
作者还提及,在LlamaCloud的实现中,除了默认的按区块检索(chunk模式),还提供了两种额外的文件级检索模式:
在实际应用中,系统通常无法预知用户会提出哪种类型的问题。为了解决这个问题,作者介绍了一种名为「自动路由」(auto_routed)的检索模式。
该模式本质上是一个轻量级的agent系统。它会首先分析用户的查询,然后智能地判断应该采用上述三种模式(chunk、files_via_metadata或files_via_content)中的哪一种来执行检索。这实现了在单一知识库内的检索策略自动化。
当一个系统需要处理多种不同格式的文档时(如财报PDF、会议PPT、客服记录等),将它们全部放在一个索引中并用相同的解析规则处理是低效的。更优的做法是为每种类型的文档创建独立的、高度优化的索引。
为了能够同时查询这些分散的知识库,作者介绍了「复合检索API」。其核心功能是:
作者的最终目标是将上述技术整合,构建一个在每个环节都由agent进行智能决策的、完全自动化的检索系统。这个系统的运作流程形成了一个双层agent架构:
本文由主机测评网于2026-05-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260542928.html