红杉资本(Sequoia Capital)在《2026:这就是 AGI》的深度报告中明确指出,AGI 的核心里程碑在于“搞定复杂任务”(Figure things out)的自主能力。
如果说 AI 的前一个阶段是属于“对话者”(Talkers)的狂欢,那么 2026 年则是“执行者”(Doers)的元年。这一转变的核心载体是**长程智能体(Long Horizon Agents)**。这类 Agent 能够摆脱对即时指令的依赖,具备自主规划、跨时段运行以及目标导向的专家级特质。从自动编程到复杂的办公自动化,这种能力正从特定垂直领域向全行业渗透。
作为 LangChain 的创始人,Harrison Chase 始终站在技术变革的风口。在红杉资本 Sonya Huang 与 Pat Grady 的最新访谈中,Harrison 深入解析了 Agent 迎来“第三个拐点”的深层原因,并揭示了未来智能体的构建逻辑。
核心洞察提炼:
• Long Horizon Agents 的核心价值在于为复杂任务输出高质量的“初稿”;
• Agent 的技术突破并非仅靠模型,更依赖于一套强预设(Opinionated)的软件外壳(Harness),文件系统权限将成为标配;
• “编码智能体”(Coding Agent)极有可能是通用智能体的终极形态;
• 运行轨迹(Traces)正取代静态代码,成为新的“事实来源”;
• 能够内化特定任务模式与背景记忆的 Agent,将构建起极高的竞争护城河;
• 理想的交互模式将是“异步管理”与“同步协作”的深度融合。
Sonya Huang:你如何看待长程智能体(Long Horizon Agents)的崛起?红杉最近的研究中,哪些观点让你产生共鸣?
Harrison Chase:我完全同意它们正处于“真正起步”的阶段。让大模型(LLM)在循环中自主决策始终是 Agent 的理想。AutoGPT 早期之所以震撼,是因为它展现了 LLM 自我规划的可能性。但当时受限于模型能力及周边的支撑架构(Scaffolding/Harness),效果并不理想。
如今,模型推理能力大幅增强,我们也在实践中摸索出了高效 Harness 的构建方法。从 Coding 领域开始,这种长时运行的自主性正在各行各业扩散。尽管人类仍需设定目标,但 Agent 自主运行的时间跨度正在显著拉长。
Sonya Huang:目前有哪些让你印象深刻的落地案例?
Harrison Chase:Coding 依然是标杆。此外,AI SRE(站点可靠性工程师)表现亮眼,例如 Traversal 能够自主挖掘日志并解决运维难题。AI Research 也是杀手级场景,因为它能通过长时运作交付一份详尽的初稿。
虽然 Agent 目前还无法达到 99.9% 的绝对可靠性,但它在处理高复杂度、长时程任务并产出初稿方面的效率是惊人的。无论是金融领域的总结报告,还是客服系统中的高阶任务移交,Agent 都在扮演“初稿撰写者”的关键角色。例如 Klarna 的案例显示,当 AI 无法解决问题转人工时,长程 Agent 会先生成一份详尽的上下文摘要,极大地提升了协作效率。
Sonya Huang:这种突破更多是归功于模型进化,还是工程层面的 Harness 设计?
Harrison Chase:我们需要区分三个概念:模型(提供 Token 输入输出)、框架(如早期的 LangChain,提供抽象层)以及 **Harness(强预设的软件外壳)**。进入“深层 Agent”(Deep Agents)时代,Harness 内置了诸如规划工具、文件系统交互和上下文压缩等核心能力,它是非常“有主见”的。
现在的突破是多因素共同作用的结果:推理模型(如 o1 等)提供了大脑;而我们搞清楚了如何围绕文件系统和上下文管理构建原语。这种共同进化让 Agent 能够像人类开发者一样操作 Bash 脚本、读写文件。现在的趋势是,具体的约束逻辑正从繁琐的代码转移到自然语言 Prompt 中,而 Harness 的底层结构趋于标准化。
Sonya Huang:你认为 Harness 工程的壁垒在哪里?谁做得最好?
Harrison Chase:目前 Coding 领域的初创公司(如 Factory、Amp)以及 Anthropic 的 Claude Code 做得最出色。Harness 需要针对特定模型家族进行微调。虽然基础模型厂商有天然优势,但只要开发者深谙模型特性,第三方同样能在 Harness 层面挖掘出巨大的性能红利。目前的基准测试显示,相同模型在不同 Harness 下的表现差异极大,这证明了工程设计的核心价值。
Pat Grady:所有 Agent 最终都会演变成编码智能体吗?
Harrison Chase:这是一个极具启发性的思考。我坚信,长程智能体必须具备文件系统权限。文件系统本质上是最高效的上下文管理工具。通过将原始信息暂存入文件,仅在 Context 中保留索引或摘要,模型能处理远超窗口限制的任务。虽然不一定要写复杂的代码,但具备脚本执行能力的 Agent 在处理长尾任务时具有无可比拟的灵活性。可以说,代码是 Agent 操作计算机最纯粹、最强大的语言。
Sonya Huang:构建 Agent 与开发传统软件最大的不同点是什么?
Harrison Chase:在传统软件中,逻辑蕴含在可见的代码里;而 Agent 的行为很大程度上由不可见的模型逻辑驱动。因此,看代码无法预判 Agent 的表现,你必须观察它的实际行为。这就使得 **Tracing(运行轨迹)** 成了开发者最重要的资产。在 Agent 开发中,Trace 就是“单一事实来源”(Source of Truth)。它不仅用于纠错,更是团队协作、测试和优化 Prompt 的基石。现在的 Agent 开发是高度迭代的,我们更依赖在线测试和真实输入带来的“行为涌现”。
Sonya Huang:你如何看待 Agent 的自我改进?
Harrison Chase:我非常看好基于 Memory 的自我进化。在特定工作流中,Agent 如果能通过分析历史 Trace 自动优化自身的 Instructions(指令),这种粘性是极高的。随着时间的推移,一个经过磨合、内化了用户偏好和任务模式的 Agent 将形成巨大的竞争壁垒(Moat)。
Sonya Huang:Agent 的 UI 界面会发生什么变化?
Harrison Chase:未来的理想模式是**混合交互(Hybrid Mode)**。长程 Agent 默认以异步方式在后台运行,处理任务;但在关键节点,它需要通过“Agent Inbox”呼叫人类。此时,用户进入同步模式与它交流,双方共同盯着一个“共享状态”(如 IDE 里的代码或 Notion 页面)。这种既能像 Slack 一样管理异步进度,又能像 Chat 一样实时协作的 UI,将是未来的主流。
本文由主机测评网于2026-04-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260433976.html