当前位置：首页 > 科技资讯 > 正文

2026 AGI 展望：从“对话者”到“执行者”，长程智能体（Long-Horizon Agents）开启自主新纪元

主机测评网
科技资讯
2026-04-04
221

红杉资本（Sequoia Capital）在《2026：这就是 AGI》的深度报告中明确指出，AGI 的核心里程碑在于“搞定复杂任务”（Figure things out）的自主能力。

如果说 AI 的前一个阶段是属于“对话者”（Talkers）的狂欢，那么 2026 年则是“执行者”（Doers）的元年。这一转变的核心载体是**长程智能体（Long Horizon Agents）**。这类 Agent 能够摆脱对即时指令的依赖，具备自主规划、跨时段运行以及目标导向的专家级特质。从自动编程到复杂的办公自动化，这种能力正从特定垂直领域向全行业渗透。

作为 LangChain 的创始人，Harrison Chase 始终站在技术变革的风口。在红杉资本 Sonya Huang 与 Pat Grady 的最新访谈中，Harrison 深入解析了 Agent 迎来“第三个拐点”的深层原因，并揭示了未来智能体的构建逻辑。

核心洞察提炼：

• Long Horizon Agents 的核心价值在于为复杂任务输出高质量的“初稿”；

• Agent 的技术突破并非仅靠模型，更依赖于一套强预设（Opinionated）的软件外壳（Harness），文件系统权限将成为标配；

• “编码智能体”（Coding Agent）极有可能是通用智能体的终极形态；

• 运行轨迹（Traces）正取代静态代码，成为新的“事实来源”；

• 能够内化特定任务模式与背景记忆的 Agent，将构建起极高的竞争护城河；

• 理想的交互模式将是“异步管理”与“同步协作”的深度融合。

01. 长程智能体的爆发点

Sonya Huang：你如何看待长程智能体（Long Horizon Agents）的崛起？红杉最近的研究中，哪些观点让你产生共鸣？

Harrison Chase：我完全同意它们正处于“真正起步”的阶段。让大模型（LLM）在循环中自主决策始终是 Agent 的理想。AutoGPT 早期之所以震撼，是因为它展现了 LLM 自我规划的可能性。但当时受限于模型能力及周边的支撑架构（Scaffolding/Harness），效果并不理想。

如今，模型推理能力大幅增强，我们也在实践中摸索出了高效 Harness 的构建方法。从 Coding 领域开始，这种长时运行的自主性正在各行各业扩散。尽管人类仍需设定目标，但 Agent 自主运行的时间跨度正在显著拉长。

Sonya Huang：目前有哪些让你印象深刻的落地案例？

Harrison Chase：Coding 依然是标杆。此外，AI SRE（站点可靠性工程师）表现亮眼，例如 Traversal 能够自主挖掘日志并解决运维难题。AI Research 也是杀手级场景，因为它能通过长时运作交付一份详尽的初稿。

虽然 Agent 目前还无法达到 99.9% 的绝对可靠性，但它在处理高复杂度、长时程任务并产出初稿方面的效率是惊人的。无论是金融领域的总结报告，还是客服系统中的高阶任务移交，Agent 都在扮演“初稿撰写者”的关键角色。例如 Klarna 的案例显示，当 AI 无法解决问题转人工时，长程 Agent 会先生成一份详尽的上下文摘要，极大地提升了协作效率。

02. 从框架思维转向 Harness 架构

Sonya Huang：这种突破更多是归功于模型进化，还是工程层面的 Harness 设计？

Harrison Chase：我们需要区分三个概念：模型（提供 Token 输入输出）、框架（如早期的 LangChain，提供抽象层）以及 **Harness（强预设的软件外壳）**。进入“深层 Agent”（Deep Agents）时代，Harness 内置了诸如规划工具、文件系统交互和上下文压缩等核心能力，它是非常“有主见”的。

现在的突破是多因素共同作用的结果：推理模型（如 o1 等）提供了大脑；而我们搞清楚了如何围绕文件系统和上下文管理构建原语。这种共同进化让 Agent 能够像人类开发者一样操作 Bash 脚本、读写文件。现在的趋势是，具体的约束逻辑正从繁琐的代码转移到自然语言 Prompt 中，而 Harness 的底层结构趋于标准化。

Sonya Huang：你认为 Harness 工程的壁垒在哪里？谁做得最好？

Harrison Chase：目前 Coding 领域的初创公司（如 Factory、Amp）以及 Anthropic 的 Claude Code 做得最出色。Harness 需要针对特定模型家族进行微调。虽然基础模型厂商有天然优势，但只要开发者深谙模型特性，第三方同样能在 Harness 层面挖掘出巨大的性能红利。目前的基准测试显示，相同模型在不同 Harness 下的表现差异极大，这证明了工程设计的核心价值。

2026 AGI 展望：从“对话者”到“执行者”，长程智能体（Long-Horizon Agents）开启自主新纪元长程智能体 Agent Harness LangChain 软件开发范式第1张

03. 编码能力：Agent 的通用底层

Pat Grady：所有 Agent 最终都会演变成编码智能体吗？

Harrison Chase：这是一个极具启发性的思考。我坚信，长程智能体必须具备文件系统权限。文件系统本质上是最高效的上下文管理工具。通过将原始信息暂存入文件，仅在 Context 中保留索引或摘要，模型能处理远超窗口限制的任务。虽然不一定要写复杂的代码，但具备脚本执行能力的 Agent 在处理长尾任务时具有无可比拟的灵活性。可以说，代码是 Agent 操作计算机最纯粹、最强大的语言。

04. Tracing：Agent 时代的“事实来源”

Sonya Huang：构建 Agent 与开发传统软件最大的不同点是什么？

Harrison Chase：在传统软件中，逻辑蕴含在可见的代码里；而 Agent 的行为很大程度上由不可见的模型逻辑驱动。因此，看代码无法预判 Agent 的表现，你必须观察它的实际行为。这就使得 **Tracing（运行轨迹）** 成了开发者最重要的资产。在 Agent 开发中，Trace 就是“单一事实来源”（Source of Truth）。它不仅用于纠错，更是团队协作、测试和优化 Prompt 的基石。现在的 Agent 开发是高度迭代的，我们更依赖在线测试和真实输入带来的“行为涌现”。

05. 自我改进与长期记忆（Memory）

Sonya Huang：你如何看待 Agent 的自我改进？

Harrison Chase：我非常看好基于 Memory 的自我进化。在特定工作流中，Agent 如果能通过分析历史 Trace 自动优化自身的 Instructions（指令），这种粘性是极高的。随着时间的推移，一个经过磨合、内化了用户偏好和任务模式的 Agent 将形成巨大的竞争壁垒（Moat）。

06. 未来的交互范式：同步与异步的统一

Sonya Huang：Agent 的 UI 界面会发生什么变化？

Harrison Chase：未来的理想模式是**混合交互（Hybrid Mode）**。长程 Agent 默认以异步方式在后台运行，处理任务；但在关键节点，它需要通过“Agent Inbox”呼叫人类。此时，用户进入同步模式与它交流，双方共同盯着一个“共享状态”（如 IDE 里的代码或 Notion 页面）。这种既能像 Slack 一样管理异步进度，又能像 Chat 一样实时协作的 UI，将是未来的主流。

阿里云服务器性价比vps 服务器教程

本文由主机测评网于2026-04-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260433976.html

2026 AGI 展望：从“对话者”到“执行者”，长程智能体（Long-Horizon Agents）开启自主新纪元

01.

长程智能体的爆发点

02.

从框架思维转向 Harness 架构

03.

编码能力：Agent 的通用底层

04.

Tracing：Agent 时代的“事实来源”

05.

自我改进与长期记忆（Memory）

06.

未来的交互范式：同步与异步的统一

Ubuntu 20.04 安装 AX211 网卡驱动（解决 Wifi 图标消失及驱动失效问题）

2026机器人元年：宇树智元巅峰对决，四大势力竞逐具身智能新蓝海

2026 AGI 展望：从“对话者”到“执行者”，长程智能体（Long-Horizon Agents）开启自主新纪元

01.

长程智能体的爆发点

02.

从框架思维转向 Harness 架构

03.

编码能力：Agent 的通用底层

04.

Tracing：Agent 时代的“事实来源”

05.

自我改进与长期记忆（Memory）

06.

未来的交互范式：同步与异步的统一

Ubuntu 20.04 安装 AX211 网卡驱动（解决 Wifi 图标消失及驱动失效问题）

2026机器人元年：宇树智元巅峰对决，四大势力竞逐具身智能新蓝海

相关文章