当前位置:首页 > 科技资讯 > 正文

Anthropic打造高效AI框架,解决长时任务记忆缺陷

如何让没有长时记忆的AI,完成持续数小时的复杂任务?Anthropic设计出一个更高效的长时智能体运行框架,让AI能够像人类工程师一样,在跨越数小时的任务中渐进式推进。

设想一下,如果你雇佣了一支24小时轮班的工程师团队,要求他们合作开发一款复杂应用。但每位工程师一上班就忘记上一班的工作,只能从头开始。

不论工程师技术多强,工作多努力,这个项目恐怕都难以完成。这正是“长期运行智能体”在现实中遭遇的困境:

“上下文窗口一关,AI就失忆”。

模型没有真正的长期记忆,所有判断都依赖当下能看到的文本片段。上下文窗口一满或被关掉,就像白板被擦掉一样。

这种“记忆缺陷”,让智能体做不了长工程。一旦任务需要持续数小时、跨越多轮对话窗口时,问题就会暴露出来。

由于上下文窗口有限,而大多数复杂项目无法在单一窗口完成,因此智能体必须找到一种能够跨越多轮编码会话的有效机制。

Anthropic通过“偷师”人类工程师,形成了一套适用于长期运行智能体的有效框架。

Anthropic打造高效AI框架,解决长时任务记忆缺陷 Anthropic AI框架 长时任务 记忆缺陷 第1张

双智能体架构,模仿人类优秀工程师的日常习惯

Claude Agent SDK是一个强大而通用的智能体框架,不仅能编码,还能查资料、调工具、规划步骤、执行任务。

它拥有上下文管理能力,比如上下文压缩(compaction),让智能体在不耗尽上下文窗口的前提下继续工作。

但仅靠上下文压缩还不够。

即使顶级的编码模型Opus 4.5,在SDK里跨多个上下文窗口反复执行模糊大指令,也难以完成一个真正能使用的Web应用。

Claude经常出现两类常见的失败模式:

第一种是一次试图做太多事。比如一次性写完整个应用,结果常常中途耗尽上下文,留下未完成、无文档的半成品功能。

第二种是错误判断“项目已完成”。这通常出现在项目后期,当一些功能实现时,后来启动的智能体会宣布项目完成。

为了解决这个问题,研究人员将问题拆成两部分:

第一步是在初始环境中搭建好提示词要求的全部功能基础。第二步是每次会话中的智能体必须每次推进一小步,同时将环境保持在“干净状态”。

  • 初始化智能体(Initializer Agent)
  • 编码智能体(Coding Agent)

环境管理“三板斧”

功能列表

为避免智能体一次性写完整个应用或过早宣布项目完成,研究人员让初始化智能体将用户的初始提示扩展成一个完整的功能需求文件。

渐进式推进

测试

快速上手

通过上述机制,每次编码智能体启动时都会先执行一套简单但实用的步骤:

Anthropic打造高效AI框架,解决长时任务记忆缺陷 Anthropic AI框架 长时任务 记忆缺陷 第2张