当前位置:首页 > 科技资讯 > 正文

AI代理与工作流:构建智能系统的关键要素

一 概述

许多人称2025年为“AI代理之年”。尽管“AI代理”的定义尚存争议,但业界普遍认同其自主性在不断演变。一方面,有严格的工作流程,每一步都预先设定;另一方面,有灵活的AI代理,它们在执行过程中自主决策。核心区别在于:是由开发者驱动,还是由模型驱动?

本文深入剖析了这两种模式的细节,并探讨了在实际生产部署中可能遇到的复杂问题,超出教程范围的部分。

二 工作流程

AI代理与工作流:构建智能系统的关键要素 AI代理 工作流 可观察性 护栏 第1张

1.工作流程的核心部分

虽然实现工作流程的方式多种多样,但从概念上讲,将其视为简单的图表更为直观。图中的方框和箭头均按预设进行——每一步都提前规划。

节点:每个节点代表一项工作,可能是LLM调用、数学运算或发送邮件等。

边:连接方框的箭头表示“接下来这里”、“如果X则跳过此块”或“并行运行后汇合”。允许循环,箭头会指向前面的盒子,直到有指令停止。

共享状态:一个节点可以悄悄将结果发送到队列中的下一个节点,或放在整个图表都可访问的公共白板上。

2.基本工作流模式

提示链接:将第一个LLM的输出直接送入下一个,以此类推,像传送带一样,每个站点都会添加一个“贴纸”。

路由:读取传入请求并引导至相应路径。

并行化-聚合:同时启动几个分支,然后收集并合并结果。

协调器-工作者:中央LLM负责评估工作,拆分成子任务并分配给小型LLM。完成后,它会将各部分整合。(这已很像AI代理)

评估器-优化器:一人写作,另一人评分,循环进行,直到分数达到标准。

三 AI代理

AI代理与工作流:构建智能系统的关键要素 AI代理 工作流 可观察性 护栏 第2张

1.AI代理的核心要素

从本质上讲,AI代理只是一个带有指令的LLM,外加一个工具箱。当需要外部系统或数据时便可使用。维持系统运行的还有以下部分:

执行循环(AI代理运行器):LLM只能“说话”或交流(如图像),无法点击按钮。一个连续循环读取生成的文本,确定所需工具,触发调用,并将结果反馈给LLM。此循环反复进行,直到AI代理判断完成或触发停止条件。

上下文:是LLM思考时“看到”的信息片段。涵盖从枯燥但有用的内容(如今天的日期、用户的访问级别)到会话中的闲聊(如之前的留言、过去的工具调用)。虽然许多LLM都有很长的上下文窗口,但在多轮交互中,无关信息会迅速堆积,因此精简至关重要。

会话状态(短期记忆):一个会话涵盖一次完整的运行——可能是五轮,也可能是五十轮。AI代理学习、决策或生成的内容都会保留在这里,直到会话结束。

长期记忆:当某些东西应该在会话结束后继续存在时——用户偏好、解决的问题、写了一半的代码——它就会被存放在数据库、向量存储或纯文本文件中。

交接:如果任务变化(如从预订航班改为提交费用报告),当前座席可将接力棒交给精通该领域的队友。交接不仅包含原始数据,还包含任务上下文、聊天记录及当前对话的主导者。

生命周期事件:即使是自主运行也会遇到可预测的检查点:工具调用之前、LLM返回之后、下一个提示符之前等。这些时刻对于日志记录、权限检查或在出现问题时提前终止运行非常有用。

四 工作流与AI代理

AI代理与工作流:构建智能系统的关键要素 AI代理 工作流 可观察性 护栏 第3张

大多数人最终会找到一个平衡点:给予AI代理足够的自由以发挥作用,同时设置围栏确保其安全、可见且不超过预算。工作流节点可将杂乱部分交给AI代理,而AI代理在需要稳定子任务时加入工作流。

五 超越基础的考虑

连接几个基本组件并选择一个模式,即可拥有AI代理系统。借助开源框架,这实际上只需十行代码。教程看似轻松,但实际生产环境却截然不同。以下是实际使用前需要的额外工具。

AI代理与工作流:构建智能系统的关键要素 AI代理 工作流 可观察性 护栏 第4张

1.护栏

LLM仍会犯错,黑客仍会钻空子。你需要技术和政策护栏确保智能体在安全、合法性、成本和品牌形象的范围内运行。这些护栏不是单一的大门,而是层层递进的安全网。可以是嵌入模型权重的对齐、输入和输出检查及对智能体操作的限制。

六 小结

我们所涵盖的内容只是更长故事的开端。我们勾勒出了核心部分——工作流程、AI代理、护栏、可观察性、评估、安全、部署和身份。但每个主题都隐藏着完整的子学科。我们甚至还没有探讨诸如AI代理的运行模式(人机交互还是后台),或应该使用哪个AI代理框架等问题。构建AI代理系统没有单一的“正确”方案。只有模式、权衡利弊及一套快速发展的社区最佳实践。希望这篇导览至少能为你提供一些基础知识,以便你知道从哪里开始深入研究。