AI代理与工作流：构建智能系统的关键要素

主机测评网
科技资讯
2026-04-21
422

一概述

许多人称2025年为“AI代理之年”。尽管“AI代理”的定义尚存争议，但业界普遍认同其自主性在不断演变。一方面，有严格的工作流程，每一步都预先设定；另一方面，有灵活的AI代理，它们在执行过程中自主决策。核心区别在于：是由开发者驱动，还是由模型驱动？

本文深入剖析了这两种模式的细节，并探讨了在实际生产部署中可能遇到的复杂问题，超出教程范围的部分。

二工作流程

AI代理与工作流：构建智能系统的关键要素 AI代理工作流可观察性护栏第1张

1.工作流程的核心部分

虽然实现工作流程的方式多种多样，但从概念上讲，将其视为简单的图表更为直观。图中的方框和箭头均按预设进行——每一步都提前规划。

节点：每个节点代表一项工作，可能是LLM调用、数学运算或发送邮件等。

边：连接方框的箭头表示“接下来这里”、“如果X则跳过此块”或“并行运行后汇合”。允许循环，箭头会指向前面的盒子，直到有指令停止。

共享状态：一个节点可以悄悄将结果发送到队列中的下一个节点，或放在整个图表都可访问的公共白板上。

2.基本工作流模式

提示链接：将第一个LLM的输出直接送入下一个，以此类推，像传送带一样，每个站点都会添加一个“贴纸”。

路由：读取传入请求并引导至相应路径。

并行化-聚合：同时启动几个分支，然后收集并合并结果。

协调器-工作者：中央LLM负责评估工作，拆分成子任务并分配给小型LLM。完成后，它会将各部分整合。（这已很像AI代理）

评估器-优化器：一人写作，另一人评分，循环进行，直到分数达到标准。

三 AI代理

AI代理与工作流：构建智能系统的关键要素 AI代理工作流可观察性护栏第2张

1.AI代理的核心要素

从本质上讲，AI代理只是一个带有指令的LLM，外加一个工具箱。当需要外部系统或数据时便可使用。维持系统运行的还有以下部分：

执行循环（AI代理运行器）：LLM只能“说话”或交流（如图像），无法点击按钮。一个连续循环读取生成的文本，确定所需工具，触发调用，并将结果反馈给LLM。此循环反复进行，直到AI代理判断完成或触发停止条件。

上下文：是LLM思考时“看到”的信息片段。涵盖从枯燥但有用的内容（如今天的日期、用户的访问级别）到会话中的闲聊（如之前的留言、过去的工具调用）。虽然许多LLM都有很长的上下文窗口，但在多轮交互中，无关信息会迅速堆积，因此精简至关重要。

会话状态（短期记忆）：一个会话涵盖一次完整的运行——可能是五轮，也可能是五十轮。AI代理学习、决策或生成的内容都会保留在这里，直到会话结束。

长期记忆：当某些东西应该在会话结束后继续存在时——用户偏好、解决的问题、写了一半的代码——它就会被存放在数据库、向量存储或纯文本文件中。

交接：如果任务变化（如从预订航班改为提交费用报告），当前座席可将接力棒交给精通该领域的队友。交接不仅包含原始数据，还包含任务上下文、聊天记录及当前对话的主导者。

生命周期事件：即使是自主运行也会遇到可预测的检查点：工具调用之前、LLM返回之后、下一个提示符之前等。这些时刻对于日志记录、权限检查或在出现问题时提前终止运行非常有用。

四工作流与AI代理

AI代理与工作流：构建智能系统的关键要素 AI代理工作流可观察性护栏第3张

大多数人最终会找到一个平衡点：给予AI代理足够的自由以发挥作用，同时设置围栏确保其安全、可见且不超过预算。工作流节点可将杂乱部分交给AI代理，而AI代理在需要稳定子任务时加入工作流。

五超越基础的考虑

连接几个基本组件并选择一个模式，即可拥有AI代理系统。借助开源框架，这实际上只需十行代码。教程看似轻松，但实际生产环境却截然不同。以下是实际使用前需要的额外工具。

AI代理与工作流：构建智能系统的关键要素 AI代理工作流可观察性护栏第4张

1.护栏

LLM仍会犯错，黑客仍会钻空子。你需要技术和政策护栏确保智能体在安全、合法性、成本和品牌形象的范围内运行。这些护栏不是单一的大门，而是层层递进的安全网。可以是嵌入模型权重的对齐、输入和输出检查及对智能体操作的限制。

六小结

我们所涵盖的内容只是更长故事的开端。我们勾勒出了核心部分——工作流程、AI代理、护栏、可观察性、评估、安全、部署和身份。但每个主题都隐藏着完整的子学科。我们甚至还没有探讨诸如AI代理的运行模式（人机交互还是后台），或应该使用哪个AI代理框架等问题。构建AI代理系统没有单一的“正确”方案。只有模式、权衡利弊及一套快速发展的社区最佳实践。希望这篇导览至少能为你提供一些基础知识，以便你知道从哪里开始深入研究。