
神译局作为36氪旗下的编译团队,专注于科技、商业、职场及生活等多个领域,致力于传递海外的最新科技、创新理念和行业风向。
编者按:基于构建300个智能体的实践经验,我们领悟到:智能体本身并非最终产品,而是驱动业务流程变革的催化剂。不应过度炒作“智能体”概念。本文编译自外媒。
有些时期仿佛停滞不前,而另一些时刻则爆发式演进,几周内就能完成以往数十年的进展。当前,我们正处在这样一个转折点:新模型、优化技术和架构不断涌现,但许多机器学习与人工智能领域的工作者仍未完全意识到这些变革。
我深入探索了AI智能体的世界。从小型原型到生产级系统,我开发了大约300个智能体,并与5家初创公司合作,共同研究如何利用智能体增强产品功能和应用场景。
在这一过程中,我积累了关于方法有效性、失败教训以及领域未来趋势的丰富经验。这些个人见解或许能为您提供新的思考角度。
首先,简要解释智能体的概念。本文所指的智能体是大语言模型(LLM)智能体,而非强化学习(RL)中的正式定义。
智能体 = 大语言模型 + 推理能力 + 工具 + 记忆系统
如今,大语言模型已内置推理功能,因此可简化为:
智能体 = 大语言模型 + 工具 + 记忆
本质就是如此。诸如“智能体工作流”、“智能体系统”或“智能体团队”等术语,实际上都是由基础智能体紧密协作形成的流程。
过去一年,我专注于构建并稳定这些流程,获得了宝贵的心得。
我使用过crewai、dspy、langgraph、autogen等框架,甚至尝试了OpenAI和Google的智能体SDK,并创建了自己的框架。
经历这些后,我明确认识到:不应局限于特定框架,而应聚焦于应用的核心流程设计。
我自称人工智能工程师,但实际上更多是调用大语言模型API并进行提示工程的后端开发者。这凸显了坚实软件工程基础的重要性,不可妥协。
常见的误解是认为赋予大语言模型目标就能创造奇迹。事实上,智能体的质量高度依赖所提供的上下文——包括提示、工具、记忆以及环境因素。结构良好的上下文往往比使用更大型号的语言模型更有价值。
仅具备“思考”能力而无工具的独立智能体容易陷入僵局。一旦赋予它执行操作的能力(如调用API、访问数据库或运行工作流),其价值才得以体现。我曾在Composio初创期(2024年5月至7月)实习,这段经历改变了我的职业轨迹。
我开发的一些最高效智能体设计极其简单:清晰的提示、一两个定义明确的工具以及单一职责。复杂性通常导致系统脆弱。优秀的智能体专为特定场景打造,并能卓越完成任务。
创建华丽演示容易,但衡量智能体的实际效能则困难得多。我意识到,建立测试和真实世界反馈循环是区分玩具项目与可靠生产系统的关键。
近期深入研究DSPy后,我发现它为智能体开发提供了自然范式。其签名、适配器、训练集和优化器等概念设计恰到好处。
.compile() 方法让人感到亲切熟悉,这正是一个理想框架应有的形态。
与5家初创公司合作让我明白,技术仅是故事的一部分。鼓励实验的文化、快速迭代能力以及清晰愿景更为关键。平庸的智能体应用在合适团队手中能创造真实价值,而绝妙应用若团队不当则可能失败。
AI智能体发展仍处早期阶段。炒作虽有缘由,但挑战同样存在。最令人兴奋的是,我们正从研究玩具转向基础设施级系统。未来,每个产品背后都可能运行智能体,协调任务、提供个性化体验并处理人类不愿应对的复杂问题。
我曾犯错并吸取教训,见证成功也经历失败。若总结核心心得,那就是:智能体本身不是产品,而是赋能工具。真正的魔力在于将其嵌入工作流程,让它们在后台无缝运行,从而驱动效率提升。
译者:boxi。
本文由主机测评网于2026-01-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260116512.html