当前位置:首页 > 科技资讯 > 正文

AI Agent时代:基础设施的革新与挑战

经过两年的快速发展,AI正大步迈进Agent时代。

“被动响应”转向“主动决策”,AI Agent正成为连接数字与物理世界的桥梁。

从自动处理客户服务的企业Agent,到协调科研实验的学术Agent,再到管理智能家居的个人Agent,这些智能体凭借其推理、规划、记忆和工具使用能力,正在重塑产业格局。

然而,支撑这些智能体的,是一套复杂且精密的基础设施——这包括算法、模型,以及从研发到运维的全生命周期支撑体系。

2025年,AI Agentic基础设施(Agent Infra)将迎来爆发拐点。DeepSeek、Qwen等开源大模型的突破为Agent注入了强大的认知“大脑”,而模型上下文协议(MCP)的生态繁荣则赋予其灵活的“四肢”。

IDC预测,全球80%的企业将在年内部署Agent。随着“大脑”与“四肢”的协同进化,它们对“躯干”的升级需求愈发迫切,Agent Infra成为技术革新的关键领域。

AI Agent时代:基础设施的革新与挑战 Agent Infra 智能体 基础设施 第1张

Agent企业应用

面临五大挑战

利用AI实现工作流程自动化的产品早已存在。生成式AI出现之前,RPA类产品就十分流行。

但由于当时的AI能力较弱,RPA只能实现简单的单一流程自动化,无法处理复杂的复合问题。

生成式AI的出现,让真正智能的Agent应用应运而生,为企业带来了显著效率提升。

Agent本质上是一个能调用各种工具的AI。例如,Manus通过提示词控制AI模型,并编排工作流,让AI模型使用不同工具完成任务。

但无论是研究类Agent如DeepResearch,还是通用Agent如Manus,都是通过网页或App形式提供给终端用户。

这种提供方式并不适合专业的AI开发者、创业者和企业用户。他们需要Agent使用专有数据,无缝嵌入业务中,持续创造价值。

商业化使用Agent面临的首要问题是终端性能。功能强大的Agent在本地运行时,会遇到各种挑战。

首要挑战是AI推理的算力限制。运行强大AI模型通常需要专用算力(如GPU或AI芯片),而消费级PC或手机难以部署高精度大模型。因此,许多Agent公司采用云端算力,将模型训练和推理放在云端完成。

其次是执行任务的算力需求。Agent任务具有高并发、高算力的特点。本地部署后,当业务量增长时,需要更多算力,而本地部署速度跟不上;业务闲置时,又会造成资源浪费。

再次是AI工具配置复杂。Agent若不能调用工具,就难以解决复杂问题。例如,销售类Agent需调用CRM、知识库和通讯工具。

国内虽有智算中心缓解算力限制,但它们仅提供算力,不提供构建Agent所需工具链。

企业需自行搭建工具链,这既复杂又耗时耗资,会延缓业务发展。

解决算力限制和工具配置后,专业用户会面临权限冲突问题。开发和部署Agent需与业务软件紧密配合,可能会占用计算资源并抢占员工权限,降低工作效率。

安全性也是一大问题。企业使用Agent需使用内部数据,但Agent执行过程不透明,可能修改或删除本地文件,造成系统臃肿或数据泄露。

此外,Agent缺乏长期记忆。缺乏语义和场景记忆会影响Agent在企业中的应用范围。

Agent Infra应运而生

云厂商纷纷推出新一代Agent Infra技术架构。

AWS推出AgentCore(预览版),基于Lambda FaaS基础设施优化全托管运行时,解决标准Lambda的限制。Azure推出AI Foundry Agent Service,集成Functions FaaS事件驱动构建和部署Agent。

Google Cloud推出Vertex AI Agent Builder,虽未明确但推测其基于Cloud Run优化支撑长时运行和并发需求。阿里云推出函数计算Function AI,基于FC FaaS的Serverless x AI运行时优化模型、工具和Agent服务。

AI Agent时代:基础设施的革新与挑战 Agent Infra 智能体 基础设施 第2张

PPIO推出国内首个Agentic AI基础设施服务平台——AI智能体,分为通用版和企业版。通用版以分布式GPU云底座为支撑,发布兼容E2B接口的Agent沙箱及模型服务。

AI Agent时代:基础设施的革新与挑战 Agent Infra 智能体 基础设施 第3张

这些技术共同为Agent提供高弹性、低延迟、强安全、长会话的“躯干”,支持其从实验室走向大规模企业场景。

当认知与行动形成闭环,Agent Infra的技术差异将决定企业AI创新和转型的速度与质量。

Agent开发范式的演进对底层基础设施提出新要求。新一代Agent Infra聚焦长时运行、会话亲和、会话隔离等技术突破,满足LLM Agent、Workflow Agent和Custom Agent的共性需求。