当前位置：首页 > 科技资讯 > 正文

加州大学新论文：AI Agent商业应用全景

主机测评网
科技资讯
2026-05-24
130

加州大学伯克利分校（UC Berkeley）最新发布了一项重要研究：《Measuring Agents in Production》。

（论文链接：点击这里）

本研究基于全球真实请求：306名从业者的深度调研，20个企业级部署案例，覆盖26个行业。

这是AI Agent领域迄今为止规模最大的一次实证研究。

研究揭示三大核心信息：

生产力的提升是Agent落地实施的首要驱动力；
闭源模型、人工Prompt和受控流程是当前的主流方案；
可靠性是最大的挑战，人工审核依然不可或缺。

报告信息丰富，让我们一一解析。

73%因生产力而部署，金融成Agent主战场

先看一个数字：73%的从业者表示，部署Agent的首要目的是“提高生产力”。

加州大学新论文：AI Agent商业应用全景 AI Agent 生产力金融行业可靠性第1张

其他动机也非常务实：63.6%是为了减少人工工时，50%是为了自动化常规劳动。

相对而言，那些难以量化的质性收益，如“风险规避”(12.1%)和“加速故障响应”(18.2%)，排名则较后。

也就是说，Agent的落地实施，优先于那些能带来直接、可量化回报的场景，那些价值难以估量的质性改进，目前还需等待。

从应用场景看，Agent早已超越写代码或聊天机器人，深入到更严肃的商业流程中。

加州大学新论文：AI Agent商业应用全景 AI Agent 生产力金融行业可靠性第2张

其中，金融与银行业占比最高（39.1%），其次是科技（24.6%）和企业服务（23.2%）。

此外，Agent还在许多意想不到的地方落地：

- 保险理赔流程自动化：代理人处理从保单查询到风险识别的序列排序流程。

- 生物医学工作流自动化：在科学发现领域，Agent用于自动化执行复杂的实验和数据分析流程。

- 企业内部运营支持：涵盖人力资源信息搜索、站点故障事件诊断等。

这些跨行业的成功案例证明，AI Agent已具备解决真实世界复杂问题的能力，并正在创造实际的商业价值。

在实际业务场景中，Agent更像人类的“超级实习生”。

加州大学新论文：AI Agent商业应用全景 AI Agent 生产力金融行业可靠性第3张

92.5%的Agent直接服务于人类用户，其中52.2%服务于企业内部员工。

为何主要是内部员工使用？因为在组织内部，错误后果可控且有人监督。只有7.5%的Agent服务于其他软件系统，Agent间的全自动交互还很遥远。

与很多想象不同，Agent的响应速度并非客户首选。在生产环境中，66%的系统允许分钟级甚至更长的响应时间。

原因在于：相比于人类完成任务需要的数小时或数天，Agent花几分钟仍是巨大的效率提升。这意味着开发团队可将重心放在提升输出质量和可靠性上，而非追求极限低延迟。

生产级Agent的“极简主义”：拒绝微调，专注Prompt

与学术界对复杂自主Agent的探索相比，生产级AI Agent的构建哲学是“大道至简”。

从业者优先选择简单、可控、可维护的技术路径，以最大程度提升系统可靠性。这种务实的工程选择贯穿于模型选型、技术实现、核心架构和框架使用的各个方面。

在模型选择上，闭源是主流。

加州大学新论文：AI Agent商业应用全景 AI Agent 生产力金融行业可靠性第4张

在20个深度案例中，85%（17个）使用了闭源模型。Anthropic的Claude系列和OpenAI的GPT系列是首选。

选择闭源的核心逻辑是效率。对于辅助专家（如医生、高级工程师）的Agent来说，推理成本相比人力成本几乎可以忽略不计，因此团队倾向于选择最强的模型。

开源模型更多被认为是特定场景下的补充。只有在满足严格约束条件时，团队才会选择开源模型。一般来说有两种情况：

- 成本效益：对于需要大规模、高推理的场景，自托管开源模型的成本优势凸显。

- 数据隐私：受法规或企业政策限制，当敏感数据无法突破外接环境时，开源模型成为唯一选择。

与模型选择一样，从业者在技术路径上也倾向于更简单、迭代更快的方法：拒绝微调，专注Prompt。

学术界热衷的微调（Fine-tuning）和强化学习（RL）在实际应用场景中极少使用。其中70%的案例直接使用现成模型，完全不进行权重微调。

大家的精力都花在哪了？花在写Prompt上。

加州大学新论文：AI Agent商业应用全景 AI Agent 生产力金融行业可靠性第5张

78%的系统采用全手动或手动+AI辅助的方式构建Prompt生产环境。Prompt可能非常长，12%的Prompt超过10,000个Token。

这也说明，从业者更相信自己手写的规则，而非自动优化工具（如DSPy）。

“约束性部署”成就可靠系统

“约束性部署”模式

环境约束：

“环境约束”将Agent部署于复杂模式、内部网络或与生产隔离的沙盒环境中。

“自主性约束”：

“自主性约束”将Agent的行为限定在少于10个步骤的构成、预定义工作流程内。

“人工监督”：

“人工监督”将专家安置决策回路的关键节点。

“约束性部署”的启示

“约束性部署”确保了系统的可靠性。

“约束性部署”使得系统能够在实际业务中发挥作用。

“约束性部署”的优势

“约束性部署”提高了系统的安全性和可控性。

“约束性部署”使得系统能够在不依赖AGI的情况下实现显著的商业价值。

性价比服务器云服务器阿里云服务器

本文由主机测评网于2026-05-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260546017.html

上一篇
智世机器人获数千万元A+轮融资，加速智能仓储升级

下一篇
大疆Pocket 4将携新摄像头设计登场，未来影像新体验

相关文章

拼多多面临低价挑战，黄峥的供应链战略能否破局？

AGI的未来：从单体到分布式智能的哲学重构

2025智能眼镜：AI新战场，巨头争相布局

2025外设市场：旧王退位，新王争霸，AI驱动变革

自动驾驶技术受停电挑战：规则失效下的脆弱性

2025医美市场：从“盲目跟风”到“自然美”的转型

空调业铝代铜变革：技术创新与成本挑战

全球半导体市值TOP100：中国力量崛起与产业版图重构