7月23日,红杉资本举办了一场对话会,深入探讨了OpenAI ChatGPT Agent的技术创新与未来潜力。对话由索尼娅·黄和劳伦·里德共同主持,伊萨・富尔福德、凯西·楚和孙之清等OpenAI团队成员参与。
在这场对话中,他们分享了ChatGPT Agent的开发历程,讨论了其结合Deep Research和Operator优势实现高效跨领域任务执行的能力。他们还探讨了ChatGPT Agent的安全保障措施及广泛的应用场景。
据OpenAI设想,ChatGPT Agent将具备更强的独立判断能力,能根据用户习惯和需求提供定制化服务,并支持语音、文字、图像等多种交流方式。未来,OpenAI将致力于打造通用超级智能体,以处理人类在计算机上的几乎所有任务。
以下为对话内容精简版:
主持人:今天,我们将与OpenAI团队的富尔福德、凯西·楚和孙之清共同探讨AI Agent的演进历程。你们开发了全新的ChatGPT Agent,请介绍一下它的核心功能和重大突破。
富尔福德:感谢邀请。ChatGPT Agent是Deep Research和Operator团队协作的成果。它能执行复杂且耗时长达一小时的多步骤任务。我们为它配备了一个虚拟计算机环境,集成了文本浏览、视觉浏览、终端访问和API集成等功能,所有这些工具共享状态。
这种设计让ChatGPT Agent能够灵活处理各种复杂任务,显著提升效率和能力。我们对这款模型在多轮对话中的表现尤为满意,它能持续处理任务并不断改进。
主持人:能否分享一下这个项目的起源故事?它是如何开始的?
凯西·楚:这个项目源于Deep Research和Operator两个产品的结合。2025年1月,我们发布了Operator,能执行在线购物等互联网任务。两周后,我们推出了Deep Research,专注于浏览和综合网络信息。
在制定未来发展路线时,我们意识到这两个产品可以互补。Operator擅长处理视觉交互,而Deep Research更擅长处理文本信息。用户希望Deep Research能访问付费内容,而Operator已具备这种能力,因此结合两者成为自然选择。
孙之清:我们的团队通过统一两者架构,实现了能力的巨大飞跃。所有工具共享状态,用户可以在文本分析、视觉浏览和代码执行之间流畅切换。我们通过强化学习,在数千个虚拟机上让模型自行发现最佳策略。
这种方法使ChatGPT Agent能够与用户协作数小时,提出澄清问题并接受任务中的更正。
主持人:ChatGPT Agent的具体应用场景有哪些?用户如何使用它?
富尔福德:我们设计了一个开放式的智能体“ChatGPT Agent”,鼓励用户探索其潜力。我们训练它处理Deep Research任务、Operator任务和数据分析任务。
例如,Deep Research用户意外发现了代码搜索功能。我们希望ChatGPT Agent在消费者和企业场景中都能发挥作用。
主持人:从技术角度看,ChatGPT Agent是如何训练的?
凯西·楚:我们采用了强化学习(RL)技术,在虚拟机环境中为它提供多种工具。
我们设计了复杂任务,让ChatGPT Agent通过试验发现最佳工具使用策略,并根据任务完成的质量和效率给予奖励。
主持人:在执行外部操作时,如何确保ChatGPT Agent的安全性和可靠性?
富尔福德:安全是核心关注点。我们实施了多层次安全措施,包括内部和外部红队测试、实时监控系统以及快速响应新威胁的协议。
主持人:开发团队是如何协作的?规模如何?
富尔福德:我们的团队由Deep Research和Operator的研究与应用团队合并而成。研究与应用团队紧密合作,从定义产品功能到模型训练均以用户场景为导向。
主持人:会开发专门的子智能体,还是坚持单一超级智能体的愿景?
富尔福德:我们倾向于打造通用超级智能体。我们的训练数据显示,不同任务之间存在正向迁移。因此,单一智能体模型在扩展性和通用性上更具潜力。
本文由主机测评网于2026-04-16发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260437987.html