当前位置:首页 > 科技资讯 > 正文

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元

在2025年的AI界,Agent无疑是最热门的话题,而OpenAI也不甘落后。

北京时间2025年7月18日凌晨1点,Sam Altman和四位OpenAI研究员通过直播,正式揭幕了他们的新作——ChatGPT Agent,一款革命性的通用型AI Agent。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第1张

虽然ChatGPT Agent在功能展示上并未带来令人眼前一亮的震撼,但其发布的意义却远远超出了功能本身。

ChatGPT Agent的核心价值在于其独特的技术路径:它能够主动从工具库中挑选代理技能,并利用自己的计算机执行任务,用户甚至能实时观测AI在虚拟环境中的工作过程。

尽管这种交互界面与Manus等产品类似,但其底层原理却大相径庭。Manus是通过调用多个底层模型实现“外部缝合”,而ChatGPT Agent则是将Agent能力内嵌于模型之中,端对端通用Agent的雏形已初现端倪。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第2张

据OpenAI透露,为了开发ChatGPT Agent,他们已将Operator和Deep Research团队合并为一个高效统一的团队,这个新团队由20至35人组成。

根据系统卡片显示,ChatGPT Agent是一个全新的代理模型,与OpenAI o3同属一个系列,采用了端到端的训练方法。它是专为代理任务开发的统一模型,而非多个模型的简单组合。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第3张

根据OpenAI提供的对比PPT,我们可以观察到这一训练主要是通过强化学习过程完成的,与Grok4with tool的路径相似。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第4张

经过再训练,Agent融合了Deep research的多步研究和高质量报告生成能力、Operator通过远程可视化浏览器环境执行任务的能力、具有有限网络访问权限的终端工具,以及通过连接器访问外部数据源和应用程序的能力。

完成任务后,还可以为用户提供一个可下载的PPT或文档。

对于Manus而言,OpenAI的这一新举措无疑是巨大的挑战,甚至从定价来看,两者也颇为接近:GPT的Plus套餐每月仅需20美金即可使用ChatGPT Agent,而Manus的基础计划也仅每月19美金。

重点提示:

ChatGPT Agent:执行复杂、多工具任务的统一AI Agent。

它集成了对文本浏览器、GUI 浏览器、终端和图像生成工具的访问。

支持与用户进行多轮互动对话,允许用户随时打断和澄清。

安全防护全面升级:加强了对网页“恶意提示”攻击的防御;设置高风险任务自动拒绝;生物/化学风险也按最高安全标准处理。

在多个现实世界和基准任务中取得了最先进的结果。

ChatGPT Agent概览:功能类似于Manus

ChatGPT Agent的核心是一个统一的代理系统 (unified agentic system),整合并扩展了 OpenAI 早期研究项目 "Operator"(侧重网站交互)和 "Deep Research"(侧重信息综合)的能力。

这使得 ChatGPT Agent 能够在单一的对话流程中无缝切换至执行具体动作。

虚拟计算机环境:ChatGPT Agent在一个特设的虚拟计算机上执行所有任务。此环境是沙盒化的,确保了操作的安全性。它能够在该环境中保存任务的上下文,即使用户中途打断或改变指令,也能从断点继续,不会丢失进度。

智能工具箱:为了完成复杂的工作流程,Agent配备了四种工具,并能根据任务需求自动选择最合适的工具:

可视化浏览器 (Visual Browser): 用于与图形用户界面进行交互,例如点击按钮、填写表单和浏览人类设计的网站。

文本浏览器 (Text-based Browser): 用于需要高效推理和处理大量文本的网络查询。

终端 (Terminal): 允许Agent运行代码、下载和处理文件。

API 访问: 可以直接调用API获取信息,例如通过连接器访问Google Drive、Gmail和GitHub等应用的数据。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第5张

新模型驱动:ChatGPT Agent由一个专门为其开发的新模型驱动。这个模型通过强化学习 (reinforcement learning) 的方法,在需要使用多种工具的复杂任务上进行了专门训练,从而学会了如何在不同工具之间流畅切换并协同工作。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第6张

多项基准测试跑分“破纪录”

最难的 HLE 达到 41.6%(with tool),高于刚刚发布的Grok4(with tool)41.0%。

在测量广域知识与专家级提问的 Humanity’s Last Exam 上,单次作答准确率达 41.6%;采用并行八路推理并选取置信度最高答案后可提升至 44.4%。

ChatGPT Agent:革新AI交互,引领通用代理模型新纪元 Agent  AI 通用代理模型 交互界面 第7张

不是期货产品,今日可用

自今日起,Pro 用户即可立即使用。Plus 与 Team 用户将在数日内陆续开通;Enterprise 与 Education 版本将于数周后接入。

“奥特曼”亲自提示风险:Agent很强大,也很危险

“奥特曼”在发布会后迅速发布了一篇长帖,提醒用户注意使用ChatGPT Agent的风险。