一个共识是,AI今年的大主题,是Agent。
如果说过去我们习惯了AI的「动嘴」,那么接下来,就是AI「动手」的时代。毕竟,既然AI已经能听懂、又足够聪明,那为什么不能直接把事儿干完?
2025年下半年伊始,一直定义AI的OpenAI,突然端出了他们的Agent答卷。有趣的是,乍一看,它和几个月前爆火的Manus模式惊人地相似。
7月18日凌晨,Sam Altman和四位OpenAI研究员在直播中介绍了OpenAI即将推出的Agent模式。
简单来说,在Agent模式下,你可以直接对ChatGPT提要求:婚礼缺双鞋,去电商平台帮我买了;或者给我设计个宠物周边,直接下单打印;查找信息,直接生成PPT。然后,ChatGPT会自己打开虚拟机,一步步操作。
在演示中,一个复杂任务大概需要10分钟完成。但从结果看,完成度很高。ChatGPT可以在虚拟环境里调用文本浏览器、可视化浏览器和终端。而基于终端,还可以进一步调用云服务API、图片生成器,运行代码等。
更关键的,这次OpenAI不再Pro用户优先,Plus、Team用户也将能很快上手,每月可用40次。量大,管饱。
Sam Altman用他标志性的真诚眼神对着屏幕说:这是一个全新的范式。就像我们学会上网,最后也学会了甄别诈骗信息一样,现在整个社会需要学习如何与Agent安全地交互和共存。
直接观看OpenAI的Agent模式演示,会发现其直观体验与几个月前爆火的Manus高度相似。
在用户提出需求之后,都会自动开启一个虚拟机,开始自动执行一些任务。执行过程中,Agent会反复请求用户确认,并允许随时手动接管。同时,用户也能在任务中途植入新需求进行实时交互。
而在OpenAI的介绍中,Agent模式可以调用三种工具:文本浏览器、可视化浏览器和终端。模型可以自主选择切换各种工具。
这种工具组合的设计颇为精巧:文本浏览器负责大量浏览文字、搜寻信息;而可视化浏览器则负责定位到信息后直接模拟一些键鼠交互或用来读取图像信息。
终端则可以运行代码、生成包括PPT、Excel在内的文件,和调用一些云端API。
在OpenAI提供的第一个演示里,研究员提出要规划参加另一个朋友婚礼的事宜:挑选一套符合着装要求的礼服(考虑场地、天气、中高档价位)、预订酒店以及提供礼物建议。
研究员首先在ChatGPT里切换到Agent模式,把上述需求发过去。Agent启动虚拟电脑、加载环境(大约几秒)。
然后ChatGPT先用文本浏览器打开用户给的网页搜索婚礼信息、着装要求、天气等。发现需要进一步确认婚礼日期时模型也提出了澄清请求但用户选择让它自己继续推理。
在找到天气和场地信息后AI开始推荐合适的礼服并切换到可视化浏览器检查礼服效果。完成任务后继续搜索酒店和礼物。
可以看到最后给出的婚礼出行建议报告非常长而详细涵盖了服装、酒店、礼物甚至附上了非常多的链接。在酒店是否有空位的索引上附上了在线预订网站的截图。
而完成这样一份报告AI只花了十分钟。相比于我们熟悉的一问一答看起来时间长了很多但是相比于实际的工作量AI看起来还是要比人的效率高太多。
OpenAI此次推出的新Agent模式实际上并不是一项全新的创新而是由OpenAI上半年推出的两样工具组合而成:Operator和Deep Research。
Operator是原本只开放给Pro用户的浏览器Agent工具能够分析图形操作界面并做出一定的操作。
而Deep Research则是一个深入研究的分析工具可以阅读大量的网页直接生成一份调研报告。
OpenAI表示在两样工具分别推出的过程中发现很多用户用Operator写的提示词其实更像Deep Research的任务比如「计划一次旅行并预订」。而Deep Research用户高度呼吁增加「登录网站、访问受保护资源」的能力其实是Operator早就能做的。于是团队决定将两个产品融合起来。
此次Operator和Deep Research的融合看起来还是很成功的。两个从不同角度推动的Agent项目最后融合起来有了一些奇妙的化学反应避开了只使用浏览器的图形界面去阅读文字材料的低效让最后能形成深度报告的时长变得并不高。
毫无疑问Agent是2025年AI领域的绝对风口。
但风口之下用户的真实体感往往并不完美:任务运行时间过长;稍复杂的任务就频频出错。一位早期Operator用户评论道「每次点击和滚动都像在炎热夏日中游泳。」
此次OpenAI将Operator与Deep Research融合或许正是为了缓解这种「粘滞感」让Agent真正跑起来。
当OpenAI自己下场一个更直接的问题摆在了所有类似Manus的第三方开发者面前:这究竟是会催生一个繁荣的Agent应用生态还是会直接碾压所有创业公司?答案尚不明朗。
而对于用户而言一个更切身的挑战随之而来:隐私和安全。
当AI在我们看不见的虚拟机里点开一个网页输入我们的个人信息时谁来保证安全?
如果它被钓鱼网站骗走了我们的信用卡号责任谁负?
OpenAI对此的回应是他们会采取极其严格的审查和安全措施但它也希望整个社会都能花时间去适应和建立规范。
本文由主机测评网于2026-04-15发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260437441.html