当前位置:首页 > 科技资讯 > 正文

OpenAI Agent登场:AI进化新篇章

备受期待之下,OpenAI的智能体(Agent)终于亮相了。

在今日的凌晨,由Sam Altman亲自领队的团队,发布了ChatGPT的通用型Agent模式。

OpenAI Agent登场:AI进化新篇章 Agent AI进化 生态竞争 第1张

相较于ChatGPT带给我们的震撼,姗姗来迟的OpenAI Agent显得少了些许惊喜,因为早在年初,我们就已经见识过类似的产品形态——当时“一号难求”的Manus,以及陆续发布的Minimax、Kimi等相似产品。

“早起的鸟儿有虫吃”,技术实力强大的OpenAI,也有其卷不过的时候。

OpenAI的Agent,终于来啦

如今发布AI产品,总是“惊喜”与实力并存——毕竟这是来自OpenAI的。

在产品的直播演示中,这款Agent展现出的能力还是值得期待的——Agent模式能够自行访问网页、调用终端、自动下单,执行从旅行规划、PPT制作到图像生成与在线购物的全套流程。

OpenAI Agent登场:AI进化新篇章 Agent AI进化 生态竞争 第2张

据悉,ChatGPT Agent即日起向Pro、Plus和Team版用户开放,而Enterprise和Education版用户则将于7月获得使用权限。其中,Pro版用户每月享有400次使用机会,而Plus和Team用户则为每月40次。

为了实现从“Chat”到“Agent”的转变,OpenAI结合了Operator(视觉层交互代理)和Deep Research(多步骤网页推理)两项核心研究成果。一个是“手脚”,一个是“大脑”,共同完成了任务的拆解、思考、行动的闭环。

这一过程中,需要三大模块工具的支持:1. 文本浏览器(Text-based Browser)来处理密集型网页阅读任务,提取信息;2. 可视化浏览器(Text-based Browser),实现在图形界面中操作鼠标点击、输入、截图等;3. 终端工具(Terminal),来运行代码、生成文件、调用API、与其他系统集成。

OpenAI Agent登场:AI进化新篇章 Agent AI进化 生态竞争 第3张

据OpenAI介绍,这款Agent不仅能执行任务,还能评估执行效果,并在每一步中动态选择最优路径。用户可以随时插话调整指令,或临时接管任务进程。

任务拆解和优化一直是Agent的一个难点。我们可以将Agent想象成一个小团队,有产品、品牌、数据。现在用户下达了一个指令:设计一款年轻人喜欢的手机壳。然后大家开始分头行动,市场做调研、品牌做推广、数据盯反馈。

然而在这个过程中,难免会有冲突和逾矩。比如市场调研部门可以发放调查问卷,数据部门也可以查看大数据报告。到底谁来做最高效?因此,优秀的Agent总是能自我优化,追求最快、最好。

为何迟到?

奥特曼想做Agent已经不是一天两天了。

其实OpenAI早就公布过自己的“五级路线图”,一级是Chatbots(聊天机器人)、二级是Reasoners(推理者)、三级是Agents(代理)、四级是Innovators(创新者)、五级是Organizations(组织者)。

Agents作为第三级是整个AI进化路径中,让AI从工具属性跃升到创新属性中必经的一环。

然而,奥特曼并不是第一个发布Agent产品的公司。

OpenAI Agent登场:AI进化新篇章 Agent AI进化 生态竞争 第4张

今年3月,Manus推出了通用Agent产品,一夜之间大家都求测试账号,一个账号甚至炒到了百万高价。

Manus借势Agent东风快速推出产品的一个很大原因是他们没有自研大模型,而是使用Claude等底层基础大模型来实现产品功能,并将各类功能组合封装。当时业内也称Manus是一款“套壳”产品。

除了Manus之外,MiniMax、Kimi、Perplexity AI也都更早发布了通用Agent形态的产品。

因此,OpenAI这次推出Agent实际上是缺乏先发优势的。从ChatGPT到Agent,OpenAI在行业中的位置也从“抢先跑”变成了“赶班车”。

关于Agent的想象力,才刚刚开始

在我看来,人类对Agent的开发还不足1%。

Agent的出现和成熟将彻底颠覆一代人。就像互联网对90后的影响一样,AI的出现将影响整个阿尔法世代。

OpenAI Agent登场:AI进化新篇章 Agent AI进化 生态竞争 第5张

从商业化的角度来看,目前大家对Agent最多的讨论就是场景化的难度。因为可以“行动”的Agent势必涉及到跨应用的调用。比如在上述贴纸订购的演示中,网购平台的调用权限就必不可少。

但在我看来,这就像当时我们无法想象淘宝如何说服店家上线一样,AI时代应用的互通只是时间问题。

作为这种大势下的用户,我们其实更应该思考的是Agent对我们以及后代生活方式的转变——

设想一下,下午四点父母还在工作时,校门口接孩子们的不再是爷爷奶奶,而是接入Agent的机器人。这些机器人是妈妈们训练出来的。到家后,Agent早就打开了空调,房间的温度刚刚好。等到快要七点的时候,Agent开始指挥炒菜机器人做饭,等着下班的爸爸妈妈。

再设想一下,一个对星座塔罗感兴趣的上班族想要搞个占星副业。Agent直接搜集各种语言的占星资料翻译成中文、提取摘要做成报告、指定一份学习计划。然后开始搜集文案引流灵感、做成海报发布在社交账号上帮忙揽客。

再看OpenAI的“五级路线图”,Agent不仅是AI从思考到行动的拐点,更是AI从被动到主动的拐点。当AI从工具化逐渐拟人化时,人类的命运也将彻底改写。