当前位置:首页 > 科技资讯 > 正文

OpenAI ChatGPT Agent引发AI Agent领域新竞赛

7月18日凌晨,OpenAI发布了ChatGPT Agent,这是继1月份推出operator,2月份推出deep research之后,OpenAI在Agent化道路上又一关键举措。

当前,一个有趣的现象出现了:AI Agent领域正逐渐分化为两大流派。一方是以OpenAI、Claude为代表的“基座派”,致力于将Agent能力融入其底层模型;另一方则是“应用派”,强调在具体应用场景和灵活工具调用上的设计规划。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第1张

3月,Manus的推出点燃了通用Agent的第一波市场狂潮,随后,Genspark、Flowith、Fellou等一众新锐玩家纷纷从不同应用场景切入,迅速在Agent赛道上形成了各自的阵营。

就在OpenAI发布ChatGPT Agent后不久,Genspark便在社交平台X上公开“叫板”,直言视频中演示的ChatGPT Agent能力“表现不够出色”。Manus也紧随其后,对比了自己和OpenAI展示的案例。

我们也想对比一下这些产品在ChatGPT Agent展示的一些案例上究竟表现有何不同。

成熟的Agent自我报道

首先,今天的AI Agent产品如此热闹,我们觉得它们也都是成熟的Agent了,应该来自己报道其他Agent的新闻。

于是我们让几个备受关注的AI Agent产品来报道此次ChatGPT Agent的发布。我们并没有选择简单的Prompt方式,而是要求它们以深度报告的形式产出带有设计要素的one pager。

结果如下。

Manus:

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第2张

有趣的是,Manus的Agent自我分析后,并未像官方X账号那样“自信”,反而给了OpenAI更高的分数。

Genspark:

生成了一个更全面的报告,其中对OpenAI ChatGPT的信息捕捉更全面。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第3张

并输出了一份详细的对比。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第4张

同样,与官方X的“自信”不同,Genspark的Agent也对OpenAI的水平表达了高度认可。

Flowith:

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第5张

Flowith充分理解了我们的长Prompt,抓住了制作one pager的重点,使其结果看起来设计感最强,格式也更好看。

从规划到执行的“最后一公里”

在报道完ChatGPT Agent后,我们让这些AI Agent也拿OpenAI视频展示的案例练了练手。互相比较一下。

OpenAI视频中提到了四个案例,主要是行程策划、图像设计类、资讯分析类,这也是自3月份Manus推出之后比较常见的场景。

我们先找了其中一个婚礼规划的场景,把视频中展示的Prompt提交给了Manus、Genspark、Flowith、Fellou等,看看直接对比。

Prompt:Our friends are gettingmarried later this year! This is the wedding website:https://www.zola.com/wedding/minniaandsarahCan you help me find:- An outfit that matches the dress code for all the functions (mens)- Propose like five options. Something nice, mid luxury items which match the venue, and weather- Find me hotels with couple of days of buffer on either end_-Use booking.com for these, and make sure to check availability and current price-And also don't forget to pick a gift for them ideally under $500 (registry preferred if any, otherwisefind something nice)make a nice report!

Manus:https://manus.im/share/iWutNt1yTVXu8ZUTuz6YVQ?replay=1Manus输出了一个长文本页面,没有给到具体购买链接等涉及到下一步行动的结果,属于婚礼参加指南和建议。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第6张

特别是着装要求上,没有具体的图片和款式。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第7张

Flowith:

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第8张

同样给出了一份详细的婚礼参与指南,但无法进行到下一步加购等动作。更关键的是,因为单开了一条任务线来挑选参加婚礼的服饰,该任务线出现bug,最终没能输出服饰结果。 

Fellou:

Fellou居然为这个任务一口气跑了1 小时 14 分钟。这是一个很有意思的不同。OpenAI此次发布后,它的研究员也提到,应该有一个榜单来比较AI Agent一次任务能够跑的时长。

OpenAI ChatGPT Agent引发AI Agent领域新竞赛 Agent AI 领域分化 第9张