当前位置:首页 > 科技资讯 > 正文

Manus AI:通用AI Agent年收入突破9000万美元,展望未来生态合作

Manus AI:通用AI Agent年收入突破9000万美元,展望未来生态合作 AI Agent  AGI 经营数据 新加坡 第1张

Manus团队搬迁至新加坡后,对于通用AI Agent的持续思考与创新从未停歇。

在近期于新加坡举办的Stripe Tour活动中,Manus联合创始人兼首席科学家季逸超(Peak)与Stripe亚太地区及日本首席营收官Paul Harapin进行了一场深入对话。

对话中,Manus AI透露了其最新的经营数据,年度经常性收入(RRR)已达到9000万美元,并正快速向亿美元规模迈进。

Manus AI的肖弘进一步说明,Revenue Run Rate是基于当月收入乘以12计算,并不等同于现金收入。许多AI产品提供年付选项,这部分应视为预存款而非即时收入。“若采用错误计算方式,数字可能超过1.2亿美元。”肖弘强调。

除经营数据外,季逸超分享了Manus团队对通用Agent未来发展的思考,以及AI Agent与AGI之间的区别。

“如今几乎万物皆可称为Agent,”季逸超风趣举例,“甚至一个麦克风也可能被称作‘环境感知收音Agent’。”

他提出拓展通用Agent能力的两大方向:一是通过多Agent协作扩大执行规模(例如在大规模调研中启用上百个并行子Agent);二是扩展Agent的‘工具面’,使其能像程序员般调用开源生态、安装库,并在可视化后实现图像自检与修正

季逸超指出,当前数字世界仍以人类使用为导向——非API化网页、验证码及流程游戏化造成诸多摩擦,瓶颈更多在于生态与制度限制,而非模型智能本身

这也正是Manus参与Stripe活动的原因之一:双方正推动在Agent内集成支付功能,将“研究-决策-下单/结算”串联成闭环,通过基础设施合作减少现实摩擦。

以下为对话精华,经极客公园编辑整理:

问:请向观众简要介绍自己。您近期关于“上下文工程”的博客备受关注,对AI Agent开发者而言可谓必读。每次与工程师共进午餐,他们总在讨论此话题,令我不得不另寻座位(笑)。对于不熟悉Manus的听众,能否分享您的经历与愿景?

答:感谢Paul。很高兴参与此次活动。Manus致力于构建通用AI Agent。

众多研究机构与企业专注于开发大脑——即大语言模型。但我们认为,从用户视角出发,这并非最佳方案。AI应能实际行动、完成任务,因此我们创建了Manus。

我们的方法是让AI运用人类最伟大的发明之一——通用计算机。赋予AI计算机能力,它便能执行人类可完成的所有任务。Manus能切实解决问题,例如制作演示文稿、规划旅程,甚至管理社交媒体——尽管我不建议您真正这样做。

用户对Manus反响热烈。我们于三月发布Manus,如今年度经常性收入(RRR)已约9000万美元,即将突破1亿大关。

这对我们这类初创公司而言意义重大。更重要的是,这标志着AI Agent已超越研究热词,真正落地应用。

我想分享一个Manus开发中的小故事。

我们从Agent编程应用中汲取了许多灵感。例如Cursor这类AI编程产品,此前已广受关注。

作为工程师,我们自然使用Cursor。但令人惊讶的是,公司内许多非工程师同事也在使用Cursor。他们并非编写软件,而是用于数据可视化甚至撰写文章。他们忽略左侧代码部分,仅通过与AI对话完成工作。

这使我们意识到:应将此模式推广,赋能非程序员。这正是AI的应用场景之一。

问:AI Agent与AGI的讨论日益增多。您能否清晰区分这两个概念?对您及Manus而言,它们分别意味着什么?

答:我们认为这是一个极佳的问题。

当前几乎一切皆可称为“Agent”。例如,一个麦克风可能被描述为“环境感知收音Agent”。

但我们主张,Agent应是应用型AI的子集。我们退一步审视常见的AI应用类别。

大多数用户熟悉两类:一是聊天机器人,如ChatGPT;二是生成式工具,如MidJourney或Sora。这些系统中通常仅有两个角色:用户与模型。您与模型交互并获得输出。而Agent的不同之处在于,它引入了第三个关键要素——环境。

“环境”概念因智能体类型而异,例如设计型Agent的环境可能是画布或代码;在Manus中,我们的目标是让Agent存在于虚拟机乃至整个互联网。这样Agent便能观察环境、决策行动并改变环境,从而发挥强大效能。

例如在Manus中,您可以提出需求,它将打开浏览器、发布网页或为您预订机票。我钟爱此例,因为尽管订票看似简单,但这实则是AI直接改变现实——结果非模型输出,而是您手中的机票。AI真正介入您的世界。这便是我们所说的Agent。

简言之,Agent是能代表用户与环境交互的AI系统。

至于AGI,此词也常被提及,许多人将其等同于超级智能。我们认为,AGI是一种能利用AI模型通用能力、无需专门设计即可完成多项任务的系统。

我们认为“Agent编程”是通向AGI的路径之一。它并非垂直领域能力,而是若赋予计算机,则几乎能在计算机上执行任何任务。因此对我们而言,AGI的条件在于构建足够完善的环境以释放此能力。

问:AI目前在哪些场景真正发挥作用?未来将在何处展现潜力?何时迎来“iPhone时刻”?

答:就Agent而言,若仅看模型能力,当前旗舰模型已令人惊叹,近乎“超人”水平。它们能在数学竞赛或逻辑推理中超越大多数人类。

但我认为,模型仍似“瓶中大脑”,若想真正发挥力量,必须让它们与现实世界交互。遗憾的是,这正是问题所在。

例如,让AI处理事务性任务时,它在重复性任务上表现出色。像Deep Research这类产品,仅聚合信息并给出结果,其输出仅呈现于此。

举例来说,现今几乎所有事物皆为人设计,不仅物理世界,数字世界亦然。例如网页工具,它们如同小游戏,未提供API或标准接口。验证码无处不在,不断拦截Agent。

因此我认为AI在封闭的自包含任务中表现优异,但一旦涉及现实世界,便面临障碍。

未来何时出现iPhone时刻?我认为这非技术问题,而更似制度性限制。这非我们这类Agent初创公司能独立解决。

这需要渐进转变,要求整个生态系统协同进化。也需如Stripe等公司在基础设施层面发力。例如我们正集成Stripe的Agentic支付API。众人共同努力。

问:能否具体谈谈用户使用Manus的典型场景?他们如何使用?这体现了何种力量?

答:是的,尽管我们源自当前Agent世代,但已见证许多出色用例。

例如,我们刚迁至新加坡,需雇佣房产中介协助找房。这是真人Agent(笑)。

如今这些中介已在运用Manus:他们根据客户需求,使用Manus分析公司位置、员工偏好区域,并生成相应推荐。

我认为这很有趣,因为这属于“长尾需求”。通常,并无专门AI产品为此类具体场景设计,但由于Manus是通用型Agent,它能满足这些需求。我们认为长尾需求值得重点关注。

从宏观视角看,它或许是长尾,但对具体用户而言,这正是日常职责。此类场景尤为宝贵。

这类似当今搜索引擎格局。若仅搜索常见内容,无论Google或Bing,结果质量相近。那为何人们选择其一?可能因某搜索引擎在特定时刻提供更相关结果。若搜索高度个性化或专业化内容,则差异更显。因此我们认为通用型Agent优势在此。

如何使其更优?我们深思良久,因我们认为一切皆绕编程展开。若将计算机交予AI,则其与环境交互方式实为编程。

我们认为可从两方面改进。首先是规模化。但若能将Agent能力放大百倍,又将如何?

近期Manus发布了新功能Wide Research。其核心理念是允许一个Agent衍生上百个Agent协同任务。您知道,若仅让AI处理琐事,您常可自行完成。但若任务庞大,个人难以胜任,例如大规模研究,此时上百个Agent并行工作将变得极为强大。

其次,我们需让Agent更灵活地运用计算机。例如,若仅予AI Agent预设工具,则其行动空间受限于此。但设想您若是程序员,您可调用整个开源社区资源。

例如在3D打印时,直接修改模型参数或具挑战,但若能在GitHub找到合适库,安装即可解决问题。在Manus中,我们优化通用性,并提出“工具的网络效应”概念。

有一有趣案例:许多用户用Manus进行数据可视化。您可知,在亚洲有时遇问题,如图表显示中文时可能出现字体错误。或许专业用户会编写硬编码规则,例如输出韩文时指定字体。但此方式令系统日益僵化。

我们采取的方法是赋予系统简单能力:查看图像。结果令人惊喜——因当前模型已足够智能,它们会在生成可视化图像后自行检查,识别错误并自动修正。我们发现,增加工具灵活性比硬编码规则能解决更多问题。

问:这是一个激动人心的时代。我深感振奋,只望自己能年轻三十岁(笑)。提及医学研究,我知Manus在此领域亦强。您是否观察到用户使用Manus进行医疗研究?

答:许多人已用Manus进行研究,不限于医学领域。我们认为这很有趣,因现有许多“深度研究”产品仅帮您收集信息并分析,最终仅提供Markdown文件或文档。这远不足够。

通常,研究人员真正需要的是可直接交付领导或团队的成果。因此我们在Manus中强化研究输出。例如医学研究中,常需生成正式报告,如幻灯片演示。故我们必须优化AI输出能力,以满足研究人员需求。这是一种“工具化”体验。

例如,现许多用户先用Manus研究,随后直接生成网站。您会觉得这与传统建站方式截然不同。

需知,建站本身并不难,难在确保数据可靠性与准确性。因此我们认为,最佳方式是在单次会话、共享上下文中完成全流程。如此,您的研究与见解可无缝转化为最终成果。这正是Manus中所实现。

问:多国皆在讨论AI时代的人类未来与经济影响。您如何看待就业替代?又将出现哪些新工作机会?

答:我们的朋友与投资人常问此问题。推出Manus时,我们原以为若构建此类Agent,它将助人节省时间,轻松获利。

但实际上,我们发现此愿景未完全实现。通过大量用户调研,我们发现用户使用后,工作时间反增。因为他们效率提升,能更多从事擅长之事。此为其一。

其次,我们认为Manus开辟了新空间。我们常讨论虚拟机与云计算。我们认为Manus正扮演“个人云计算平台”角色。例如云计算已存几十年,但它更多是工程师特权,仅我们能通过编程调用云力量。普通知识工作者无法使用。

但现有如Manus的AI Agent,人们可用自然语言指令,让AI执行。这解锁了全新生产力。此为我们所带来的。

最后,关于“替代”,我认为实难实现。例如房产中介,他们每日用Manus处理日常工作。但您知,AI永无法替代中介面对客户时的沟通方式。我们是一家AI公司,甚至Manus发布视频脚本由Manus编写,但视频中仍是我,因这关乎信任。而信任,不能完全交予AI。