当前位置:首页 > 科技资讯 > 正文

智能体AI的崛起:GUI vs MCP的互联网新生态

最近,被封禁的「豆包手机」(nubia M53)的App名单不断延长。不仅是微信、支付宝,拼多多、淘宝等电商平台以及众多银行类应用,都开始不同程度地禁止用户在豆包手机上登录和使用。

这并非单纯的产品之争。

一句「帮我比价下单」,手机页面自动跳转、识别界面、点击按钮、领券、结算,全程无需依赖任何官方接口。豆包手机助手采取的是典型的GUI Agent路线——让AI看懂手机界面,直接模拟用户在GUI(图形用户界面)上的操作。

类似的情况还有被亚马逊严正警告的Comet AI(来自知名AI搜索初创公司Perplexity旗下),尽管它还在相对开放的Web世界,而豆包手机助手面对的则是巨头林立的App世界。

智能体AI的崛起:GUI vs MCP的互联网新生态 智能体AI GUI Agent MCP 互联网生态 第1张

图片来源:Perplexity对亚马逊的回应

关键在于,整个互联网生态都还没有准备好迎接GUI Agent对系统权限、平台秩序和安全边界的「野蛮冲击」。

相比之下,基于MCP(Model Context Protocol,大模型上下文协议)的Agent模式,虽然也无法解决AI时代的所有平台矛盾,但为「通往共赢之路」提供了可能。

就在12月10日,Anthropic(开发了Claude)宣布将MCP正式捐赠给新成立的Agentic AI(智能体AI)基金会,由Linux基金会统一托管。如果说GUI Agent依旧沿用「AI模仿人类点手机」的旧逻辑,那么MCP尝试回答的是:

智能体时代的互联网,必须拥有一套属于AI的开放互联协议。

从小众到共识,「真·AI互联网协议」来了

MCP协议并非新概念。今年4月,阿里云智能集团资深副总裁刘伟光在接受财联社采访时表示,MCP是今天的业界标准:

「在MCP之前,许多人尝试过函数调用、提示词工程、插件等方式。今天,MCP通过统一标准接口,如同USB-C接口,降低了大模型和外部系统的集成门槛。」

毫无疑问的是,在Anthropic正式捐赠之前,MCP协议就初步成为了一种「事实标准」。

最初,MCP只是Anthropic工程师为Claude制作的一个「统一工具接入规范」,旨在解决大模型在调用外部工具、读取本地数据时必须反复编写适配代码的问题。开发者只需遵循MCP这套JSON-RPC协议,就能用一个统一方式将文件系统、数据库、业务工具接入Claude。

智能体AI的崛起:GUI vs MCP的互联网新生态 智能体AI GUI Agent MCP 互联网生态 第2张

图片来源:Norah Sakal

简单、直接、可复用,是MCP在早期被工程师口口相传的原因。但从2024年中开始,这套规范在行业内迅速蔓延:

  • VS Code、Cursor、Windsurf等新一代开发环境集成MCP;
  • OpenAI在官方文档里将MCP视作首选扩展路径;
  • Google的部分内部Agent工具链也开始基于MCP;
  • 阿里、字节、腾讯的工程团队也在项目中用MCP作为AI系统的互联方式;
  • ...

到了2025年,「支持MCP」已经成为Agent类产品的标配。事实标准,就是在这种群体无意识的默契中自然形成的。

过去二十年,互联网的运行依赖HTTP、TCP/IP、OAuth等共识。而智能体要想在手机、PC、云服务乃至企业系统间自由地交换信息、调用工具,也必须拥有自己的「协议层」。今天来看,MCP就是目前的最佳答案。

尽管MCP早已开源,但协议被捐赠给Linux基金会(目前全球最负盛名的开源基金会),更意味着MCP不再属于某家公司,而是像Linux、Kubernetes、OpenAPI等开源项目一样进入更中立的治理体系。

AI的世界,需要一套不依赖任何巨头、可被所有模型与平台共同遵循的底层协议。这大概就是这次MCP捐赠发出的一个强烈信号。

...

GUI走不通的路,只能交给MCP

...

...