当前位置:首页 > 科技资讯 > 正文

WebMCP革新:AI与网页交互迎来革命

今日,谷歌Chrome团队宣布了一项重大更新:WebMCP(Web模型上下文协议)正式上线。

它允许AI智能体绕过「人类用户界面」,直接与现有网站和Web应用进行深度交互。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第1张

在Chrome 146的早期预览版中,通过特定设置即可体验WebMCP。

这赋予了Agent前所未有的「超能力」,无需再「模拟人类行为」去浏览网页、寻找按钮或点击链接。

只需通过API:navigator.modelContext,AI即可绕过图形界面,直接与Web应用的核心服务对话。

例如,想要订机票时,Agent无需在屏幕上点击,而是直接通过底层协议向航空公司网站发送命令,获取结果。

开发者Alex Volkov指出,「WebMCP相当于UI层面的API」。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第2张

可以说,WebMCP的诞生,传递了一个清晰的信息——

AI Agent与网页交互的底层逻辑,正经历一场彻底的变革。

它实现了从「视觉模拟」到「逻辑直连」的飞跃,标志着传统Web交互模式的终结。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第3张

WebMCP震撼发布

开启Agent交互新纪元

或许很多人尚未意识到WebMCP的重要性。

它的核心在于,改变了Agent获取服务的方式,使其直接掌握了网页的「核心权限」。

未来,随着交互的进一步升级,可能会催生新的技术革命。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第4张

当前,Agent操作网页的方式既笨拙又原始,集成方式非常「低效」。

它们实际上在模拟人类行为——截图、识别按钮位置、模拟点击、DOM抓取……

这种方式存在诸多痛点:

  • 成本高:一次简单的搜索可能需要数千token处理截图和解析页面;
  • 稳定性低:网站改版后,Agent可能因找不到按钮而「失效」;
  • 反馈慢:Agent必须反复「查看」屏幕以确认操作是否成功。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第5张

告别模拟,实现高效交互

如今,有了WebMCP,网站可直接向AI开放服务接口。Agent无需通过「前端视觉界面」,即可查询并执行服务。

WebMCP将取代传统的「屏幕抓取」(screen-scraping),实现更稳定、高效的页面交互和信息检索。

正如网友所言,AI Agent正成为网络的「核心参与者」。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第6张

在谷歌Chrome 146的官方文档中,为开发者提供了两种灵活的API接入方式:

  • 声明性API:执行可直接在HTML表单中定义的标准操作;
  • 命令式API:执行需要JavaScript执行的复杂、动态互动。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第7张

这两种方式让开发者为AI提供了一套直接的工具集,使Agent跳过视觉识别,直接访问网站背后的结构化函数。

谷歌软件工程师Khushal Sagar曾表示,WebMCP的目标是成为AI应用领域的USB-C接口。

WebMCP革新:AI与网页交互迎来革命 WebMCP AI交互 网页革新 Agentic UI 第8张