当前位置:首页 > 科技资讯 > 正文

谷歌Gemini AI新策略:AI助手操控第三方应用

只需一句话,AI助手便能通过手机调用第三方App,为你完成点奶茶、订餐厅、买车票等任务。随着AI视觉、智能体、MCP等技术和标准的不断进步,手机上的AI终于开始展现出其实用性。国内Android厂商纷纷探索AI自主操控第三方App后,谷歌也加入了这一行列。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第1张

01

据最新消息,谷歌本周一更新了Gemini AI的新策略,允许Android系统访问第三方应用。据悉,谷歌已通过邮件通知用户这一调整,无论是否开启或关闭Gemini的应用活动,都将赋予其访问权限,包括WhatsApp等第三方应用。

值得注意的是,谷歌强调“人工审核员(包括服务提供商)会阅读、注释和处理”Gemini访问的数据,但并未提及用户如何彻底移除Gemini集成的方法。此外,谷歌在邮件中仅提到Gemini“不会保存72小时前的活动记录”,这种模糊表述引发了用户对于Gemini处理与第三方应用交互时产生的数据的疑虑。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第2张

针对用户疑虑,谷歌表示,“这一更新对用户是有益的。现在,他们可以在关闭Gemini应用程序活动的情况下,在移动设备上使用Gemini完成日常任务,如发送消息、发起电话呼叫和设置计时器。当Gemini应用程序活动关闭时,其聊天不会被审查或用于改进AI模型。”

值得一提的是,在谷歌宣布Gemini支持与第三方应用交互前,荣耀已在MagicOS 9.0上实现了一句话让AI自主操控第三方应用。荣耀采用纯视觉方案,无需第三方应用适配。而谷歌此次则通过Gemini调用第三方应用的API接口,简化了感知、决策和执行过程。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第3张

02

为何谷歌不采用纯视觉方案?

事实上,让AI像人类一样操作电脑、手机的解决方案始于Anthropic的“Computer Use”功能。然而,如今AI业界的主流是MCP(模型上下文协议),即通过标准化协议让AI调用外部工具。放弃纯视觉方案的原因很简单,因为效率远低于MCP,强行让AI适配人类的交互方式得不偿失。

然而,AI直接通过API调用第三方应用会带来明显的数据泄露风险。并非所有人都愿意相信谷歌的“节操”。近年来,科技巨头对AI的态度已明朗化,纷纷将AGI(通用人工智能)作为首要目标。对于训练更强大AI模型所需的数据基石,各显神通。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第4张

例如,Meta重拾搁置的人脸识别技术,准备将智能眼镜作为数据采集工具;亚马逊Echo智能音箱只允许用户将所有语音记录发送至云端;苹果、英伟达未经授权使用YouTube视频来训练AI;Anthropic使用盗版图书库打造Claude大模型。不难发现,各厂商为了收集数据训练更强大的AI,都在打擦边球。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第5张

03

尽管存在疑虑,但大多数用户仍会接受谷歌的这一决策。毕竟,Gemini与第三方应用的交互潜力巨大,可能改变用户使用Android系统的方式。

早在2017、2018年,Android阵营曾掀起智能语音助手浪潮。然而,仅两年后,智能语音助手便迅速过气。原因在于其实际效用有限,仅局限于定闹钟、打电话、打开App等简单操作。面对复杂指令时,会陷入“鸡同鸭讲”的死循环。

谷歌Gemini AI新策略:AI助手操控第三方应用 Gemini AI 安卓系统 第三方应用 数据隐私 第6张

“即圈即搜”是Gemini交互第三方应用的一个体现。它通过视觉模型识别用户圈选内容,并调用谷歌搜索API直接呈现内容。试想,如果只需动动嘴皮子,搭载了Gemini的Android手机就能帮你完成点咖啡、订餐厅等任务,将带来怎样的体验?

因此,在数据可能被谷歌用于迭代Gemini与允许Gemini调用第三方应用带来的便捷之间权衡时,相信会有不少人选择用隐私换取便利。这一回,谷歌真的“借鉴”了中国的创新。