当前位置:首页 > 科技资讯 > 正文

豆包手机助手AI能力调整:技术突破与生态博弈

豆包决定采取策略性收缩,调整其AI操作手机的能力。

12月5日,豆包手机助手团队发布《关于调整AI操作手机能力的说明》,宣布将限制AI在刷分、刷激励场景的使用;暂时下线AI操作银行、互联网支付等金融类App的能力,并计划与相关厂商沟通共建安全操作准则;同时,部分涉及竞技排名的游戏场景,AI操作能力也将暂时下线。

豆包手机助手团队表示,此举旨在“在技术发展、行业接受度和用户体验之间做好良性适配”,可以说是对近期争议的一种回应和调整。

值得一提的是,这款由字节旗下豆包团队与中兴通讯联合推出的nubia M153工程样机,已成为近期手机圈的热点话题。官方售价3499元,但在二级市场价格飙升至上万元。其搭载的豆包手机助手技术预览版,深度嵌入底层操作系统,实现了与系统的无缝交互。

这仿佛是iPhone搭载的Siri梦寐以求的功能,Siri未能实现的愿景,如今被豆包率先体验。

最初,我对此持怀疑态度。毕竟字节过往的硬件尝试,往往给人虎头蛇尾的印象:坚果手机旨在成为抖音入口,TikTok Lite手机为了预装TikTok,Pico VR则是押注元宇宙。在字节的布局中,所有硬件似乎都只是“手段”,而非“目的”。一旦战略重心转移(例如元宇宙退热,AI兴起),这些硬件便迅速边缘化。

用户能感受到这种“工具化”倾向——你并非真心致力于打造优质硬件,而只是想推广你的服务。因此,当推出AI手机时,我最初认为这不过是为了推广豆包大模型、抢占系统入口的另一举措。

但深入了解豆包手机助手的技术细节和战略意图后,我意识到,这可能并非又一次“机会主义”尝试,而是字节意图“建立新规则”的真正努力。

如果成功,字节将深入“任务执行”的复杂领域,从“内容帝国”转型为智能服务的关键一环,从而彻底摆脱对流量曝光的依赖,在实体经济中扎根,成为中国互联网的重要一极。

然而,这次尝试必然引发诸多争议,豆包的策略性收缩是不可避免的。甚至可以说,豆包原本不必如此匆忙行事。

01

一场豪赌:“AI原生手机”野心

从技术视角看,豆包手机助手的核心创新在于将AI“植入”手机操作系统的底层,而非仅作为应用层工具。这种“类人操作手机”的能力,使其能真正打破应用间的壁垒,自动完成从订餐、比价到通信的各类复杂任务。

值得注意的是,这是豆包首次与手机厂商在操作系统层面合作推出的手机AI助手,其关键在于让AI直接控制系统、实现跨App任务执行、并与硬件按键深度互动。

豆包手机助手在豆包App基础上,与手机厂商进行操作系统层面的深度整合,拥有视觉感知、长期记忆和操作能力,体现了AI原生手机的真实形态。

关键在于,豆包此次选择与中兴通讯合作,推出nubia M153工程样机,而非自主研发硬件。官方明确表示,豆包暂无自主开发手机的计划,目前正与多家手机厂商推进合作。

测试视频显示,豆包手机助手能自动比价下单、调用优惠券、完成跨平台支付等操作。但在这炫酷功能背后,是对用户操作习惯和敏感信息的深度监控。

豆包手机助手目前主要依赖“读屏”技术——即AI实时监控用户手机屏幕,观察微信聊天内容、支付宝余额等,并模拟用户点击操作。这种方式虽能实现跨App功能整合,但隐含的隐私风险令许多用户担忧。

豆包手机助手AI能力调整:技术突破与生态博弈 AI手机助手 系统级整合 生态壁垒 ANP协议 第1张

有用户直接评论:“各种敏感信息不仅手机厂商知晓,字节也了如指掌,例如微信通讯录,这难道不令人担忧吗?”

尽管其他手机厂商也在推进自动化手机Agent技术,但关键区别在于:小米、荣耀、vivo的核心业务在硬件领域,不像字节那样重度依赖广告和跨平台数据变现,因此缺乏“原罪感”,用户不会觉得其行为数据被用于广告推荐等。

所以当豆包宣称“我要打造一个为你服务的AI”时,公众第一反应不是信任,而是质疑:“这背后是否隐藏着更高级的数据收割机制?”

毕竟,从字节的商业模型看,一个能跨App自动订机票、购手机、订餐厅的AI Agent,最可能的盈利方式是在比价和推荐环节嵌入商业利益。例如,当用户要求“找一款便宜可靠的笔记本”时。

而在用户眼中,传统硬件厂商并无此类动机,用户对其的期望仅限于“制造优质手机”,不会认为其意图监控数字生活。

在此热议中,对豆包手机AI的评价呈现两极分化:一方视其为打破“APP孤岛”的技术先锋、开启AI OS时代的革命者;另一方则认为豆包“以AI越界”,表现出对隐私的深切忧虑。

02

生态孤岛:当巨头们不愿开放城门

如果说技术挑战可通过产品迭代解决,那么生态壁垒则是字节面临的核心难题。

微信、淘宝、美团会轻易开放接口,让豆包AI自由调用吗?

答案很可能是否定的。

豆包发布AI手机后不久,网络便传出使用豆包操作微信时,微信强制退出登录的情况。

随后,淘宝、中国农业银行、中国建设银行等APP相继实施针对性风控措施,导致豆包AI助手无法登录、支付失败等。外界普遍认为,这是上述APP对豆包AI助手跨应用操作的反制。

尽管豆包事后声明,豆包手机助手需经用户授权才能执行手机操作任务,支付环节、身份验证等任务会暂停并由用户手动完成授权,但豆包“以AI犯禁”的讨论已迅速发酵。腾讯无法容忍微信被管道化,很可能以安全为由进行干预。

豆包手机助手AI能力调整:技术突破与生态博弈 AI手机助手 系统级整合 生态壁垒 ANP协议 第2张

从技术角度深入分析,这个“系统级”AI的核心在于一个关键权限:INJECT_EVENTS。

INJECT_EVENTS是Android系统中的顶级权限之一,相当于赋予AI一把“万能钥匙”。普通App(如抖音、微信)无法获取此权限,因为它能模拟真实的手指点击、滑动、输入——仿佛有一个隐形人在替你操作手机。

此权限有一硬性规定:必须由手机厂商的系统私钥签名才能启用。

简言之,中兴作为手机厂商,在系统底层为豆包开具“通行证”,以自身“官方印章”为豆包APP认证,使其获得超越普通APP的权限。

实际上,除努比亚这类市场份额较低的厂商可能愿意与豆包进行深度系统权限合作外,多数手机厂商均有自有AI战略,不太可能对豆包做出此类系统级让步。

例如,华为在2025年全面升级小艺助手,推出端侧大模型+云端大模型的双引擎架构。小米的小爱同学升级至6.0版本,能实现跨应用操作和自动化任务执行。

OPPO的小布助手获得系统级权限,支持语音控制拍照等核心功能。vivo的Jovi发布智能体2.0版本,具备记忆用户习惯和主动服务能力。

虽从技术上讲,荣耀的YOYO及智谱的AutoGLM也能实现系统级整合及自动化操作,如自动点咖啡、微信发红包等,但关键区别在于“厂商研发AI”与“互联网巨头涉足手机”的本质不同。

荣耀作为手机厂商,推广AI Agent用户视为理所当然,如同特斯拉推进自动驾驶——这是其本职。但字节作为中国最成功的注意力经济公司,其算法、推荐、广告模式已被众多“友商”研究和防范。

一旦字节声称“我要打造一个为你服务的AI”,即便仅试水3万台,也被“友商”视为对现有互联网秩序的一次试探性进攻。

这种“城门失火,殃及池鱼”的担忧,将使字节的开放生态战略面临巨大阻力。

03

破局机会:用户痛点与技术的东风

然而,困境中仍存机遇。豆包此次尝试的最大价值在于,它精准捕捉了当前移动生态中用户的痛点。

现今手机使用体验中,各种开屏广告、植入广告造成严重干扰,启动APP需跳过5秒开屏广告,应用间跳转体验糟糕。

此外,某些广告、优惠的关闭图标(即小“X”),时常尺寸过小、难以点击,意图关闭却误触打开。

正是这种“割裂与骚扰”并存的体验,为豆包AI手机撬动用户需求提供了突破口。

若豆包手机AI真能实现自动下单、比价,助用户跳过开屏广告;自动填写砍价链接而无须强迫分享;甚至聚合多平台优惠——那它正是在消除噪音、减少数字生活中的琐碎摩擦。

这种“省心省力”的体验,恰是当前安卓/iOS生态所缺乏的,连Siri也难以做到。

在我看来,ANP(Agent Network Protocol)协议可能是字节突破当前生态困局的关键。

2024年,ANP协议开源技术社区提出此概念,旨在为数十亿智能体建立统一连接方式。ANP的愿景是构建开放、安全、高效的智能体网络,允许任意智能体间无缝通信与协作。

豆包手机助手AI能力调整:技术突破与生态博弈 AI手机助手 系统级整合 生态壁垒 ANP协议 第3张

ANP协议的技术原理类似互联网的HTTP协议,它定义了智能体间的通信标准与数据格式。

例如,若每个AI应用拥有唯一“智能体ID”,当豆包手机助手需调用微信功能时,无需直接读取微信界面,而是向微信智能体发送标准化请求指令,避免隐私窥探,实现智能体间的“标准化合作”。

如此一来,即使腾讯、阿里等大厂在各自生态内构建专属Agent,也不会重陷“APP孤岛”境地,而是能通过标准ANP协议互调功能。

若ANP协议能成为行业通用标准,所有App按规开放接口,字节的这步棋便真正盘活。

但现阶段,豆包不宜过于急切,与其孤军深入,不如推动行业共商标准,达成互联互通协议。

毕竟,技术本身是冰冷的,而社会充满人情。当代码触及人心、算法面对信任,摩擦不可避免——真正的创新,不在于速度多快,而在于能否在摩擦中开拓一条被接纳的道路。