近期,豆包手机助手的亮相在国内移动互联网领域掀起波澜,其系统级权限需求也引发了诸多讨论。然而,正如早前文章所提,这类争议恰好推动了AI手机产业的演进与升级。
当业界仍在探讨“AI是否能够操作手机”之际,智谱公司迈出了关键一步。2025年12月9日,智谱宣布开源其核心AI代理模型AutoGLM,使得各类厂商、设备及开发者都能借此构建具备屏幕识别、点击、滑动和输入能力的AI代理。
雷科技认为,这一事件的意义远超“开源模型”这一简单概念。
在普遍认知中,AI助手已能聊天、总结和搜索,这些功能并不新鲜,行业增减此类工具差异有限。但AutoGLM不同,它并非用于聊天、问答或绘图的AI代理,而是AI能力组件的一部分。简而言之,AutoGLM是AI的视觉系统,能够理解屏幕并执行任务。
与尚不成熟的MCP方案相比,AutoGLM不依赖应用源代码,也无需开发者额外适配标签,而是像人类一样观察屏幕、解读按钮意义、推理界面逻辑,然后进行下一步操作。
此前文章曾提及,“AI操作手机”的传统方法依赖于无障碍标签或开发者接口,但由于多数开发者忽视无障碍标签,传统AI代理难以识别界面中的可交互元素。而AutoGLM采用的“GUI-Agent”方案避免了这种对开发者的依赖,让模型直接基于屏幕图像做出判断。
理解之后,执行成为AI的另一挑战。许多人认为执行仅是“点击”动作,但在实际场景中,这是一系列连续决策。按钮当前是否可点击?弹窗与底部菜单如何关联?页面跳转成功与否?是否需要返回?流程中断时从何处恢复?这些问题无法通过简单脚本录制解决,而要求模型具备自我纠正和规划能力。AI行业将这种连续长任务称为任务链。
任务链正是AutoGLM这类GUI-Agent方案的传统强项——AI无需遵循预设流程,而是在理解画面后自主规划操作路径,能在数十步的长任务链中稳定工作,不像早期代理那样容易迷失方向。
更重要的是,AutoGLM作为开源模型,其能力“可复制、可移植”。实际上,在豆包手机助手问世前,部分手机品牌已探索类似AI代理功能,如荣耀Magic系列。但拥有完整AI开发能力的手机企业仍属少数,大多数品牌需依赖外部供应商合作。
AutoGLM直接将这层能力转化为开放组件,使任何厂商都能在自家手机上实现这一链路。正是这种通用性,让AutoGLM在AI手机竞争中至关重要。
然而,即便是AutoGLM,也如同豆包手机助手一样面临“权限”问题。
AutoGLM的开源让许多人认为“具备能力加上厂商合作即可解决权限问题”。但遗憾的是,这一期望并不现实。权限争议本质上是系统规则问题,而非技术问题。
事件注入、屏幕读取和模拟输入均属系统高敏感权限,即使手机厂商愿意开放,也难以绕过应用自身的风控体系。风控体系作为互联网平台的“安全神经系统”,长期以来用于识别脚本和异常行为。当AI行为特征与脚本高度相似时,误判几乎不可避免。
但另一方面,尽管AI企业和手机品牌无法解决Android顶层结构的问题,AI算法与硬件品牌的合作仍然极为重要。系统层支持意味着AI能在更稳定环境中执行任务,无需借助各种技巧绕过系统限制;应用层支持则意味着未来可建立更标准化的代理识别机制,通过白名单、可信认证等方式让应用风控知晓“这是合法代理行为”,而非来源不明的自动点击。
即便从行业发展视角看,AutoGLM的加入也让消费者意识到——AI并非仅属于少数企业或个人的“特权”,而是每个人未来都能使用的“新能力”。循此思路,雷科技认为智谱开源AutoGLM的意义,不在于扩大“AI权限”争议,而是将“AI权限”问题公开化,通过培养用户习惯,使争议更加透明,最终获得公众认可。
模型开源后,AI手机会如何发展?雷科技认为,豆包手机助手、AutoGLM等技术的出现,可能在手机行业引入全新的“AI派系”概念。
简言之,在硬件同质化背景下,未来旗舰手机的竞争力可能从当前的“品牌差异”“软件差异”转向“AI差异”——哪个代理更稳定、更智能、覆盖更多实际应用,这些都可能成为新竞争维度。甚至在某些情况下,用户可能不再关心“手机使用什么系统”,而只关注“代理是否好用”。
无疑,AutoGLM的开源加速了这一变化。它使新竞争不再局限于头部厂商。许多中小手机品牌、操作系统厂商乃至定制硬件设备厂商,都可能因获得完整手机操作能力,而突然拥有以往无法企及的差异化空间。
在雷科技看来,这也意味着未来手机生态结构将从“品牌 + 系统”演变为“品牌 + 系统 + AI”。三者关系将日益类似当前的“芯片架构”,成为完全独立却决定体验上限的关键层。
实际上,无论是豆包手机助手还是新开源的AutoGLM,用户“紧张”归根结底源于对AI的不信任与不了解。经过十多年发展,智能手机硬件、软件和交互逻辑已高度固化。对手机用户,尤其是推崇开放的国内Android用户而言,我们已习惯“亲力亲为”。突然引入一个与用户“平等”的AI代理,难免给手机用户带来“思维冲击”。
以小红书分享为例,不少用户认为“AI可查询银行余额”非常惊人。但从技术角度,这只是AI在用户授权下的一次简单流程化操作。
当然,也有部分用户并非不信任AI,而是不信任国内互联网环境。对此,雷科技确实无能为力:在国内移动互联网野蛮生长时期,部分企业确在便利性与隐私之间选择了前者。
但从另一角度看,豆包手机助手与AutoGLM开源模型共同引发的AI手机时代,恰为国内移动互联网提供了纠正过往的机会。手机GUI-Agent的出现将我们带入行业规则的“真空区”,而我们当前最需做的,正是以先行者身份,为这一“规则真空区”建立透明且强制的行业规范,让技术真正展现其价值,为用户服务。
从当前趋势看,AI操作手机已从单点突破进入生态共建阶段。权限问题将通过新协议、新链路、新机制逐步解决,系统与App的关系也将因代理机制成熟而重新定义。手机的未来,因AI加入,将从“人操作机器”迈向“机器替人操作”的新阶段。
如果说智能手机前二十年是将桌面互联网浓缩于掌中的二十年,那么接下来十年,很可能将是“操作权”交给AI的十年。而AutoGLM的开源,正是这场手机变革的新起点。
本文由主机测评网于2026-02-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260223642.html