在高通组织的这场行业聚会上,王兴兴毫无保留地分享了她的深刻见解。
当前机器人领域的技术路线各不相同,导致表面看似繁荣,但实际进展并不显著;
既然目前各家公司开发的模型都无法直接部署使用,那不如以开放态度共享出来,就像OpenAI早期开源GPT-1和GPT-2那样;
宇树科技前几天开源的世界模型,同样无法直接在工厂环境中落地应用;
现在许多机器人和芯片制造商都低估了芯片对于机器人发展的重要性;
手机芯片等类似移动芯片应用到机器人身上,具有非常广阔的想象空间。
侯纪磊与王兴兴的深度对话
所有终端设备都被AI和智能体赋予了新的可能性,由于足够新颖,具身智能成为受影响最大的领域之一。但也正因为足够新,具身智能的热闹表象下必然存在诸多争议与挑战。
宇树科技,作为长期备受关注的明星企业,此时将行业中的众多难题直接剖析开来。
或许原因无他,而是高通组织的这次聚会太难得了。2025骁龙峰会·中国,汇聚了国内外终端领域的核心参与者,覆盖上下游产业链。在这里开诚布公讨论的问题,或许即将成为行业最关注的热点,从而能更快得到解决。
不止王兴兴,来自硬件、模型、操作系统等各层面的参与者,也都畅所欲言、无所不谈:
理想汽车副总裁、智能空间研发负责人勾晓菲
面壁智能CEO李大海
中科创达联合创始人、执行总裁耿增强
侯纪磊与行业实践者的对话
高通全球AI研发负责人侯纪磊与他们进行了深入交流。
为完整呈现各位专家的思考和理解,我们在不改变原意的基础上将对话内容进行了整理,希望您能从中获得启发。
智能体落地终端的终极想象,或许就是具身智能。
宇树科技创始人、CEO、CTO王兴兴表示,他们的目标仍然是希望将通用的AI技术应用于通用的机器人上,以执行各种任务,无论是在工厂还是家庭环境中。
当机器人能在未知环境中,凭借自然语言指令完成任务时,就是机器人的ChatGPT时刻。
他将这个目标拆解为几个阶段逐步实现:
1、固定动作演示 → 已实现(如舞蹈、武术)。2、实时生成任意动作 → 预计最快今年底或明年初实现。3、在陌生场景执行任务 → 预计明年底左右能够做到(如取水、整理桌子)。4、高成功率与精细操作 → 需要再经过数年,目标是接近99.9%的成功率,能够完成拆装手机等细致任务。
示意图
如果希望机器人能够实现这些功能,一个至关重要的挑战是对物理环境、自然语言指令的实时理解和处理,这対于端侧AI的通信能力提出了更高要求。
王兴兴指出,通信环节至关重要。
目前我认为包括许多机器人厂商或芯片厂商,都有些忽视芯片对于机器人的重要性。
就像新能源汽车一样,最近十几年的最大变化之一是随着新通信协议的出现,线缆数量大幅减少。早期一辆传统燃油车的线缆数量非常惊人,可能整车线缆重量就达100公斤。
在机器人领域情况类似,一条通信线缆通常包含4根或5根线,有时为了减少电线数量需要耗费大量时间和精力。因为对于一台机器人来说,性能不断提升、可靠性不断增强,降低线缆数量是关键。迄今为止,工业机器人最常见的故障就是线缆问题,可能占比高达60-70%。
对于机器人而言,减少线缆数量的核心在于提升整体通信协议、改善通信质量。
我相信未来机器人的终极形态是每个手臂上仅有一根线缆,其他全部简化,多么整洁,实现这一目标还需大量工作,但这非常值得投入。
此外,在底层芯片方面,王兴兴提到了终端难以部署大规模算力的难题。
机器人本身空间有限,很多时候高算力的芯片根本无法安装进去;同时电池容量、散热问题,对于这类大型机器人来说都是艰巨挑战。
示意图
他认为未来具身智能所需的算力,峰值功耗最好控制在100W以内,平均正常功耗可能只需20-30W,大致相当于几部手机的功耗。
功耗过高是不可行的。我认为手机芯片等类似芯片应用到机器人身上具有极大的想象空间。
目前行业处于黎明前夜,前夜往往是最具挑战的时期。最大问题是行业内各家技术路线差异很大,各有各的想法,这导致领域看似热闹,但整体进展并不快。
当前若要真正打造出适用于具身智能的通用AI模型,在此阶段,大家仍可保持更开放的态度,反正各家做出的模型都无法直接部署应用,不如更开放一些。
前段时间宇树开源了一个基于视频生成的世界模型,不仅是权重参数,包括模型架构、数据集、训练源代码、部署源代码全部开源。
宇树开源模型
王兴兴表示,这个模型真正应用于工厂或日常生活时还不能直接使用,那不如开源出来。这有点像OpenAI早期阶段,因为大模型的商业价值或落地距离尚远,GPT-1、GPT-2都是开源的。
我们也希望通过更多开源举措,推动这一领域共同进步。
至于当前常被讨论的VLA模型与世界模型之间的关系,说实话很难清晰界定,因为即便是VLA模型、世界模型本身也存在众多变种。我们公司将保持开放态度,尝试各种模型,包括自主开发以及与第三方合作等。
我个人认为在AI领域应保持谦逊,永远有更聪明、更开放的人做出更好的成果,我们应以谦逊态度学习。
有时我还希望应该尽量忘记过去多年的经验,不被过往限制思维。
我们的目标是让机器人真正在家庭和工厂中发挥作用。我认为无论是芯片、通信协议、算力、通信架构、甚至是整个无线通信架构都可能需要调整。
包括安全问题。现在机器人销量日益增长,有些黑客专门针对我们的机器人进行破解,这让我们非常困扰。
在机器人领域尚未成熟之前,可以从许多其他领域借鉴经验,包括手机、新能源汽车等,以建立更规范的体系、进行数据采集、模型训练等。
当前这个领域确实太新了,我们每时每刻都会面临新的挑战和问题,这不是单家公司能解决的。我们也希望更多人参与解决问题,例如我们通常使用的Linux系统本身仍存在漏洞,在开发时需要彻底修复底层漏洞,这相当耗时,如果有一家第三方公司能解决这些问题,我们非常愿意合作,这是一件极具价值的事。
智能体本质上是大模型的应用形式,目前Agent的形态更偏向云端,但随着落地趋势推进,端云协同将成为必然。
面壁智能CEO李大海认为,端云协同已是行业共识,这样能提供更佳用户体验。云端相较于端侧可提供近乎无限的算力和资源,负责解决复杂问题;端侧离用户更近,它需要响应速度极快、同时保障用户隐私。
端侧有一个显著优势,就是“永远在线”,它可以持续感知环境、实现基于设备隐私的上下文理解、协同云端不同Agent进行组织协调以完成复杂任务。
具体到实际终端,比如在汽车座舱内,就应具备较强的端侧模型,它能理解用户需求然后与云侧模型沟通。
举个简单例子,如果在座舱内通过端侧模型感知到后座小朋友哭闹,就可以通过端侧先启动云端较强的语言交互模型,询问是否要聊天分散注意力,或讲个故事。但这个启动过程必须由端侧判断,而非让云侧始终有模型监视座舱内情况,这对隐私暴露风险极大。
示意图
我认为终端的端侧模型未来实际上是整个Agent系统里最核心的协调者。
那么未来AI行业对端侧模型的需求是什么?
李大海认为,必须不断提升端侧模型的知识密度。
因为端侧模型部署在各种硬件设备、进入千家万户并与不同用户场景互动,它需要具备优秀的自主学习能力,尤其是基于探索内容进行自我迭代和个性化发展。所以端侧模型提升知识密度至关重要,面壁智能提出了知识密度每三个月翻一番的观点。相对而言,云侧模型更关注智能水平提升,二者差异明显。
在模型自我发展的同时,与芯片、终端、系统之间也应深化协同。
在此过程中,李大海强调深度合作的重要性。
从端侧模型公司角度,我们与高通这类芯片厂商有深度合作,只有通过这种深度合作才能充分发挥端侧模型的知识密度,以更低功耗完成相同工作。
此外在应用侧,他认为目前仅有MCP这一种智能体协作方式显然不够,还需要更多基于用户认证的、安全的协同方式,这些是移动互联网时代已建设的基础设施,现在需要在AI时代重构。
终端硬件是Agent的物理载体,由于Agent的出现,手机、PC、汽车等硬件终端都焕发新生。
对于汽车而言,它本身已处于智能化升级进程中,Agent的到来使这种升级更全面深入。
理想汽车副总裁、智能空间研发负责人勾晓菲认为,汽车实现自动驾驶是行业基本共识,实现自动驾驶后,汽车空间内能提供怎样的服务将成为各家车企的差异化竞争手段。
示意图
AI孕育了巨大机遇,它有望将看似割裂的生态整合起来。实际上许多终端当前都是生态孤岛,比如PC交互依赖鼠标键盘加图形界面,手机交互基于触控,AI这种基于对话的、更自然的交互将成为跨终端的统一交互模式。
现在大家都在谈论Agent,Agent究竟是什么?
今天当人们谈论Windows时,默认Windows背后有大量服务;谈论安卓时,也默认安卓背后有大量服务。同理,未来用户选择使用哪个Agent,实质是看它究竟能带来多少服务。
今年理想汽车也聚焦于此,理想同学作为理想汽车的Agent,它接入了大量与汽车出行相关的服务。今年我们还开始接入车内空间以外的生活场景和服务,比如让理想同学点咖啡、交水电费、叫代驾等。它将覆盖更广泛的服务,我们相信未来用户选择Agent的核心与现在选择操作系统的逻辑一致。
谈及Agent的服务能力,满足用户需求是一方面,更关键在于如何让Agent应用、操作系统和底层硬件紧密协同,从而提升应用体验。
中科创达联合创始人、执行总裁耿增强认为,现阶段AI在不同设备上的应用高度碎片化。底层芯片不同、运行操作系统各异、上层模型和Agent框架也不统一。这导致行业内存在众多组合方案,重复开发成本高,缺乏统一标准。
核心问题仍是缺乏跨终端通用的AI OS或统一的Agent Framework。尽管目前MCP、A2A已取得一定进展,但距离形成行业公认标准还很远。
示意图
但可以确定的是,未来在Agent的“串联”下,仍可形成跨终端的操作系统,提供无缝流转的智能服务。
这种新时代OS的架构,可将云端视为巨大的Cloud OS,各终端就是Agent,与Cloud OS协同工作,跨平台部分由Cloud OS实现。从单设备看,传统Linux、Android等系统将被视为虚拟化层,AI是一种全新UI,必然催生新的AI OS。
聚焦于厂商该如何行动,实质仍是产业共建、协同合作。
耿增强认为,许多事需要“自然发生”,但行业可共建一些基础设施。例如中科创达已与高通共建智能汽车创新中心、智能物联网创新中心,通过这两个创新中心支持智能汽车和智能物联网不同设备中终端厂商的共同客户及生态伙伴。
在AI方面,中科创达与火山引擎成立理想智能汽车混合AI联合实验室,将火山引擎的云上AI和中科创达的端侧AI形成混合式AI方案,经高通平台优化后可更好支持设备厂商和客户创新。
目前仍聚焦单设备智能,但下一步将走向设备间的Agent协作。
本文由主机测评网于2026-01-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114744.html