“VLA模型被视为一种较为基础的架构。”
在2025年8月9日北京举行的2025世界机器人大会上,宇树科技的创始人兼CEO兼CTO王兴兴在演讲中表达了他的这一观点。尽管他讨论的是具身智能大模型,但这一观点引发了智能驾驶领域内关于未来模型发展方向的热烈讨论。
极佳视界的CEO黄冠也对此表示了“不太专业”的看法,认为这一观点“过于简单”。
王兴兴相信,世界模型可能是更合适的技术路径。然而,在接下来2到5年内,“最大的机会仍是一个端到端的具身智能AI模型”。
大会上,他从核心瓶颈、新兴技术引擎及未来技术重心三个方面,对具身智能机器人的发展态势进行了梳理与分析。下面,我们来看看这位行业领袖的观点,思考其可能带来的启示。
谈及机器人未大规模应用的原因,很多人错误地认为是硬件性能不足或成本过高。但王兴兴指出,当前机器人硬件(包括人形机器人的灵巧手、整机等)已基本满足需求。
从技术的角度来看,人形机器人的硬件,如灵巧手和整机等,已足够满足基本需求,尽管在工程实施上仍面临诸多挑战,但已能支撑基础功能的实现。
他认为,限制其大规模应用的核心瓶颈在于具身智能的AI大模型尚未成熟。
王兴兴认为,当前的机器人大模型(具身智能)发展阶段类似ChatGPT发布前的1到3年,即业界已明确方向和技术路线,但尚未突破关键临界点。
在他看来,之所以没达到关键临界点,主要是因为行业对“数据”的关注度过高,却忽视了模型本身的问题。
王兴兴认为,具身智能发展的关键问题在于模型架构不够完善、缺乏统一性、泛用性,导致能力受限,而且数据还不能完全利用起来。
以当前备受关注的VLA模型为例,王兴兴认为其是“相对基础的架构”,在真实世界交互中,对数据质量的依赖过高,但适应性不足。因此,他对VLA模型的应用前景持怀疑态度。
此外,“VLA模型+RL训练”也是行业常见的优化思路,但他认为实践表明这仍不够。“模型架构必须进一步升级,不能停留在简单组合层面。”王兴兴这样强调。
在王兴兴看来,另一个限制发展因素是“RL Scaling law(缩放定律)”的缺失,这导致机器人尚未解决“从零开始”的难题。他认为,目前机器人在学习新任务时,例如学习一支新的舞蹈或完成一项新的工作,往往需要从零开始训练,这导致了训练效率的显著低下。这是由于机器人控制中“RL Scaling law(缩放定律)”的缺失造成的。
在王兴兴看来,具身智能的理想状态是“新任务训练基于旧有基础,速度越来越快、效果越来越好”。这一规律在语言模型中已得到充分验证,而在机器人运动控制领域,尚处于起步阶段,不过展现出巨大的潜力,是值得行业深入探索的关键领域。
既然VLA模型尚待完善,那么什么样的模型才是未来的发展方向呢?
王兴兴认为,现阶段视频生成模型的路线可能比VLA模型更快、更有可能实现。
其核心逻辑在于:利用视频生成模型预先“模拟生成机器人动作序列的视频”,进而直接指导实体机器人执行相应动作。例如,若指令为“整理房间”,模型可先生成机器人整理房间的虚拟视频,再将视频中的动作转化为实体机器人的控制信号。
然而,王兴兴也指出这一路线存在一个现实问题:当前视频生成模型过度关注“视频质量”,导致GPU消耗较高;但对机器人而言,无需高精度视频,只要能驱动动作即可。这一矛盾仍需解决。
王兴兴预测未来2到5年内,具身智能机器人的发展将聚焦三大方向:
一是统一的端到端智能机器人大模型。端到端模型是提升机器人能力的关键。未来需重点推动端到端模型的研发,实现“基于既有训练基础快速学习新技能”,提升模型的通用性和效率。
二是更低成本、更高寿命的硬件及批量制造。硬件的优化亦是不可或缺的一环。即便是历经百年发展的汽车行业也仍需不断攻克工程领域的重重难关;对于未来可能达到“数百万、数千万台”量级的人形机器人而言,“低成本、高寿命”及“超大批量制造”的工程挑战必须解决。
三是低成本、大规模的分布式算力网络。由于机器人本体受限于尺寸和电池容量,无法部署大规模算力(其峰值功耗通常仅约100瓦),因此未来需要构建分布式算力网络。例如工业场景中可在工厂内部署局部服务器集群供百台级机器人就近连接降低通信延迟;再如民用场景中(如小区)可建立区域级算力集群减少用户算力建设成本同时保障延迟和安全性。
在会后采访中当被问及机器人价格预期时。王兴兴表示当机器人具备大规模作业能力时甚至可能会免费因为“每台机器人出厂后都可以缴税”。
他举例说一台机器人做什么活就可以从其生产价值中直接扣税。譬如若有一片荒芜之地企业派遣机器人前去开垦耕作那么机器人所创造的部分价值将直接转化为税收。
“这个过程快的话可能只需2到3年慢的话可能需要3到5年但我认为这波浪潮的到来大概率不会超过10年。”王兴兴这样说道。
本文由主机测评网于2026-04-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439278.html