当前位置:首页 > 科技资讯 > 正文

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率?

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第1张

作者:彭堃方

编辑:吕鑫燚

出品:具身研习社

虽然具身智能领域的数据瓶颈尚未完全消除,但令人欣慰的是,我们正迎来一个前所未有的“数据平权”时刻。

长期以来,“数据饥渴”一直是阻碍行业发展的核心痛点。百万小时级别的优质数据集不仅极度稀缺,更是处于“望梅止渴”的探索阶段。其核心难点在于,金字塔顶端的真机数据在采集上存在结构性约束:机器人本体成本高昂、部署过程复杂、采集效率低下,且数据往往受限于特定的硬件构型。

在传统的路径中,遥操作面临量级难以突破的瓶颈,而拥有规模优势的仿真数据又存在难以填补的“具身差距”(Embodiment Gap)。

打个比方,数据就像是生存所需的食粮,但真机路径与仿真路径各有所缺,始终难以凑出一桌能让机器人“吃饱”的丰盛大餐。

如今,这一格局正伴随新技术的应用而发生深刻变化。

一个迈向规模化、多样化、高质量的真实数据采集方案已经成功跑通。它比仿真数据拥有更小的Gap,比传统遥操作具备更显著的量级优势:这就是UMI(Universal Manipulation Interface,通用操作接口)。

简单来说,UMI是一种通过手持夹爪、视觉传感器和位姿估计算法,将人类操作轨迹直接转化为机器人可学习数据的低成本方案。这一新范式有效解决了真机数采成本高、效率低、跨本体复用难及多样性受限等一系列核心痛点。

到2026年,我们计划建立起100万小时规模的具身真机数据产能。”鹿明机器人联席CTO丁琰博士在交流中表示。穹彻智能RoboPocket负责人吕峻博士也透露,他们已开启众包数采的小规模测试,“全员数采的时代,可能比我们预想中来得更快”。

从技术范式来看,UMI通过更低的门槛与更高的产出,让数据不再是少数巨头的专利。从生态建设来看,UMI让数据采集从封闭的工厂走向真实物理世界,覆盖了更多样化的真实任务场景。

UMI正在开启一场真正意义上的“数据平权”。

然而,在技术红利之下,新问题也接踵而至。低门槛的硬件数采是否会导致过度追求量级而忽视质量?如何在暴力增长中维持数据的高质量与多样性?

更深层次的问题是,对于具身智能的发展,UMI究竟意味着什么?

近期,UMI的升级与迭代产品密集发布。具身研习社对话了鹿明机器人联席CTO丁琰博士和穹彻智能RoboPocket负责人吕峻博士。透过技术视角,我们将深入剖析真实数据采集的现状与演进趋势。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第2张

UMI究竟是什么?

在斯坦福最初的论文定义中,UMI被描述为一种“夹爪+视觉系统”的软硬件数采方案:通过在人类操作末端部署轻量级传感器与摄像头,记录交互过程中的轨迹、时序及环境反馈。

随后,Generalist、Sunday等团队将UMI从实验室带入产业界,开启了大规模真机数据的高效生产。(Sunday联合创始人迟宬正是2024年UMI论文的核心作者之一。)

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第3张

国内方面,鹿明的丁琰博士曾反思传统遥操作的笨重与疲劳感,萌生了“卸掉机械臂,直接手持夹爪操作”的构想。2024年初UMI相关工作的成熟,恰好验证了他对前端操作轻量化的技术思路。

穹彻团队则从2021年起便深耕数采领域,在经历“数采工厂”模式的成本瓶颈、操作直觉缺失及场景单一等挑战后,逐步转向由“本体”到“外骨骼”再到“UMI”的去中心化采集路径。

因此,UMI在某种程度上是用人类的操作灵活性替代了机器人的本体束缚,让数据流从真实环境中自然产生。从形态定义上看,它更像是介于机器人数据(Robot Data)与人类行为数据(Human Data)之间的一种中间模态

必须指出,这三者并非简单的替代关系。领先的具身智能企业会根据自身需求,进行数据的混合利用与按需调度。

UMI之所以能让行业感到振奋,核心在于价格与效率的优势

一方面,它打破了“真机数据难以规模化”的行业定式;另一方面,UMI数据与模型训练之间已形成闭环,证明了此类数据在实际模型中的有效性。

这意味着,数据将不再只是“头号玩家”的专属资源

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第4张

以鹿明为例,其FastUMI Pro方案使数采成本相比传统遥操作实现了数量级的下降,采集效率提升了3倍。而穹彻智能则利用iPhone作为核心硬件,最大化复用现有智能终端,显著压缩了部署成本。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第5张

这意味着第二、三梯队的企业也获得了参与数据竞争的机会。同时,UMI实现了数据与机器人本体的解耦,同一套轨迹可以适配不同构型的硬件,极大地增强了数据的通用性。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第6张

过去几个月,UMI的数据质量曾饱受争议。曾有观点认为初期UMI数据的可用率极低。直到2024年底,伴随Generalist的GEN-0等模型的成功训练,这一路径的有效性才得到有力证明。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第7张

行业开始意识到,UMI的核心竞争力不在于“采得多”,而在于“治理得好”。数据必须在轨迹精度、时序一致性和画面质量等维度全面达标,才能支持具身交互的Replay。

为此,鹿明机器人建立了含8道工序的工业级质量评估体系,将数据有效率提升至95%以上。穹彻智能则通过“数据导师App”进行实时质量监控与下发任务指导,从源头确保数据的高质量。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第8张

吕峻博士提到,未来甚至可能面向普通用户推出低价硬件套装,通过众包模式获取更丰富的家庭场景数据。只有真正有用、高精度的真实数据,才能锻造出能够处理复杂操作的模型。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第9张

a16z投资合伙人Oliver Hsu曾指出,机器人落地的核心障碍之一是“分布偏移”。解决这一问题的最有效手段,就是让机器人学习更多样化的真实环境数据。

具身智能迈向“数据平权”时代:UMI技术如何重塑真机采集效率? 具身智能  UMI数采 机器人训练 数据平权 第10张

UMI技术的出现,本质上是为了解决数据多样性的贫瘠。通过摆脱机器人本体的限制,数据采集能够从实验室走向便利店、仓库以及普通家庭。这种“伴随式”采集让模型能见到真实世界中的光影变化与物理特性。

虽然UMI发展迅速,但它并非要完全取代真机遥操作。在重载、高危或特定工业场景中,遥操作依然具有不可替代性。未来的具身智能数据体系,更可能呈现出UMI数采与遥操作长期共存、优势互补的竞合状态。

总而言之,UMI并非昙花一现的技术奇观,而是针对具身数据瓶颈的一种结构性缓解方案。它让真实数据第一次具备了规模化、分布式和日常化的特征。这或许正是具身智能产业走向成熟、数据瓶颈被重新定义的关键信号。