作者丨苏建勋
在具身智能的浪潮中,“数据为王”已成为行业共识。
随着大语言模型如Chatgpt的崛起,“Scaling Law”成为了AI从业者的信仰。然而,在具身智能所触及的物理世界,互联网海量的数据参照并不适用。现实中的数据量,对于复现GPT时刻而言,显得捉襟见肘。
因此,如何高效、高质量地获取数据,成为了具身智能从业者亟需解决的问题。
近期,鹿明机器人公司在数据采集领域“玩起了新花样”。他们推出了全球首款背包版UMI数采设备FastUMI Pro(背包版),并计划在2026年投放1万台设备,覆盖工业、家庭、酒店、餐馆、商场、办公等六大真实场景,进行系统性数据采集。
FastUMI Pro采用UMI(通用操作接口)技术,由斯坦福大学、哥伦比亚大学与丰田研究所联合提出。与市场上的遥操数采不同,UMI可以与机器人本体解耦,使得训练出的数据更具通用性。
在一次媒体交流会上,鹿明机器人创始人兼CEO喻超分享了UMI与遥操的效率与成本对比:“同样是叠衣服这样简单的任务,遥操作数据采集需要50秒,成本3-5元,而使用FastUMI Pro只需10秒,成本低于0.6元。”
鹿明机器人成立于2024年9月,创始人喻超拥有近10年具身机器人研发经验,曾主导小米CyberDog的研发和千台量产。而联席CTO丁琰则是大陆最早做UMI的人,成功将UMI从实验室带入工业界。
2025年,鹿明通过自建数采中心,已实现10万小时的数据产能。喻超预测,到2026年,头部具身模型的数据规模将至少达到100万小时。
鹿明的目标是在2026年建立年采集百万小时的UMI数据产能。为了实现这一目标,他们正在采用更具规模化的手段进行数据采集。
“机器人训练数据本不应如此昂贵和稀缺。人类在物理世界作业过程中产生的数据无处不在,只是尚未被有效利用。”喻超表示。
背包版FastUMI正是为了解决这一问题而诞生的——它是一款便携的标准数采工作站,能够高效地将真实场景操作转化为高质量训练数据。
过去,具身数据采集多依赖于实验室或单一场景,这导致采集到的数据缺乏多样性,影响模型的泛化能力。鹿明机器人希望通过更轻便的数据采集方式,将采集工具直接集成到背包中,降低真实场景的数据采集门槛。
在具体应用场景上,鹿明机器人希望覆盖六大核心场景,细分30个小类任务,构建结构化、多维度的操作数据体系。
“采–训–推”一体化闭环能力是鹿明数据基础设施的核心。此次规模化数据采集的启动,正是依托于这一已全面打通的基建体系:依托FastUMI Pro,鹿明双臂具身机器人MOS在5小时内完成了从“数据采集-策略训练-模型推理”的工厂质检全流程验证;FastUMI Pro在合肥实地部署后,仅用7小时便完成了真实场景下的采集、训练与部署推理。
除了背包式采集工具外,鹿明还建立了一个“数据超市”,将采集到的数据转化为可流通的标准产品,让客户可以在官网上直接购买标准化操作数据。作为具身智能公司,鹿明的战略重点都围绕“数据”展开。
鹿明机器人的这一系列动作背后,实际上反映了具身智能当下最迫切的业务需求。
在一次媒体沟通会上,鹿明机器人联席CTO丁琰分享了对于数据和模型的看法:“我本身就是做模型出身的。在训练模型时,我们发现一个很大的问题:要想训练出优秀的模型,必须有一个完善的数据管线。”
“在了解行业真实发展现状后,我们决定如果要在模型和数据之间做选择的话,肯定先选数据。因为模型架构到最后比拼的是模型数据的质量。”丁琰强调。
具身智能的能力上限高度依赖于真实操作数据的规模与质量。当通用数据可以像硬件一样在线下单时,行业模型训练门槛将被显著降低。具身智能才能从定制化探索走向工程化生产。
“从万台设备同步开采到通用数据电商下单”,鹿明正在将“无处不在却未被收集”的物理世界操作数据转化为可规模供给的标准化基础设施。这将构建出一个数据驱动的生态系统。当数据不再稀缺时,机器人才能真正实现通用。”
end
本文由主机测评网于2026-07-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260748821.html