作者丨苏建勋
在智能科技的浪潮中,“数据为王”已成为具身智能领域的金科玉律。
借助海量数据的滋养,大语言模型如Chatgpt应运而生,“Scaling Law”更是成为AI从业者的信仰。然而,在具身智能所涉的实体世界,互联网上的数据浩如烟海似乎遥不可及。无论是人类还是机器人,在现实中所能获取的数据量,都远远不足以复现GPT的辉煌时刻。
因此,如何高效、高质量地获取数据,成为了具身智能从业者当前的首要任务。
近期,一家机器人公司——鹿明机器人,在数据采集领域玩起了“新花样”。他们推出了全球首款背包版UMI数采设备FastUMI Pro(背包版),并计划在2026年投放1万台设备,覆盖工业、家庭、酒店、餐馆、商场、办公等六大真实场景,进行系统性数据采集。
FastUMI Pro不仅是一款创新的采集工具,其背后的“UMI(通用操作接口)”更是引人注目。UMI是由斯坦福大学、哥伦比亚大学与丰田研究所联合提出的低成本数据收集与学习框架,能够解耦机器人本体,使得训练出的数据不仅局限于某一特定形态。
在一次媒体交流会上,鹿明机器人创始人兼CEO喻超分享了UMI与遥操的效率与成本对比:“同样是叠衣服这样的简单任务,遥操作数据采集需要50秒,成本3-5元,而FastUMI Pro仅需10秒,成本低于0.6元。”
鹿明机器人成立于2024年9月,创始人喻超拥有近10年的具身机器人研发经验,曾主导小米CyberDog的研发和千台量产。而此次FastUMI Pro的推出,正是鹿明在数据领域的又一次重要布局。
2025年,鹿明通过自建数采中心的方式,已实现10万小时的数据产能。喻超预测,到2026年,头部具身模型的数据规模将达到100万小时起。
鹿明的目标不仅是量的积累,更是质的飞跃。他们计划在2026年建立年采集百万小时的UMI数据产能,这意味着更规模化、更多样化的数据采集。
“机器人训练数据不应如此昂贵和稀缺。人类在物理世界作业过程中产生的数据无处不在,只是尚未被有效收集。”喻超表示。
FastUMI Pro正是为了解决这一问题而生——它是一款便携的标准数采工作站,能够高效地将真实场景操作转化为高质量训练数据。
此前,具身数据采集多依赖于实验室或单一场景,这导致数据缺乏多样性。而鹿明机器人希望采用更轻便的数据采集方式,将采集工具直接装进背包,降低真实场景的数据采集门槛。
在具体场景上,鹿明机器人希望覆盖六大核心场景,细分30个小类任务,构建结构化、多维度的操作数据体系。
“采–训–推”一体化闭环能力是鹿明数据基础设施的核心。此次规模化数据采集的启动,正是依托于这一已全面打通的基建体系:依托FastUMI Pro,鹿明双臂具身机器人MOS在5小时内完成从“数据采集-策略训练-模型推理”的工厂质检全流程验证;FastUMI Pro在合肥实地部署后,仅用7小时便跑通真实场景下的采集、训练与部署推理。
除了背包式的采集工具外,鹿明还建立了一个“数据超市”,将采集到的数据转化为可流通的标准产品。作为一家具身智能公司,鹿明的战略重点都围绕“数据”展开。
鹿明机器人的这一系列动作背后,实际上反映了具身智能当下的“痛点”需求。
“我之前一直在训模型,发现了一个大问题:要想训好模型,必须要有一个好的数据管线。”鹿明机器人联席CTO丁琰在媒体沟通会上分享了他的感悟。
“因为模型架构拼到最后,拼的是模型数据的质量。”丁琰强调。
具身智能的能力上限高度依赖于真实操作数据的规模与质量。当通用数据可以像硬件一样在线下单时,行业模型训练门槛被显著拉低。从“万台设备同步开采”到“通用数据电商下单”,鹿明正将“无处不在却未被收集”的物理世界操作数据变为可规模供给的标准化基础设施。
“当数据不再稀缺时,机器人才真正走向通用。”喻超表示。
本文由主机测评网于2026-04-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260436177.html