当前位置:首页 > 科技资讯 > 正文

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海

文|邱晓芬

编辑|苏建勋

2023年末,全球动作捕捉设备市场的领军企业诺亦腾(Noitom)的联合创始人戴若犁,曾一度怀疑自己遭遇了骗局。

他接连收到两通神秘来电,对方自称来自美国机器人独角兽A公司与汽车巨头B公司(应受访者要求化名),提出要采购110套动作捕捉系统。

“这该不会是套取底价的伎俩吧?”戴若犁暗自思忖。凭借他深耕行业十余年的经验,这种需求量高达百台的订单前所未有。

动作捕捉行业的特点是,客户虽然多为大型企业,但通常只需几台设备便能支撑起一部宏大的影视制作。自2012年成立以来,诺亦腾已占据了全球专业动作捕捉市场约70%的份额。

《权力的游戏》、《金刚狼》、《星际迷航》、《星球大战》等好莱坞顶级制作,其背后所用的动作捕捉技术均源自这家中国公司。

然而,随着具身智能机器人时代的到来,诺亦腾意外地撞上了一个崭新的风口——数据匮乏,已成为当前机器人领域面临的最严峻挑战。而动作捕捉设备,正是采集高质量数据的有效工具。

对于前述两家美国巨头而言,通过动捕设备采集的多模态、高精度数据,是训练机器人的核心“养料”,直接决定着机器人的智能水平。

具体流程是,动捕师在头、手、腿、腰等关键骨骼节点佩戴惯性传感器或光学标记点,执行各种精细动作。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第1张

△PNDbotics Adam-U 机器人通过 Noitom Robotics 遥操作系统控制采集数据

所采集的真人动作数据,经过遥操作等流程处理后,被映射为机器人本体的传感与控制信息,从而“喂养”给机器人。自此,人类得以“手把手”地教会机器人完成各类任务。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第2张

△Noitom Robotics 人形机器人遥操作数据采集流程

一组对比数据凸显了机器人数据的紧缺现状:谷歌Deepmind曾联合斯坦福等21家顶尖机构,整合了60个数据库,才构建出全球最大的机器人数据集Open X-Embodiment,其中包含100万条真实数据——这比GPT-5所需的百万亿级数据低了整整六个数量级。

看清这一趋势后,戴若犁决心“全力押注机器人赛道”。

2025年初,诺亦腾将其内部的机器人团队拆分出来,成立了独立运营和融资的新公司,新公司同样命名为“诺亦腾机器人(Noitom Robotics)”,业务重心聚焦于机器人数据解决方案。

Noitom Robotics的核心团队已在数月前组建完毕。毕业于中国科学技术大学与香港中文大学的戴若犁在业内颇具号召力,被圈内人称为“小戴师兄”或“戴博士”。据《智能涌现》了解,团队核心成员包括:

前腾讯Robotics X Lab具身智能中心负责人韩磊(职级T13),出任公司首席科学家;

前字节跳动新石实验室硬件负责人(4-1级)、罗永浩「细红线」项目硬件负责人许安民,担任公司硬件工程负责人;

此外,还有来自商汤科技、百度、阿里巴巴等互联网大厂的前高管,分别负责产品、研发、销售及商务拓展等业务。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第3张

△戴若犁

《智能涌现》独家获悉,Noitom Robotics已完成由阿尔法公社、经纬创投等知名机构投资的数千万元人民币天使轮融资。目前,其Pre-A轮融资正在推进中。

向机器人厂商销售动捕设备,年内签单金额达数千万

当具身智能机器人热潮涌动,行业中绝大多数公司仍在苦苦探索商业化路径时,Noitom Robotics通过发掘数据采集的价值,率先实现了营收。

在收入方面,Noitom Robotics在2025年前八个月已获得数千万元的订单签约额,相比去年全年增长了五倍。“国内几乎所有的机器人厂商,都曾向我们采购设备用于数据采集”。

戴若犁用两个项目代号向《智能涌现》阐述了其商业模式:Project T(遥操作 Tele-operation)和 Project D(数据工厂 Data factory)。

在Project T路径下,戴若犁又规划了数据采集与部署配套两种模式

数据采集模式即销售用于遥操作数据采集的动作捕捉设备。戴若犁透露,继前述两家美国头部机器人厂商的订单后,近两年,公司又陆续获得了国内近30家机器人厂商的订单,包括阿里达摩院、智元机器人、千寻位置、字节跳动、小鹏汽车、腾讯等。

此外,客户还包括李飞飞教授等领衔的多所高校机器人研究所,以及各地方政府主导的机器人联合创新基地等。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第4张

△部分与 Noitom Robotics 开展合作进行机器人遥操作与数据研究的客户 

部署配套模式,则是Noitom Robotics为机器人未来规模化落地所做的布局。

戴若犁判断,与自动驾驶行业类似,当人形机器人真正进入工厂或家庭时,将会设立一定数量的“安全席位”。这些席位构成了机器人应用的安全底线,用于在紧急情况下远程接管机器人、处理复杂场景,保障人员安全与设备稳定运行。

未来,Noitom Robotics也计划提供机器人落地的一揽子服务,包括安全席位所需的远程操作端设备、相应的控制管理软件,以及配套的业务流程外包(BPO)人力服务等。

概括而言,Project T的商业模式主要是销售硬件与服务。

但公司的野心不止于此。

Noitom Robotics正在筹备建设数据采集工厂(Project D),旨在开拓数据销售与授权业务——与硬件相比,数据业务的边际效应更为显著。Meta以150亿美元收购数据服务公司Scale AI近半数股权,也印证了数据的巨大价值。

戴若犁向《智能涌现》透露,公司已在深圳等地考察选址建设数据工厂。他预测,未来Project T有望带来亿元级别的常态化年收入,而Project D则具有达到十亿元级别的潜力。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第5张

△Noitom Robotics 数据工厂示意图

然而,要成为机器人领域的Scale AI,Noitom Robotics必须回答一个核心问题:机器人究竟需要采集什么样的数据?

机器人数据路线之争,尚未定论

「数据」是当前具身智能机器人领域的一大痛点。行业内的分歧,大致可分为两派观点:

多数人借鉴了大语言模型的发展路径,认为“规模定律”同样适用于具身智能。其依据是,作为具身智能子集的自动驾驶,已经证明了海量数据的威力。

而以王兴兴为代表的另一派人士则大声疾呼,在模型本身不够优秀、尚未统一之前,行业不应盲目堆砌大量数据。

有业内人士向《智能涌现》表示,自动驾驶依靠上千万台车辆收集了数年数据,至今仍停留在L2+级别,“如果机器人领域模仿这种方式大量收集真机数据,需要耗费多少时间与资金?这显得不够明智!”

另一位业内人士总结道,真机数据主要存在质量参差、效率低下、成本高昂三大问题

该人士透露,国内某头部机器人厂商在去年上半年,要产出一小时合格的真机数据,需要两名操作员进行一整天、每人八小时的遥操作才能完成。

以特斯拉为例,美国遥操作员的时薪高达50美元,且日常工作需要穿戴动捕服和VR设备超过7小时。

为了突破真机数据的种种限制,行业内不少厂商选择拓展数据来源,例如直接使用互联网视频数据、利用AI生成仿真数据,或者通过动作捕捉设备采集真人数据等。

在行业分歧尚未统一之际,戴若犁试图用「金字塔结构」来解析当前机器人数据的困局。

他将机器人所需的数据划分为四个层次:

金字塔顶端依然是真机遥操作数据。他认为,真机数据是质量最高的数据,其作用类似于汽车出厂前进行的10万公里路试——用于获取机器人独特的“本体特性”。

然而,真机数据除了前述缺点外,最大难点在于难以跨本体迁移。例如,将宇树机器人的数据直接应用于智元机器人,会存在显著的折损。

因此,他反对在真机数据层面盲目追求泛化性。“就像汽车路试,10万公里足以验证性能,无需追求10亿公里这种不切实际的规模。要求遥操作数据达到海量级别是不合理的”。

戴若犁认为,真人数据才是实现机器人能力泛化的关键。在金字塔的第二层和第三层,应该是高精度与低精度的真人交互数据——真机数据与真人数据的根本区别在于数据产生源,前者来自机器人,后者来自人类。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第6张

△具身智能数据的金字塔 图源:Noitom Robotics

真人数据的特点是维度高、模态多、精度高。在他看来,将高维度的人类数据映射到低维度的机器人上,更为高效,也更能解决跨本体的适配问题。

“因为未来机器人的传感器精度尚未可知,从低维向高维映射是不可行的,可能导致数据量不足。”戴若犁解释道。

但真人行为无穷无尽且极其复杂,如何有效收集?

戴若犁提出将人类动作“原子化”的思路。他将人类的复杂动作分解为基础单元:抓、拿、抛、捏、推、撵、搓、拧等。

未来,Noitom Robotics计划在其数据工厂中,设计一系列长周期任务,以覆盖真人数据采集。戴若犁表示,公司正在构建一个规模达数十万小时的数据集,并计划向行业部分开源。

金字塔的第三层是低精度人机交互数据。对此,戴若犁提出了一个反共识的观点。

他认为,收集这类数据的最佳设备并非机器人,而是当前热门的AI眼镜。随着摄像头成为AI眼镜的标配,眼镜所捕获的数据天然具有场景多样、目标泛化、规模庞大且成本低廉的优势。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第7张

△跨本体映射的虚拟遥操作示意

当然,戴若犁并不否认互联网信息对机器人领域的价值。在金字塔的基底层,他认为广阔的互联网合成数据与仿真数据同样不可或缺,能极大拓展数据边界。他预测,机器人数据金字塔的每一层,其数据量都将比上一层“高出两个数量级”。

当机器人数据成为未来厂商竞争的核心要素时,戴若犁判断,国内或将有近半的融资投入用于解决机器人数据难题——2025年前8个月,机器人领域融资额已达386亿元,是2024年全年的2倍。

尽管机器人领域充满分歧与未知,但可以确定的是,机器人数据的瓶颈及其蕴含的巨大商业价值,正日益清晰地展现在行业面前。

动作捕捉巨头诺亦腾转型,掘金机器人数据采集蓝海 诺亦腾 动作捕捉 机器人数据 商业化 第8张

end