当前位置:首页 > 科技资讯 > 正文

机器人训练数据需求飙升,家务视频成黄金素材

请注意,这位男士我们暂时称他为小杰。

你可能难以置信,他仅仅在厨房中优雅地煎牛排和处理日常家务,每小时就能赚取超过1000元人民币(约150美元)。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第1张

难怪小杰每天工作都充满喜悦。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第2张

难道他发现了某种神秘的副业机会?

场景切换——哦,原来是机器人。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第3张

没错,如今,你做家务的视频正被Encord、Micro1、Scale AI这些数据标注服务商视为训练人形机器人的高级人类素材,并以高价收购

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第4张

评论区网友纷纷追问招聘链接。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第5张

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第6张

机器人也需“家教”

当前,机器人是人工智能领域最热门的赛道之一。

硅谷著名投资人Vinod Khosla等人预测该领域将很快迎来自己的“ChatGPT时刻”。PitchBook数据显示,今年迄今机器人领域的风险投资已激增至121亿美元

然而,在技术爆发的另一面,是机器人行业共同面临的数据荒。

“与大语言模型不同,机器人没有现成的互联网数据集可用,必须从零开始在现实世界中生成训练数据,难度大得多。”AI数据服务公司Encord联合创始人Ulrik Hansen一针见血地指出。

目前,机器人训练数据的来源可以分为两大路径:现实世界真实数据合成数据

真实数据可通过精密设备远程操控机器人执行任务,同步记录下包括关节力矩、电机旋转等在内的全套物理数据。这种方式能捕获“手感”力控信息等。

或者可通过直接记录人类在现实环境中的活动来获取,如Apple Vision Pro或专业动作捕捉系统,记录人类执行任务的全过程。

这类数据质量高、保真度强,能准确反映真实世界的复杂物理交互,但问题在于规模有限、成本高,难以满足机器人模型对海量数据的需求。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第7张

合成数据则开辟了另一条路线。通过在虚拟环境中自动生成无数种动作变体或构建完整交互场景,合成数据能以较低成本实现数据自由。

例如,NVIDIA Cosmos就是一个“世界基础模型”,可以生成高度逼真、类似视频游戏的环境,用于机器人训练。在这里,“世界”指的并不是地球,而是机器人交互的环境,如机器人操作的房间内可见区域。

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第8张

另外,为兼顾真实性与规模性,机器人公司往往采用结合真实与合成数据的方式,通过将少量的现实世界数据与大规模合成数据相结合,克服机器人技术中数据稀缺的问题。

面对数据饥渴,目前各家的应对策略五花八门。

Encord透露,他们今年对此类数据的处理量已达到去年的四倍。他们高价回收真实数据,如果是操作设备等高技术性任务的视频,酬劳最高可达每小时150美元

另一家AI数据服务公司Micro1 CEO Ali Ansari则透露,他们开出的报酬每小时在25至50美元之间

另外,Scale AI宣布正快速拓展机器人业务,并在其旧金山总部设立了专用实验室,迄今已生成超过10万小时的训练影像。

而需求则来自Physical Intelligence、波士顿动力公司等。

甚至有某机器人初创公司自己在Craigslist发广告,以10–20美元时薪征集用户用手机拍摄家务的视频

机器人训练数据需求飙升,家务视频成黄金素材 机器人学习 数据采集 视频素材 AI服务 第9张

尽管各方努力,优质数据依然短缺。该初创公司创始人对外透露:“市面上没有大型数据集可购买,规模最大的也仅有约5000小时时长,这远远不够。”

参考链接:

[1]https://x.com/dom_lucre/status/1981055417451942221

[2]https://www.businessinsider.com/ai-startups-robotics-pay-film-chores-encord-micro1-scale-2025-10