当前位置:首页 > 科技资讯 > 正文

揭秘家务视频背后的高价回收:机器人训练新趋势

请仔细观察,这位男子,我们暂且称他为“小帅”。

你可能未曾想到,他在厨房中轻松煎牛排、打理家务的同时,每小时能赚取高达1000多元(约合150美元)的惊人收入。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第1张

难怪小帅每天上班都笑得合不拢嘴。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第2张

难道他发现了什么秘密兼职?

镜头一转——原来是机器人。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第3张

没错,如今,你的家务视频正被Encord、Micro1、Scale AI等数据分析服务提供商高价回收,作为训练人形机器人的重要素材。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第4张

评论区网友纷纷索要招聘链接。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第5张

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第6张

机器人也需要“家教”

当前,机器人是AI领域中的热门话题之一。

硅谷著名投资人Vinod Khosla等人正大力押注这一领域,并预计该领域将很快迎来其“ChatGPT时刻”。PitchBook数据显示,今年迄今,机器人领域的风险投资已激增至121亿美元

然而,在技术的飞速发展背后,机器人行业共同面临数据匮乏的挑战。

“与大型语言模型不同,机器人没有现成的互联网数据集可用,必须从零开始在现实世界中生成训练数据,难度要大得多。”AI数据服务公司Encord的联合创始人Ulrik Hansen如此指出。

目前,机器人训练数据的来源主要分为两大类:现实世界中的真实数据合成数据

真实数据可通过精密设备远程操控机器人执行任务,并同步记录下包括关节力矩、电机旋转等在内的全套物理数据。这种方法能够捕获“手感”等力控信息。

另一种方法是通过直接记录人类在现实环境中的活动来获取数据,如Apple Vision Pro或专业动作捕捉系统,记录人类执行任务的全过程。

这类数据质量高、保真度强,能准确反映真实世界的复杂物理交互。但问题在于其规模有限、成本高昂,难以满足机器人模型对海量数据的需求。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第7张

合成数据则为问题的解决提供了另一种思路。通过在虚拟环境中自动生成各种动作变体或构建完整的交互场景,合成数据能够以较低的成本实现数据的自由获取。

例如,NVIDIA Cosmos就是一个“世界基础模型”,能够生成高度逼真、类似视频游戏的环境用于机器人训练。在这里,“世界”指的是机器人交互的环境,如机器人操作的房间内可见区域。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第8张

为了兼顾真实性与规模性,机器人公司通常采用结合真实与合成数据的方式。通过将少量的现实世界数据与大规模合成数据相结合,它们能够克服机器人技术中数据稀缺的问题。

面对数据饥渴的现状,各家公司采取了多种应对策略。

Encord透露,他们今年对此类数据的处理量已达到去年的四倍。他们高价回收真实数据,如果是操作设备等高技术任务的视频,酬劳最高可达每小时150美元。

另一家AI数据服务公司Micro1的CEO Ali Ansari则表示,他们开出的报酬每小时在25至50美元之间。

此外,Scale AI宣布正快速拓展机器人业务,并在其旧金山总部设立了专用实验室。迄今为止,他们已生成超过10万小时的训练影像。

这些影像的需求主要来自于Physical Intelligence、波士顿动力等公司。

甚至有一家机器人初创公司在Craigslist上发布广告,以每小时10至20美元的价格征集用户用手机拍摄家务视频。

揭秘家务视频背后的高价回收:机器人训练新趋势 家务视频 机器人训练 数据标注 高价回收 第9张

尽管各方努力,优质数据依然短缺。该初创公司的创始人透露:“市场上没有大型数据集可供购买,规模最大的也仅有约5000小时时长,这远远不够。”