
在赞叹机器人每个精准动作的同时,我们不应忘记那些在幕后默默绘图的“影子”。这不是对商业模式的质疑,而是对技术伦理与社会影响的深刻探讨:我们所追求的智能未来,究竟应由何种人文基础支撑?我们见证着具身智能的崛起,但也要铭记那些亲手搭建这一切的人。
数据已成为制约具身智能发展的关键瓶颈,成为其通往物理世界的“灵魂”障碍。业内讨论聚焦于真实数据与仿真、互联网数据等类型的博弈,其中真实数据因质量更高且对精细操作更具价值,被认为能加速具身智能的发展。
然而,鲜有人提及机器人真实数据集背后的巨大付出。
这份付出是商业故事中略显老套的一环,如同骑手加速外卖平台的即时零售梦,数据采集员也在具身智能中扮演关键角色,他们通过操作设备,反复执行拿水杯等动作,旨在让具身智能掌握抓取与放置的能力。
由于数据需求巨大,这份工作常以外包形式出现,在不稳定的工作中孕育出稳定的具身智能产品。
有人称之为“红利期”,日薪200元且免受风吹日晒,在兼职工作中颇具吸引力;也有人认为这是与网约车司机、骑手并肩的新职业,具有长期发展潜力。
然而,也有人持悲观态度,认为这份工作预示着悲剧。“数据收集员的工作正是为Optimus最终取代人类劳动铺路。”Business Insider在报道特斯拉建立数据采集团队的文中如此评述。通过数据采集员获取的数据,机器人将更加智能,甚至可能成为未来的竞争对手。
无论视角如何,短期内这似乎都是一条能赚钱的路径,但未来发展却难以预测。在喧嚣与浮躁的行业中,他们如同“淘金者”,只不过这次他们不是在土地中寻找黄金,而是在自己手中寻找数据。
几乎所有受访的数采从业者都将这份工作视为“枯燥的体力活”。
枯燥源于工作的重复性:员工需身着数采外骨骼或遥操设备,重复数百次夹取、拿放、搬运等动作,如同教导婴儿学步般引导机器人模仿人类行为。体力活则体现在工作的低技术门槛上,多数岗位明确偏好男性,甚至要求能抓取15公斤重物。
在数据采集中心内,数采员在特定场景中行走、抓取、避障,每一个动作都被精确记录,成为机器人的行为蓝本。或者他们坐在电脑前,对海量视频逐帧标注“这是手”“这是门把手”“这是安全行为”。他们是机器人在数字世界中的“镜像”与“导师”。
Business Insider的采访对象坦言,这份工作对身体负担极大,“几乎等同于一整天都在做有氧运动”。
实际上,这类工作与兼职群中常见的外卖众包、快递分拣、工厂普工高度相似,以男性为主、无技术门槛的劳动密集型岗位。
但招聘方却常附加“偏好条件”:希望应聘者具备计算机、人工智能相关背景或数据采集经验。这份在社交媒体上被贴上“含金量低、需避坑”标签的工作,反而成为许多计算机、人工智能专业大专生的实习与就业选择。
这些以相关专业、大专学历为主的新生力量大多将其视为“行业红利”。曾从事医疗机器人数采与标注的小吕以及数科专业本科刚毕业的小陈都对这份工作给予高度评价。小陈认为,满意的待遇、相对安全的工作环境、蓬勃发展的行业前景以及个人兴趣的驱动让他对这份工作充满好感。但和大多数从业者一样他也清楚这份工作的不稳定性计划先积累经验作为跳板在行业中探索更多可能性。
这种“鲤鱼跃龙门”的职业期待与外包的AI数据标注、AI训练师渴望晋升为大厂的AI产品经理的职业规划如出一辙。“贴近风口赛道从底层积累经验逐步晋升”“优秀者可转正交社保”这也是HR在招聘中常用来吸引求职者的叙事逻辑。
但若将视野从这些“专业对口”的劳工群体扩展到更广泛的从业者便会发现他们身上诸多令人深思的“异状”。
光与影相伴当机器人最终站在聚光灯下接受掌声时那些教会它一切的数据劳工却成为不被看见的影子。
更诡异的是这种数据劳动正在“异化”。就像程序员们与其亲手打造的AI编程工具相爱相杀一样劳动密集型岗位上的数据劳工正在教会其伟大的机器人如何从事基础性、枯燥的重复性劳动。
看不见的另一层是“无根”。
从互联网、移动计算到大模型和如今的具身智能技术风口一轮接一轮数据劳工们也随着浪潮迁徙难以扎根。技术迭代数据劳动便会游移。
另一层面的“随波逐流”体现在他们的劳工关系上。他们的工作多通过层层外包获得劳动关系脆弱。项目一旦终止都可能导致整个团队瞬间解散失业如影随形。
在这场具身大潮中不说与动辄百万年薪的算法工程师相比数据劳工薪资与招工群里的其他体力工种并无区别。以北上广深一线城市为例数据采集普遍日薪160元-200元之间时薪20出头。在数据标注环节更是价低。这类工作就是针对客户视频里的目标检测识别打标签属于远程办公全国可做。目前正在三四线城市正迅猛发展摊薄用工成本。他们是这条高附加值产业链上最基础也是待遇最微薄的一环。招聘的低门槛意味着其可替代性强也注定了议价权之弱。
回到问题的开始数据劳工的这些“异状”究竟从何衍生呢?AI的发展促进了具身智能的诞生而具身智能也承袭了诸多AI的技术底层逻辑其中之一是“大力出奇迹”的Scaling Law。具身智能的智能水平某种程度上与数据的质与量成正比甚至业内一度认为具身智能要理解复杂的物理世界或许要达到“互联网”数据量级。因此只有在保证质上足够干净精确、足够丰富才能从规模化定律中催生智能涌现。
于是具身智能需要数据采集、标注等大量人力才能堆砌出。这些大量的人力成本就成为初创企业的辎重了。而为了“轻装上阵”在摩尔定律逐渐打破模型迭代日新月异的节奏里企业选择把这项基础工作外包给三方。
从资本的逻辑来看这一点无可厚非。具身智能公司的核心资本必须投入到算法研发和硬件制造等“硬核”环节。将数据工作外包是降本增效的好办法。但需要强调的是外包后企业管理链条延长企业规范(权力)的传导会递减、乏力。这当中极容易滋生乱象。拿标注质量来说当具身智能企业下达一份数据采集或标注的操作手册供三方员工按部就班实现标准作业流程。这其中“具身企业—劳务公司—三方员工”之间存在“二次合格”。即原本“具身公司—全职员工”要求及格的数据在上述链路后变成三方员工“得过且过”地交付劳务公司数据而劳务公司又“得过且过”地把数据交给具身智能公司最终影响数据质量。(部分情况下如此)
当我们沉浸在具身智能描绘的未来蓝图中不应忽略那些支撑技术迭代的“数据劳工”。他们的职业发展与产业演进本就是相互依存的整体而非割裂的个体与背景。从劳工视角来看像小陈一样试图“转正进管理”只是少数人才能实现的理想路径更多人面临的是“技能无沉淀、就业无保障”的困境。真正的职业成长应当围绕“经验转化”与“风险兜底”展开。底层采集员可凭借一线实操经验转向数据质量把控比如筛选有效动作数据、修正冗余标注或是参与编写场景化采集手册将“如何让机器人精准识别障碍物”“不同场景下的动作规范”等经验转化为行业标准摆脱纯体力劳动的局限。
从产业方来看数据劳工不会永远伴随着数采厂的建设而呈线性增长未来AI自动标注、世界模型生成与仿真技术优化数据采集方案可能会逐步“挤占”劳工的生存空间。
但需要明白的是在“感知”层面(如识别物体)的自动化可能较快但在需要“理解”物理世界复杂交互(如力度、触感、突发情况)的“认知”层面高质量的人类演示数据大概率在较长一段时间内仍是不可替代的“教科书”。
本文由主机测评网于2026-05-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545631.html