当前位置:首页 > 科技资讯 > 正文

人形机器人与灵巧手的未来:技术挑战与突破

2026年,人形机器人将迎来规模化量产的元年。特斯拉的“金色擎天柱”Optimus Gen 3预计将在2026年第一季度亮相,并计划在年底前建成产能高达100万台的生产线。马斯克表示,特斯拉未来约80%的价值将来自人形机器人。

为了实现人形机器人的广泛应用,关键在于其“手与前臂”的设计。这引发了关于机器人灵巧手的技术路径的讨论,主要分为连杆方案、绳驱方案和直驱方案。

【连杆方案】展现了机械设计的美感,但通常意味着低自由度。然而,以韩国ILDA为代表的高自由度灵巧手则挑战了这一传统。

【绳驱方案】的优势在于轻量化、自由度高、力量输出稳定。特斯拉的Optimus和TetherIA灵巧手都是其代表。但这类方案也面临着走线延伸、材料蠕变、装配难度高等问题。

【直驱方案】方便精细控制,如Sharpa机器人的电机直驱灵巧手。但其抗冲击力差,重量较大。

本期《硅谷101》,泓君邀请了两位专家——亚马逊&前Meta机器人研究科学家齐浩之和TetherIA联合创始人陶一伟,探讨灵巧手的现状、不同技术路线的特点及其面临的数据和算法挑战。

嘉宾们认为,对灵巧手头部公司来说,短期内针对单项任务打造成功一个Demo并不难,真正的突破在于通用性与可扩展性。当算法能让机器人在短时间内学会多样化操作,才意味着到达类似ChatGPT的泛化突破阶段。

01 机器人灵巧手的能力与挑战

泓君:听众可能最困惑的是,在Demo中机器人能做多种任务,如拿吸尘器、倒垃圾等。特斯拉擎天柱倒酒的场景看起来已经相当智能。那么,现在机器人的手能做哪些场景?发展到了什么程度?

齐浩之:在遥操作情况下,如果手指不需要精细动作,如擎天柱倒酒,则相对简单。然而,使用家庭工具如螺丝刀、剪刀等需要更精细的操作,难度会呈指数级上升。

人形机器人与灵巧手的未来:技术挑战与突破 人形机器人 灵巧手 技术路径 泛化能力 第1张

“擎天柱”(Optimus)展示倒酒 图片来源:X

泓君:你提到了“精细运动”和“泛化能力”,即在不同场景中应用的挑战。

陶一伟:从硬件角度看,需要提高现有方案的可靠性,让机器人在真实环境中长时间稳定运行。同时,硬件还需迭代,如增加自由度和触觉传感。

泓君:例如,今年年会上Evan用机器人表演开可乐并不稳定。旋转动作对机器人来说有多难?

陶一伟:开可乐看似简单,但在双臂机器人系统上实现非常具有挑战性。旋转可乐对准拉环需要高精度和感知能力。

泓君:其他公司能否实现旋转可乐并成功打开?

陶一伟:一些头部公司通过优化硬件可能实现,但完全自主完成还需努力。

齐浩之:目前没有任何公司能完全自主完成这一任务。优化硬件和算法虽可实现Demo,但全面自主应用还有很长的路要走。

02 盘点灵巧手硬件三大技术路径

泓君:业界流行的技术路径包括连杆驱动、绳驱和电机驱动。每种方案各有优劣势。

陶一伟:连杆驱动的传统假肢手低自由度,而高自由度的ILDA手虽先进但体积大且易损坏。直驱方案自由度虽高但重量大且成本高。

人形机器人与灵巧手的未来:技术挑战与突破 人形机器人 灵巧手 技术路径 泛化能力 第2张

由韩国阿犹大学的智能机器人研究实验室(IRLAB)设计并开源的ILDA灵巧手图片来源:Iir LAB AJOU

泓君:现在业界主流方向如何?

陶一伟:硬件上主要朝直驱和单向拉绳方向收敛。特斯拉和TetherIA都采用单向拉绳方案。

03 特斯拉灵巧手研发故事

泓君:特斯拉Optimus手的研发有何进展?

陶一伟:最早团队采用蜗轮蜗杆绳驱方案,后升级为增加关节编码器和触觉功能。但装配过程痛苦且产能低。

人形机器人与灵巧手的未来:技术挑战与突破 人形机器人 灵巧手 技术路径 泛化能力 第3张

04 揭秘灵巧手“数据金字塔”

齐浩之:研究如何从人类视频中学习灵巧操作技能。遥操作数据量少但质量高,视频数据多但缺乏力信息。

泓君:视频数据和遥操作数据各有优缺点,未来哪种方式更有效?

齐浩之:视频数据可能在数量上积累到一定程度后超越遥操作,但目前仍处研究阶段。