当前位置:首页 > 科技资讯 > 正文

估值140亿美元的通用大脑:Skild AI如何开启机器人‘全具身’进化之路?

人工智能的演进遵循着从垂直专用到通用泛化,再到深耕高价值细分场景的逻辑。正如大语言模型已从单一任务进化到全模态处理,物理AI领域也正迎来其‘通用化’的突破时刻。

以往,面部识别或语音转录依赖于独立训练的专有模型,而今一个通用模型便能胜任多种复杂指令。通过针对性的后训练,这些通用底座在医疗、法律等专业领域的表现甚至更优。在机器人领域,传统的工业或清洁机器人往往困于预设的特定环境,难以在非标准化场景中处理多元任务,这曾让家政人形机器人的普及显得遥不可及。

然而,以Skild AI为代表的具身智能先锋,正致力于打造名为‘Skild Brain’的‘全具身(Omni-bodied)’大脑。他们的愿景是构建一个能够适配任何硬件形态、执行任何任务的通用模型,赋予机器跨任务与跨形态的泛化能力。

估值140亿美元的通用大脑:Skild AI如何开启机器人‘全具身’进化之路? Skild AI  具身智能 机器人基础模型 物理AI通用化 第1张

来源:Skild AI

凭借这一极具颠覆性的技术路线,Skild AI继2024年获得3亿美元A轮融资后,近期又在由软银领投的B轮融资中斩获14亿美元,英伟达、亚马逊创始人贝佐斯等均参与其中,将公司估值推高至140亿美元。红杉资本、Lightspeed等顶级VC及LG、施耐德等战略投资者也纷纷入局。

全具身智能:统一大脑指挥万种硬件形态

Skild AI的创始团队背景显赫,CEO Deepak Pathak与总裁 Abhinav Gupta 均出自卡内基梅隆大学(CMU)机器人研究所,拥有极高的学术影响力。他们于2023年离职创业,组建了汇聚Meta、特斯拉、英伟达等顶尖企业专家的梦之队。

估值140亿美元的通用大脑:Skild AI如何开启机器人‘全具身’进化之路? Skild AI  具身智能 机器人基础模型 物理AI通用化 第2张

Skild AI核心团队(来源:Skild AI)

不同于传统机器人公司依赖‘定制化方案’,Skild Brain具备跨硬件的适应力。它无需提前知晓机器人具体的关节结构,即可控制四足设备、人形机器人甚至机械臂,完成从分拣家务到在复杂地形中行进的各种动作。这种跨形态训练极大地释放了数据潜力,增强了模型在面对硬件损坏时的鲁棒性。

基于纯视觉的端到端动态控制

数据匮乏一直是机器人大模型的短板。一些模型虽能表演杂技,但在攀爬不规则楼梯等需要精密感知与控制协同的任务中表现堪忧。Skild Brain采用了分层架构:上层负责宏观规划,下层单一神经网络则实现高频底层动作响应。这让机器人告别了繁琐的路径预设,在平地与障碍物之间实现如本能般的平滑切换。

Skild Brain本质上是由在线视觉驱动的端到端控制系统。即便在充满不稳定托盘、缝隙和杂物的真实街头环境中,它也能根据摄像头的毫秒级反馈实时调整落脚点。例如,即使台阶仅比脚掌长出3厘米,它也能精准踩稳并负重前行。

估值140亿美元的通用大脑:Skild AI如何开启机器人‘全具身’进化之路? Skild AI  具身智能 机器人基础模型 物理AI通用化 第3张

来源:Skild AI

为了防止模型‘死记硬背’特定硬件参数,Skild通过‘机器人多重宇宙’进行训练,涵盖10万种虚拟形态。更重要的是,他们将‘上下文学习(In-context learning)’引入物理AI。通过模拟关节卡死、肢体残缺等极端情况,让机器人在失败中自我修正。即便四足变‘三足’,模型也能在几秒钟内通过持续尝试找回重心,实现零样本的运动控制。

构建规模化的数据循环系统

Skild的数据来源极其丰富:预训练阶段依托海量仿真数据和互联网视频;后训练阶段则通过远程操作和真实场景部署不断回传数据。Skild的模型能够跨越‘具身鸿沟’,通过观看人类视频直接习得操作技能。目前,其机器人已在安防、物流及制造业工厂部署,仅数月便实现了3000万美元的营收增长。而其长远目标,则是让这些智能体走入千家万户。

跨越鸿沟:物理AI的价值将呈指数级爆发

若大语言模型的成功标志是ChatGPT的诞生,那么具身智能正处于跨越通用性门槛的前夜。Skild AI通过引入‘上下文学习’,大幅降低了机器人学习新技能的成本。尽管目前的模型迭代仍面临高昂的重训成本,但随着‘物理AI’进入成熟期,其在现实世界创造的价值将迎来指数级的飞跃。