当前位置:首页 > 科技资讯 > 正文

具身智能:从ChatGPT时刻到产业耐力的考验

Fast Reading

  • 大模型的扩散几乎不依赖新增物理基础设施,而具身智能则是集硬件、算法、环境感知与运维体系于一体的物理系统。
  • 当前大多数机器人仍局限于单一工作台,难以完成跨空间、跨模态的连续复杂任务。
  • ChatGPT时刻对具身智能而言,更多是一个隐喻,而非可复制的路径。大模型证明算法的爆发力,而具身智能则考验整个产业系统的耐力。

在人工智能的诸多分支中,具身智能是近年来备受关注的方向之一。

从工业机器人到服务机器人,从自动驾驶到人形机器,各条技术路线每隔一段时间就被寄予“通用智能入口”的期待。

但与算法驱动的软件革命不同,它始终受到现实世界的摩擦而难以快速推进。

如果只看公开视频,具身智能的公共叙事几乎被同一组类似的画面占据:机器人行动更稳定、动作更连贯、任务更复杂。融资在加速,模型在迭代,似乎正处在一条上升曲线。

成功被展示,失败被隐藏——在实验室之外,另一种叙事同时存在:部署成本、稳定性、维护复杂度,仍在反复拉长商业化的时间表。

2月10日,原力灵机在北京中关村国家自主创新示范区展示中心举行了首次技术开放日。

原力灵机发布了三款核心产品:具身原生大模型DM0、具身原生开发框架Dexbotic 2.0、以及具身原生应用量产工作流DFOL。这也是原力灵机成立近一年来,公司核心团队第一次集体公开亮相。

在当天的“Physical AI Next 圆桌论坛”上,来自产、学、研的五位嘉宾花了约一半的时间,讨论一个问题:

具身智能的ChatGPT时刻何时到来?

具身智能:从ChatGPT时刻到产业耐力的考验 具身智能 ChatGPT时刻 产业系统 耐力 第1张

具身智能的ChatGPT时刻——这是一个结合了技术突破、产品体验与商业想象的复合概念。它代表着模型能力的跃迁,也寄托了像ChatGPT一样被非技术用户快速理解、低成本使用,并形成规模化扩散的期待。

它带着某种技术乐观主义的兴奋。毕竟,大模型在ChatGPT发布后迅速从实验室走向全球数亿用户,完成了一次清晰可辨的跃迁。

人们自然期待,当人工智能拥有了身体——能行走、抓取、操作物理世界的实体——是否也会迎来类似的爆发点?

ChatGPT的成功在于它提供了使用成本低、使用结果高度稳定且可重复验证的体验。这种“即开即用”的特性,使其迅速成为通用工具。

更重要的是,大模型的扩散几乎不依赖新增物理基础设施:算力集中在云端,终端只是入口。

具身智能则完全不同。它是一个集硬件、算法、环境感知与运维体系于一体的物理系统。

北京智源人工智能研究院院长王仲远认为,即便模型能力在提升,也还远没有到具身智能的ChatGPT时刻。“尤其当具身智能的模型和硬件真机部署之后,我们发现离真正希望的大规模应用还是有比较大的gap。”

这个差距源于物理世界固有的不确定性——地面是否平整、光照是否有变化等任何一个变量都可能导致任务失败。

这也是为什么,在当前阶段,具身智能还仍停留在“可演示”而非“可大规模复制”的状态:一次成功并不等于系统性成功。

清华大学电子工程系长聘教授汪玉认为,当前大多数机器人虽已有很大进步,但还是“局限在一个工作台上”,难以跨空间、跨模态完成连续复杂任务。

他甚至提出一个颠覆性设想:未来的住宅设计或许需要加入“机器人适配”维度。

雪豹财经社认为,在工业史上,这种路径并不陌生——流水线、电梯、自动门都是先改变空间再释放自动化价值。具身智能或许也需要类似的“环境工程”。

汪玉的观点也揭示了大模型和具身智能的一大不同:大模型运行在高度标准化的数字世界,而具身智能要闯入一个为人类而非机器设计的物理世界。前者是规则清晰的棋盘,后者是充满噪声的旷野。

究竟该如何定义ChatGPT时刻?

在阶跃星辰创始人、CEO姜大昕看来,一个标志性的东西就是零样本。“零样本去做泛化,给它任何一条指令,即使以前没有见过,它也可以回答出问题。”

如果对比自然语言和具身智能,姜大昕觉得,具身智能的“ChatGPT时刻”会更加困难一些。

真正贴近商业落地的创业者正在转向更务实的定义。原力灵机联合创始人、CEO唐文斌心中的具身智能ChatGPT时刻是它变得有用、可信赖并能够在投资回报率(ROI)上算明白。

“虽然行业非常火爆但整个(具身)智能的能力还在蹒跚学步的阶段。”唐文斌坦言。

星海图创始人、CEO高继扬则从产业链角度指出大模型是“模型即产品”。而具身智能的链条极长从供应链、整机组装到数据闭环、售后服务等算法反而是传播周期较短的一环。

这意味着具身智能的商业化节奏更兼有制造业的特性:资本回收慢、失败成本高任何一环掉链子都会放大整体风险。

“如果从业务产线的角度来说具身智能的ChatGPT时刻是我们真的看到它在某些限定范围内具备商业价值的一个时刻。”高继扬说。

对具身智能而言“ChatGPT时刻”更像一个外借的隐喻而非可被复制的路径。

“如果说大模型证明了算法的爆发力那么具身智能考验的则是整个产业系统的耐力。”