当前位置:首页 > 科技资讯 > 正文

具身智能:从概念到现实,未来在哪里?

具身智能:从概念到现实,未来在哪里? 具身智能 AI 产业影响 未来发展 第1张

12月初,国内两所顶尖高校相继设立了具身智能专业,这标志着产学界的一次重要联姻,预示着国产具身智能的美好未来。

12月8日,智元机器人宣布其5000台产品实现量产。2025年成为具身智能在国内飞速发展的年份,从年初的春晚舞台亮相,到年末在顶级学术殿堂的入驻,越来越多的参与者加入这一赛道,对具身智能的理解也愈发多元。

有人认为具身智能是AI的物理体现,也有人认为它是新的交互方式;尽管难以找到一个被所有人接受的定义,但有一点是共识:具身智能与我们息息相关。

具身智能的局限性

在大模型时代,所有工业体系都值得重新审视。

乐观者问:“具身智能不能做什么?”旁观者则观察:“具身智能可以叠衣服、做物流、踢足球、吸引人……”

尽管演示项目(demo)层出不穷,但真正落地实施的项目却寥寥无几。为了融资,一些项目展示了惊人的“想象力”,但这并不一定能反映不同的算法能力。目前,行业内出现了“横向扩展”的demo现象,即所有“花样”其实“一样”,只是相同元素的排列组合,营造出一种虚假的繁荣。这种矛盾体现了具身智能扩张与技术积累之间的平衡难题:技术积累过深会导致投资过高,难以产生成果,从而被淘汰。

12月已至,但具身智能尚未真正落地。首要原因是其能力尚未达到规模化门槛。评估具身智能的能力时,需考虑其在简单任务中的成功率、节拍、成本和可靠性。

尽管一些具身智能在高度结构化的实验室环境中表现稳定,任务成功率可能超过80%,但一旦进入真实环境,其成功率可能会大幅下降。此外,即便单个任务的成功率提高,对于长程任务而言,成功率是相乘的结果,小于1的数字相乘只会得到更低的结果。

具身智能的真正落地需要找到合适的场景并提升成功率。这条路还有多远?但可以确定的是,具身智能的规模增长与demo的增长并非绝对正相关。正如“狼来了”的故事所示,人们曾在2015年听说“这一年是具身智能的元年”。

具身智能的chatgpt时刻

具身智能要在真实世界中得到应用,让所有人愿意使用它,才能迎来真正的突破时刻。

资本急于开拓具身智能的使用场景,但相关公司还需思考如何应用以及在哪种场景中应用。12月3日,特斯拉展示了机器人奔跑的视频。是的,具身智能正在行动,但接下来呢?在何种场景下需要机器人替代人类跑步呢?

产业界将具身智能未来的落地方向主要归纳为三个场景:商业服务、工业和家庭。具身智能落地的顺序很可能是先商业服务再工业服务最后进入家庭。

这一顺序主要是因为具身智能需要大量数据训练以建立世界模型。在这个模型中,具身智能能够思考和预测下一步。然而,像“鸡与蛋”的问题一样,因为具身智能缺乏实际场景中大量采集数据的机会,导致难以快速建立模型。商业场景特别是酒店环境较为固定,更容易训练;从价值角度看,送餐机器人确实解决了人力成本问题。

工业场景对效率要求高,替代自动化的效率将成为硬性门槛。即便机器人能够完美复刻一些工业操作,但与人工相比速度不占优势。从用户角度看,购买更慢的“人力资源”是一个亏本交易;从技术角度看,由于工业场景碎片化、数据难收集,因此难以起量,更难打破成本和效率限制。

最后谈及家庭服务。对于具身智能进入家庭的前景存在两种极端观点:如果仅期待陪伴和对话功能,具身智能可能很快进入消费领域;但从智能家居到AI玩具的人机交互已不是新鲜事。如果具身智能要真正成为家庭的一员,则面临安全和成本问题。被定义为“家庭成员”的具身智能多覆盖医疗和养老场景,对其安全性需慎重考虑。

对于具身智能的普及之路而言,过程大致是从专精到通用:最初可能是单场景单任务的稳定执行;然后过渡到单场景多任务的执行;最后是多场景多任务的稳定执行。

具身智能的繁荣与焦虑

自古以来,人们就梦想着创造出某种人造物能够自动完成凭借人类智慧和能力才能实现的工作。

在《伊利亚特》中赫菲斯托斯造出了金属机器人和黄金仆人帮助他完成杂务;亚里士多德预言了自动化工具的出现;偃师为周穆王制作了能歌善舞、有感情的“机关人偶”;《格列佛游记》描述了一个机械装置能让最愚蠢无知的人撰写书籍而无需天赋或学习。

过去人们对具身智能的畅想总是替代人类去做无聊、重复和低价值的工作;同时人们又担心它们会发展成为“掌控”人类的神。因此未来可能不是替代重复性工作而是替代人类进行危险工作更有意义。

尽管对具身智能的未来充满焦虑但其带来了众多产业的繁荣。