当前位置：首页 > 科技资讯 > 正文

具身智能：机器人大模型的崛起与挑战

主机测评网
科技资讯
2026-04-29
408

作为人工智能与机器人技术的前沿领域，具身智能正成为科技界最具潜力和前景的方向之一。在这一领域中，机器人/具身大模型扮演着“中枢大脑”的角色，使机器人能够在复杂多变的环境中实现自主学习和持续进化。因此，大模型的研发已成为推动机器人产业——尤其是通用型机器人突破发展的关键。

9月8日，中国的具身智能公司自变量机器人开源了他们的具身模型WALL-OSS，紧接着的9月9日，美国的具身智能公司Physical Intelligence（简称PI）也开源了他们的π₀.₅模型。中美两家公司几乎同时开源模型，这并非偶然，标志着2025年具身大模型的开源生态正在进入百花齐放的发展阶段。

这一趋势让人联想到过去几年语言大模型的演进路径：从2018年开源社区初步兴起，到2020年5月ChatGPT-3引发全球瞩目，语言大模型用了三年时间走向成熟。那么，机器人大模型距离它的“GPT-3时刻”还有多远？

本期《硅谷101》，主播泓君邀请了自变量机器人的CTO王昊，以及Physical Intelligence的研究员柯丽一鸣（Kay Ke），共同探讨今年机器人模型领域的突破、面临的挑战、中美机器人发展路径的区别，以及全场景落地的可能性。

具身智能：机器人大模型的崛起与挑战具身智能机器人大模型泛化能力长程任务第1张

以下是这次对话内容的精选：

01 行业突破与泛化能力

泓君：你们认为整个2025年，机器人模型领域最重要的突破是什么？

柯丽一鸣：我从事机器人研究已有七八年，我觉得机器人大模型的兴起是在最近两三年才开始集中爆发的。

我之前的研究没有用到很多大模型技术，更多是做一些小而精的任务。我发现一套东西在一个场景下能解决特定问题，虽然效果不错，但很难复制到新的问题上。

探索大模型途中，最大的惊喜是验证了模型的通用性，可以开始做泛化和性能提升的探索。现在对大模型技术路线的信仰比以前浓厚得多。

王昊：今年一个明显的现象是应用上呈现指数效应。这背后的驱动力来源于通用机器人基础模型的发展和进步。

在2023年以前，很多人专注在单个任务上。但现在有了统一的基础模型后，能够同时学习并执行成百上千种不同的任务。这意味着我们的优化目标变了，重心放在提升模型在所有任务上的平均成功率。

泓君：总结关键词：一个是泛化探索，一个是复杂长任务。请举例说明有哪些任务以前做不到，现在能做到？

具身智能：机器人大模型的崛起与挑战具身智能机器人大模型泛化能力长程任务第2张

柯丽一鸣：2024年PI发布了π₀，目标是推动泛化能力。叠衣服任务是一个代表性例子。这个任务在机器人界做了十几到二十年。

叠衣服看似简单，但具体复杂度很高。不同折法、步骤序列性使得任务难解决。2025年，PI开始探索泛化方向，比如把π₀.₅模型放到移动机器人里，放到不同家里测试。发现泛化性有希望，虽然表现不完美，但展现出一点像人类的特性。

02 数据挑战与硬件瓶颈

泓君：刚才提到难点，柯丽一鸣提到第一点是数据质量和数量。

柯丽一鸣：第二个难点是王昊提到的数据量和质量。就算在2025年今天，还是鱼和熊掌不可兼得的事。

追求高质量数据需要精心设计、清洗。一旦追求细节和数量就有难度。第三个难点是真机维护。做真机机器人的同行们对硬件维护感到挫败。

具身智能：机器人大模型的崛起与挑战具身智能机器人大模型泛化能力长程任务第3张

泓君：你觉得多少数据可以构成一个优秀的大模型？

柯丽一鸣：我猜测需要100万小时的数据，相当于一个人一生的物理经验数据。

03 模型架构与技术路径

泓君：为什么大家想做开源？开源对整个生态的好处是什么？

柯丽一鸣：开源能降低机器人模型研究的入门门槛。在公司内部，开源也是研发过程的一部分。

具身智能：机器人大模型的崛起与挑战具身智能机器人大模型泛化能力长程任务第4张

04 商业化与落地前景

泓君：未来真能有个家用机器人帮我们做家务吗？还需要多久？

王昊：我觉得在两三年内可以在半结构化环境里做一些简单的事，比如厨房内做饭、洗碗。但完全实现在开放厨房里做所有事还需要五年左右。

高防服务器服务器教程

本文由主机测评网于2026-04-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260441226.html

上一篇

小红书的“赵露思悖论”：借势增长与社区文化的冲突

下一篇

互联网大厂引领硬折扣零售新变革