作为人工智能与机器人技术的前沿领域,具身智能正成为科技界最具潜力和前景的方向之一。在这一领域中,机器人/具身大模型扮演着“中枢大脑”的角色,使机器人能够在复杂多变的环境中实现自主学习和持续进化。因此,大模型的研发已成为推动机器人产业——尤其是通用型机器人突破发展的关键。
9月8日,中国的具身智能公司自变量机器人开源了他们的具身模型WALL-OSS,紧接着的9月9日,美国的具身智能公司Physical Intelligence(简称PI)也开源了他们的π₀.₅模型。中美两家公司几乎同时开源模型,这并非偶然,标志着2025年具身大模型的开源生态正在进入百花齐放的发展阶段。
这一趋势让人联想到过去几年语言大模型的演进路径:从2018年开源社区初步兴起,到2020年5月ChatGPT-3引发全球瞩目,语言大模型用了三年时间走向成熟。那么,机器人大模型距离它的“GPT-3时刻”还有多远?
本期《硅谷101》,主播泓君邀请了自变量机器人的CTO王昊,以及Physical Intelligence的研究员柯丽一鸣(Kay Ke),共同探讨今年机器人模型领域的突破、面临的挑战、中美机器人发展路径的区别,以及全场景落地的可能性。
以下是这次对话内容的精选:
泓君:你们认为整个2025年,机器人模型领域最重要的突破是什么?
柯丽一鸣:我从事机器人研究已有七八年,我觉得机器人大模型的兴起是在最近两三年才开始集中爆发的。
我之前的研究没有用到很多大模型技术,更多是做一些小而精的任务。我发现一套东西在一个场景下能解决特定问题,虽然效果不错,但很难复制到新的问题上。
探索大模型途中,最大的惊喜是验证了模型的通用性,可以开始做泛化和性能提升的探索。现在对大模型技术路线的信仰比以前浓厚得多。
王昊:今年一个明显的现象是应用上呈现指数效应。这背后的驱动力来源于通用机器人基础模型的发展和进步。
在2023年以前,很多人专注在单个任务上。但现在有了统一的基础模型后,能够同时学习并执行成百上千种不同的任务。这意味着我们的优化目标变了,重心放在提升模型在所有任务上的平均成功率。
泓君:总结关键词:一个是泛化探索,一个是复杂长任务。请举例说明有哪些任务以前做不到,现在能做到?
柯丽一鸣:2024年PI发布了π₀,目标是推动泛化能力。叠衣服任务是一个代表性例子。这个任务在机器人界做了十几到二十年。
叠衣服看似简单,但具体复杂度很高。不同折法、步骤序列性使得任务难解决。2025年,PI开始探索泛化方向,比如把π₀.₅模型放到移动机器人里,放到不同家里测试。发现泛化性有希望,虽然表现不完美,但展现出一点像人类的特性。
泓君:刚才提到难点,柯丽一鸣提到第一点是数据质量和数量。
柯丽一鸣:第二个难点是王昊提到的数据量和质量。就算在2025年今天,还是鱼和熊掌不可兼得的事。
追求高质量数据需要精心设计、清洗。一旦追求细节和数量就有难度。第三个难点是真机维护。做真机机器人的同行们对硬件维护感到挫败。
泓君:你觉得多少数据可以构成一个优秀的大模型?
柯丽一鸣:我猜测需要100万小时的数据,相当于一个人一生的物理经验数据。
泓君:为什么大家想做开源?开源对整个生态的好处是什么?
柯丽一鸣:开源能降低机器人模型研究的入门门槛。在公司内部,开源也是研发过程的一部分。
泓君:未来真能有个家用机器人帮我们做家务吗?还需要多久?
王昊:我觉得在两三年内可以在半结构化环境里做一些简单的事,比如厨房内做饭、洗碗。但完全实现在开放厨房里做所有事还需要五年左右。
本文由主机测评网于2026-04-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441226.html