近期,人形机器人领域再次成为舆论焦点,争论不断在“泡沫”与“前夜”间摇摆。
硅谷的初创公司1X发布了Neo的演示视频,视频中Neo似乎能像人类一样自然地做家务,瞬间在各大平台引发热议。然而,质疑声也随之而来——外界指出其流畅动作的背后,其实严重依赖远程操控(Teleoperation),而非机器人的自主智能。这让人们不禁联想到那些声称拥有AI能力、实则依赖人工后台处理的初创公司,“人工”智能的幽灵再次出现。
与此同时,高盛在一份最新调研报告中,无情地指出机器人供应链的“现实温差”。尽管资本市场情绪高涨,企业产能规划激进,但实际的大规模订单尚未落地。高盛甚至预测,即便到了2035年,全球人形机器人总出货量或仅为138万台。
尽管面临“造假”质疑与“产能过剩”的风险,具身智能赛道在过去两三年间仍吸引了巨额资本注入,并展现出与AI技术同步演进的强劲势头。
本期《硅谷101》,特约研究员刘一鸣邀请了两位深耕中美市场的资深投资人——华映资本海外合伙人Jonathan邱谆和Shanda Group合伙人/投资副总裁Christine Qing,透过资本的迷雾,审视具身智能赛道的真实格局。当下的繁荣究竟是泡沫的预演,还是技术爆发的前夜?中美企业在战略布局与核心优势上呈现何种差异?在商业化落地的竞赛中,哪些场景有望率先突围?
以下是这次对话内容的精选:
一鸣:我们先来构建一个全景图。最近 1X 发布的视频引发了很大争议,被称为 “ 人工 ” 智能。同时高盛的报告也指出产能与订单的巨大落差。从投资视角来看, 2025 年的人形机器人赛道,究竟是处于一个类似 “ChatGPT” 爆发的前夜,还是已经明显过热,甚至是泡沫破裂的前夕?
邱谆:我们内部一直也在非常激烈地讨论这个话题。一个核心观点是:一定会有一定的过热,但是我们觉得任何一个大的技术爆发的前夜都会过热。所以作为投资人,我们其实还是希望能够在这个过热当中,找到比较清晰的一些机会。
如果你问我现在的具体定位,我是把目前定义成“BERT时期”。
大家可能记得,Transformer架构是2017年刚出来的,然后2018年的时候Google推出了BERT模型。BERT时期的意义在于,我们已经有了一个比较清晰的技术路线了。
映射到今天的机器人领域,我们看到了包括VLA(Vision-Language-Action)、RT-2、Pi0等模型,其实都有一个看上去很清晰的技术路线。
第二个阶段才是ChatGPT时刻。其实刚涌现的时候(GPT-3),大家并没有真正能大规模用起来。直到ChatGPT出来,做了RLHF(人类反馈强化学习)等后训练调优之后,大家发现这个效果立刻就很亮眼了。
所以回到机器人,我们还在等第一个时刻,即GPT-3时刻。我们很期待有一个涌现的出现。
Christine:我非常同意Jonathan的观点。这肯定是分两个阶段爆发的。
第一阶段在技术上有了GPT时刻的标志是什么?我觉得可能是这个时候的具身智能机器人已经拥有了长期动作链的泛化能力。
第二阶段是一个类似ChatBot甚至iPhone的时刻。它最实质性的标志是:在C端的使用量有了一个在产品上面的规模性爆发。
一鸣:两位都是经常在中美两边跑,看过很多创业公司和上市公司。大家都在谈中美对比,无论在AI还是在机器人领域。在您看来,美国以特斯拉Optimus、Figure、Pi为代表的公司跟中国像宇树、智元、优必选这些公司,它们在战略打法或者说一些核心优势上,有哪些异同?谁更领先?
邱谆:我们确实今年投国内的具身项目投得比较多。不论中美,都有不少公司是偏融资属性、营销属性的打法。
中美的不同点可能更多是在技术栈上面的切分。
美国肯定相对还是偏“软”一些,尤其是在大模型这一块。
而从硬件的迭代上来说,中国是有巨大优势的。
Christine:美国它肯定是先得要走通用的基础模型。但是在中国,因为今年我在中国完全是一个学习心态,我更多的是回中国去学习。
我觉得产品是可以在深圳这个地方一天迭代三次的。
一鸣:现在市场上有一类公司可能它没有到泛化性的那种智能,它可能用一些原来的那种工业机器人再结合一些智能化做了一些改进。另一类是讲究全栈、讲究泛化的具身智能。这两派您觉得哪一派可能更现实一点?
邱谆:我不觉得这是两派,这是两个完全不同的投资逻辑。
第一类我们称之为“先进制造”或者“智能硬件”。
第二类才是真正的“具身智能”(Embodied AI)。
本文由主机测评网于2026-05-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545373.html