当前位置:首页 > 科技资讯 > 正文

巨头竞速:黄仁勋与张一鸣的机器人蓝图

具身智能正成为科技界的热点,中国龙头企业宇树科技的上市步伐加快,而中美科技巨头则在更深的层面布局这一领域。

今年3月,在GTC 2025主题演讲中,英伟达CEO黄仁勋展示了挪威机器人公司1X的NEO Gamma人形机器人。这款机器人运用了基于英伟达GR00T N1模型的后训练策略,执行自主整理任务。

黄仁勋的演示意在证明,人形机器人的未来在于其适应性和学习能力。换言之,机器人的成败,关键在于“大脑”能否适应环境、能否学习新知识。

几个月后,全球科技巨头在“机器人大脑”方面取得了新进展。

8月,英伟达推出Jetson AGX Thor,一款能在机器人本体上运行多个生成式AI模型的边缘计算平台。这款平台被行业公认为“机器人新大脑”。

Jetson AGX Thor(以下简称Thor)是面向机器人和物理设备的新一代技术栈。基于Blackwell GPU架构,Thor的峰值算力达到2070 FP4 TFLOPS,AI性能较上一代Jetson AGX Orin提高多达7.5倍,同时能效提升3.5倍。

Thor的最大突破在于,它能让过去依赖云端处理或多块芯片的机器人,在单一紧凑的模块上实现实时感知和决策。

目前,亚马逊仓储机器人和波士顿动力等早期用户已经开始在自家产品上集成Thor,目标是打造更智能、更独立的机器人产品。

与此同时,字节在7月和9月先后推出自研的通用机器人模型GR-3和Robix,展示了在真实家庭场景下执行复杂任务的能力。

字节Seed团队的演示视频中,一台搭载GR-3的机器人完成了将衣架插入衬衫并挂起的任务。上周,Seed又推出了最新的研究成果——Robix,与GR-3一起组成了字节新一代机器人模型矩阵。

此时距离黄仁勋在GTC 2025的感慨仅过去半年时间。两家巨头在机器人赛道的“同频”,也给人这样一种印象:黄仁勋和张一鸣,这次想到一块去了。

A

在Thor横空出世前,英伟达已是机器人赛道的领头羊。

英伟达Jetson平台在高端机器人和自主机器开发领域占据主导地位,其生态系统中拥有超过200万名开发人员,超过7000家公司使用上一代产品Orin系列。

今年8月,英伟达宣布Thor正式开售。单从硬件性能和成熟度来看,它在同类产品中几乎处于绝对领先的地位。

巨头竞速:黄仁勋与张一鸣的机器人蓝图 具身智能 机器人大脑 英伟达 字节 第1张

目前,英特尔、高通等竞争对手的边缘AI产品相对落后,尚无法在单一模块中实现同等水平的集成计算。

更关键的是,英伟达将硬件与软件堆栈紧密绑定,并依托CUDA工具包的广泛应用,形成了生态护城河。

Thor可以直接调用英伟达完整的Isaac机器人软件平台、AI模型库和仿真工具,实现端到端的深度集成。其中包括针对机器人场景的最新模型——Isaac GR00T N1,一款开源、预训练且可定制的基础模型。

GR00T N1采用了受人类认知启发的双系统架构。一个系统是“快速思考行动模型”,其行为类似于人类的反应和直觉;另一个系统是“慢思考模型”,能够推理周围环境和收到的指令,从而规划行动。

GTC 2025上,1X公司CEO Bernt Børnich表示:“在我们开发自主模型的同时,英伟达的GR00T N1显著提升了机器人的推理能力和技能。我们仅使用极少的后训练数据,就将NEO Gamma完全部署到位。”

然而,Thor并非完美无缺。

首先是价格。Jetson AGX Thor开发套件的售价为3499美元,很难成为普通家用产品的选择。

此外,Thor平台有着更高的功率要求,这意味着其适配的产品需要稳定的供电能力,例如自动驾驶汽车、工厂机器人、送货机器人等。

B

在“机器人大脑”的赛道上,英伟达很快有了中国竞争对手。

7月底,字节发布全新一代机器人VLA模型GR-3。官方演示中,搭载GR-3的机器人ByteMini将衣架插入衬衫并将其挂起来,还完成了拾取家居用品、放置在指定位置等高难度任务。

巨头竞速:黄仁勋与张一鸣的机器人蓝图 具身智能 机器人大脑 英伟达 字节 第2张

此外,ByteMini可以区分不同尺寸的物品,并成功执行拿起“较大的盘子”的指令。

拆解演示过程和技术报告可以发现,GR-3能够理解复杂、抽象的语言,比如“较大的盘子”“左边的椅子”等。

此外,GR-3少样本适配能力较强。据外媒报道,Seed采用混合方法训练:首先向 GR-3 输入大量图像和文本数据,随后借助虚拟现实环境中的人机交互进行微调;最后再让其学习并模仿现实世界中的机器人动作。这套训练策略使 GR-3 具备了适应性能力。

据了解,GR-3相比GR00T系列有着更大的参数规模,实际应用中表现更好。

曾在Meta就职的AI科学家Chris Paxton在一篇关于机器人领域VLA的研究中披露,字节的40亿参数GR-3模型表现似乎优于英伟达的GR00T。可以合理推测,一旦有足够的数据和算力支撑,“规模定律”依然有效。

C

Robix和GR-3不是字节第一次在机器人VLM领域“秀肌肉”。

很多人把字节看作互联网内容公司,但在机器人领域,它其实是一位低调的“隐形巨头”。

巨头竞速:黄仁勋与张一鸣的机器人蓝图 具身智能 机器人大脑 英伟达 字节 第3张

“下一代通用机器人”岗位的出现以及Seed团队今年人数预计超过300人等信息表明字节在机器人领域的雄心壮志。

\n\n