当前位置:首页 > 科技资讯 > 正文

英伟达革新科技:Alpamayo模型引领自动驾驶新纪元

美东时间周一(5日),在2026年国际消费电子展(CES)上,英伟达高调推出了两大最新科技成果——人形机器人技术,以及名为Alpamayo的全新自动驾驶汽车模型系列。

据公司首席执行官黄仁勋透露,从波士顿动力、卡特彼勒,到LG电子和德国机器人公司NEURA Robotics,众多企业都在利用英伟达的机器人技术来驱动其各类机器人。

英伟达声称,物理人工智能(AI)能够彻底改变规模达50万亿美元的制造业和物流业,而公司希望成为这一变革的核心。在今年的CES展会上,英伟达发布了一系列新的AI模型,旨在帮助训练机器人与周围世界的互动,以及为驱动其数字大脑提供必要的硬件支持。

自动驾驶模型“会推理”

除了人形机器人,英伟达还重点展示了Alpamayo自动驾驶汽车模型系列。据公司介绍,Alpamayo采用了一种基于思维链推理的视觉-语言-动作(VLA)模型,旨在加速下一代安全、基于推理的自动驾驶汽车(AV)的开发。

简单来说,这些模型能够识别在正常驾驶过程中不会出现的独特驾驶情况,并找出正确的行驶方式。例如,当车辆接近十字路口时,该模型可以检测到交通信号灯故障,识别出问题所在,并尝试找出下一步行动方案。

黄仁勋介绍称,Alpamayo平台使汽车能够在真实世界中进行“推理”,而首款搭载英伟达技术的汽车将于第一季度在美国上路。

英伟达革新科技:Alpamayo模型引领自动驾驶新纪元 英伟达 Alpamayo 自动驾驶 推理 第1张

英伟达在一份声明中解释称:

自动驾驶汽车必须在极其广泛的驾驶条件下安全运行。罕见且复杂的场景,通常被称为“长尾”,仍然是自动驾驶系统安全应对的最大挑战之一。传统的自动驾驶架构将感知和规划分离,这会在出现新的或异常情况时限制系统的可扩展性。尽管端到端学习技术的最新进展已取得显著成效,但要克服这些长尾极端情况,需要模型能够安全地进行因果推理,尤其是在情况超出模型训练经验范围时。

Alpamayo系列引入了基于推理的VLA模型,将类人思维引入自动驾驶汽车的决策过程。这些系统能够逐步思考新颖或罕见的场景,从而提升驾驶能力和可解释性——这对于增强智能汽车的信任度和安全性至关重要——并且由NVIDIA Halos安全系统提供支持。

黄仁勋表示:“物理人工智能的ChatGPT时刻已经到来——机器开始理解、推理并在现实世界中行动。无人驾驶出租车是首批受益者之一。Alpamayo为自动驾驶汽车带来了推理能力,使它们能够思考罕见场景,在复杂环境中安全驾驶并解释其驾驶决策——这是安全、可扩展自动驾驶的基础。”

与此同时,英伟达将免费开放Alpamayo模型,允许潜在用户自行对模型进行重新训练。这些模型旨在作为“教师大模型”,开发者可以对其进行微调,并将其提炼成其完整(自动驾驶)堆栈的骨干。

业界支持

英伟达表示,包括 Lucid、捷豹路虎、Uber和Berkeley DeepDrive等车企,都对Alpamayo表现出浓厚兴趣,希望开发基于推理的自动驾驶堆栈,以实现L4级自动驾驶。

Lucid Motors高级驾驶辅助系统和自动驾驶副总裁Kai Stepper表示:“向物理人工智能的转变凸显了对能够推理现实世界行为(而不仅仅是处理数据)的人工智能系统的日益增长的需求。先进的仿真环境、丰富的数据集和推理模型是这一演进过程中的重要要素。”

捷豹路虎产品工程执行总监Thomas Müller表示:“开放、透明的人工智能开发对于负责任地推进自动驾驶至关重要。通过开源Alpamayo等模型,英伟达正在帮助加速整个自动驾驶生态系统的创新,为开发者和研究人员提供新的工具,以安全地应对复杂的现实世界场景。”

Uber全球自动移动出行和配送负责人Sarfraz Maredia表示,“应对长尾和不可预测的驾驶场景是自动驾驶面临的关键挑战之一。Alpamayo为行业创造了令人兴奋的新机遇,可以加速物理AI、提高透明度并增加安全的L4级部署。”

标普全球高级首席分析师Owen Chen表示:“Alpamayo 1使车辆能够解读复杂环境,预测新情况并做出安全决策,即使在以前从未遇到过的场景中也是如此。该模型的开源特性加速了整个行业的创新,使合作伙伴能够根据自身独特需求调整和改进该技术。”

Berkeley DeepDrive联合主任Wei Zhan则称,“Alpamayo产品组合的发布对研究界来说是一次重大飞跃。英伟达决定将其开源具有变革性意义,因为其提供的访问权限和功能将使我们能够以前所未有的规模进行训练——这为我们提供了将自动驾驶推向主流所需的灵活性和资源。”