当前位置:首页 > 科技资讯 > 正文

英伟达开源VLA模型,推动自动驾驶技术革新

人人皆可享用,英伟达开放VLA自动驾驶模型。

近期,英伟达研究团队正式并开放性地发布了其全新的视觉-语言-动作(VLA)模型Alpamayo-R1(简称:AR1),并宣布未来将进一步开放该模型的核心数据集。

英伟达开源VLA模型,推动自动驾驶技术革新 英伟达 VLA模型 自动驾驶 开源 第1张

▲Alpamayo-R1对应的数据集已上传至开源社区

目前,该模型对应的数据集也已上传至开源社区,总大小约100TB,这也是英伟达首次将VLA模型进行开源。

在数据许可方面,英伟达明确了数据集可用于商业及非商业用途,这可能意味着之前缺乏VLA技术积累的公司也能通过英伟达快速进入VLA开发领域。

英伟达开源VLA模型,推动自动驾驶技术革新 英伟达 VLA模型 自动驾驶 开源 第2张

▲Alpamayo-R1模型架构

此举不仅打破了高端自动驾驶模型的封闭壁垒,更标志着端到端自动驾驶技术从简单的“模仿行为”迈入具备深层“因果思考”的新阶段。

对自动驾驶行业而言,Alpamayo-R1的推出直击了当前最棘手的痛点——长尾场景下的安全性。

英伟达此次带来的Alpamayo-R1正是为了攻克这一难题,而其实际测试成绩也十分亮眼。

英伟达开源VLA模型,推动自动驾驶技术革新 英伟达 VLA模型 自动驾驶 开源 第3张

▲Alpamayo-R1性能显著提升

在针对极高难度长尾场景的测试中,AR1的规划准确率相比仅有轨迹预测的基线模型提升了整整12%;在闭环仿真测试中,AR1成功将车辆冲出道路的事故率降低了35%;与其他车辆或行人的近距离危险遭遇率也大幅减少了25%。

值得一提的是,即便在集成复杂的推理大脑后,该模型在NVIDIA RTX 6000 Pro Blackwell车载硬件上依然保持了99毫秒的端到端超低延迟,完全满足实时自动驾驶的严苛需求。