特斯拉的世界模拟器在ICCV大会上正式发布,引领自动驾驶模拟技术进入新阶段。
这些视觉上极为逼真的驾驶场景,全部由先进模拟器动态生成,展示了人工智能在自动驾驶领域的突破。
该模拟器在今年计算机视觉顶级会议ICCV上首次亮相,由特斯拉自动驾驶副总裁Ashok Elluswamy亲自深入讲解技术细节。
网友观看后反响热烈,认为这一模型技术卓越,展现了未来驾驶的无限可能。
除了初始展示的多场景驾驶视频,特斯拉的世界模拟器还能够为自动驾驶任务创建新的挑战性场景,以测试系统在极端条件下的性能。
例如,右侧车辆突然连续并线两条车道,闯入预设驾驶路径,模拟真实交通中的突发危险情况。
同时,AI可以在已有场景中执行自动驾驶任务,有效躲避行人和障碍物,提升系统的安全性和可靠性。
模型生成的场景视频,不仅可用于自动驾驶模型的训练和测试,还可以作为交互式电子游戏供人类体验,增强趣味性和实用性。
当然,除了驾驶相关应用,该模拟器对其他具身智能场景——例如特斯拉的擎天柱机器人——同样具有重要价值,推动通用人工智能发展。
在ICCV演讲中,特斯拉自动驾驶副总裁Ashok Elluswamy详细揭秘了特斯拉FSD的技术架构,并在X平台上发布了文字版本供业界参考。
Ashok首先强调,端到端AI才是自动驾驶的未来发展方向,它能够从数据中直接学习复杂驾驶策略。
特斯拉采用端到端神经网络实现自动驾驶,该网络整合来自多个摄像头的图像、运动信号(如车速)、音频、地图等多元数据,直接生成车辆控制指令,简化系统流程。
与端到端方法相对的是模块化驾驶系统,后者依赖大量传感器,初期更易开发和调试,但端到端方法具有显著优势:
将人类价值观转化为规则极其困难,而从数据中学习则相对简单;
模块化方法中感知、预测和规划之间的接口定义模糊,而端到端方法中梯度从控制输出一直回溯到传感器输入,实现网络整体优化;
端到端方法易于扩展,以处理现实世界机器人的复杂和长尾问题;
端到端系统具有确定性延迟和同质计算特性,提升效率。
Ashok举例说明,例如车辆行驶中遇到前方路面积水,可选择直接驶过或借用对向车道绕行,这需要综合权衡安全性。
驶入对向车道通常危险,但在此特定场景中,视野开阔且对向车道无车,借用车道避开水坑是合理选择,体现了人类驾驶的灵活性。
这种权衡难以用传统编程逻辑表达,但对于人类驾驶员,观察后决策却相对简单,端到端AI正致力于模拟这种能力。
端到端自动驾驶面临诸多挑战,其中之一是性能评估。特斯拉推出的世界模拟器正是为解决这一问题,提供闭环测试环境。
该模拟器使用特斯拉筛选的海量数据集训练,功能不是预测行动,而是根据当前状态和行动合成未来状态,实现动态模拟。
这些生成状态可与智能体或策略AI模型连接,以闭环方式运行,用于性能评估和优化。
同时,生成视频不仅用于评估,还可用于闭环大规模强化学习,以实现超越人类驾驶的表现。
除了评估,端到端自动驾驶还面临“维数灾难”,以及可解释性和安全性的挑战,需要高效数据处理和可靠推理。
在现实世界中,自动驾驶系统需处理高帧率、高分辨率、长上下文输入,以确保安全运行,这对计算能力提出高要求。
假设输入包括7个摄像头、36FPS、5百万像素、30秒场景画面,以及导航地图、运动数据、音频数据,总计约20亿输入Token,数据量巨大。
神经网络需学习正确因果映射,将20亿Token精简为2个输出(转向和加速),避免虚假相关性,这是巨大挑战,但特斯拉通过海量数据训练应对。
为此,特斯拉通过庞大车队,每日收集相当于500年驾驶数据,并用复杂数据引擎筛选高质量样本,确保训练效果。
使用此类数据训练,模型能获得高泛化能力,有效应对极端情况,提升自动驾驶的鲁棒性。
对于可解释性和安全性,如果车辆行为异常,端到端系统调试困难,但模型可生成可解释中间Token,用于推理和故障分析,增强透明度。
特斯拉的生成式高斯泼溅技术具有出色泛化能力,无需初始化即可建模动态物体,并能与端到端模型联合训练,提升场景理解。
所有高斯函数均基于量产车摄像头生成,确保实用性和可部署性,降低成本。
除了3D几何,推理还可通过自然语言和视频背景进行。该推理模型的小版本已在FSD v14.x中运行,逐步实现全场景智能。
尽管端到端被视作自动驾驶未来,但业界在软件算法路线上存在VLA和世界模型之争,各有支持者。
以国内为例,华为和蔚来代表世界模型路线,元戎启行和理想选择VLA路线,也有厂商主张两者结合,以取长补短。
VLA支持者认为,该范式可利用互联网海量数据积累常识,理解世界;同时通过语言能力具备思维链,处理长时序数据推理,提升智能水平。
更尖锐观点指出,一些厂家因算力不足而避免使用VLA模型,但技术进步正逐步解决此问题。
世界模型倡导者坚持该路线更接近问题本质,如华为车BU CEO靳玉志认为“VLA路径看似取巧,难实现真自动驾驶”,强调物理建模的重要性。
特斯拉方案备受关注,因在自动驾驶发展中,马斯克决策一贯准确,其技术路线选择可能影响行业走向。
特斯拉选择VLA还是世界模型,将决定端到端自动驾驶技术路线的未来,这场历史性决战值得期待。
您更看好VLA,还是世界模型?欢迎参与讨论。
参考文献:
[1]https://x.com/Tesla/status/1982255564974641628
[2]https://x.com/aelluswamy/status/1981644831790379245
本文由主机测评网于2026-01-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260117580.html