当前位置:首页 > 科技资讯 > 正文

探索智驾未来:世界模型的角色与挑战

探索智驾未来:世界模型的角色与挑战 世界模型 智能驾驶 仿真器 算法突破 第1张

文|肖漫

编辑|李勤

在过去的几年里,提及智能驾驶,车企们无不津津乐道各种前沿技术名词。

其中,“世界模型”一词在智驾领域迅速走红,不同公司赋予了它不同的称呼——小鹏称之为“世界基座模型”,蔚来则称为“端到端世界模型”,华为则称为“世界行为模型”(WA)。此外,地平线、理想、元戎启行、Momenta等公司也都在积极研发世界模型。

然而,仅从他们的发布会中,很难明确这些所谓的“世界模型”是否实质相同,以及它们究竟解决了什么问题,在智能驾驶架构中又占据何种位置。

将视角拓宽至更广泛的语境,“世界模型”本质上是在虚拟世界中重构真实世界,使人工智能能够像人类一样理解现实世界,认知物理规律、事物的因果关系和环境动态。

大多数科学家和科技公司视“世界模型”为“物理世界AI”技术发展的关键组成部分。斯坦福大学教授李飞飞曾指出,空间智能将是AI未来十年的重点,而世界模型正是构建空间智能的关键技术。

尽管行业前沿的科学家和科技公司仍在探索中,但中国汽车行业已经用各种新颖的概念名词占据了领先地位。

实际上,当前智驾行业所谈论的“世界模型”更多体现在名词上的差异,在技术路径上并没有太大区别。它们主要是对传统仿真工具进行技术升级,在更高还原度、更高颗粒度、更丰富场景和更高自由度的虚拟世界中,解决端到端模型的测试和验证问题,旨在训练出更高效、更人性化的端到端智驾模型。

换句话说,智驾厂商和车企并非真正打造一个完整的数字物理世界,而是利用世界模型的思路构建仿真器。

尽管各家对世界模型的期待可能有所不同,但据我们所知,目前智驾行业的世界模型仅应用于云端,尚未应用于汽车上。

端到端的普及凸显仿真器的短板

过去几年里,头部智驾方案从规则栈转向AI驱动,在形式上实现了统一,感知、预测、规划被尽可能地融入一个网络中,加上更大的模型和更高的算力,使得智驾系统更加像人类驾驶。

但在实际应用中却出现了一个反直觉的现象:端到端之后的新版本OTA并不一定变得更好,甚至可能退步。

问题的核心并非模型变差,而是AI驱动使得评估和回归变得困难。

许多智驾从业者曾认为,只要前端训练得足够好,车辆就能开得像人类。这一路径并非无效,端到端的前期表现确实令人震撼,但端到端的“黑盒”特性也带来了副作用。当模型出错时,研发人员很难确定错误原因及如何防止再次犯错。

模型的好坏不再仅仅是训练规模和数据的多少,更取决于如何发现问题、定义问题和验证问题。厂商们逐渐意识到需要一个更好的仿真器在模型验证阶段评估模型表现。

头部公司大多将世界模型作为仿真器的应用。例如,理想在2025年提出了一种包含自车和他车轨迹的驾驶世界模型,用于在仿真环境中进行强化学习;小鹏也在使用世界模型进行仿真测试,评估新版本的模型算法能力。

端到端的普及暴露了传统仿真器的不足。“在端到端普及之前,验证成本较低,还可以分段验证系统。现在无法分段验证系统了,仿真器的问题就凸显出来了。”一位业内研发人员表示。

...(内容略)