当前位置:首页 > 科技资讯 > 正文

2025年VLA浪潮重塑智能驾驶版图

2025年8月的最后一周,中国智能驾驶迎来了历史性的转折点——从算法底层到整车OTA,短短数日内,行业见证了“VLA齐爆发”的壮丽景象。

VLA,即视觉-语言-行动模型,正以其迅猛的商业化为“高阶智驾”设立了新的技术门槛。

理想汽车借纯电旗舰i8的上市契机,首次向所有用户推送了“VLA司机大模型”;元戎启行则在8月26日发布了自研VLA大模型,并推出了名为DeepRoute IO 2.0的新平台,计划应用于5款车型,覆盖约20万台车。

紧随其后,小鹏汽车在8月27日的新P7发布会上展示了新一代VLA架构,宣称时延<100ms、规划帧率20Hz,树立了量产新标杆。

与此同时,华为引领的另一条路线——WA(世界行为模型)也蓄势待发。ADS 4.0将在9月随问界M9年度改款OTA,旨在重新定义城区智驾体验。

2025年VLA浪潮重塑智能驾驶版图 VLA 智能驾驶 技术门槛 行业洗牌 第1张

而“VLA上车潮”之所以发生在2025年,从商业角度来看,是因为今年正处于城市NOA规模化交付(L2++)与Robotaxi商业化(L4)之间的“空档期”。

谁能率先完成VLA量产,谁就能在用户体验与融资叙事上抢占先机。错过2025,技术红利将被稀释,成本优势也将被供应链摊平。

VLA引发的新一轮竞争,不仅将决定中国车企的未来地位,更可能引发整个智驾产业的重新洗牌。

新的门槛

若要对VLA路线的技术优势进行简要概述,其核心在于:

与传统端到端路线相比,VLA通过语言和文字这一中间环节,将具象化的路况、图像进行归类和“抽象化”,而不仅仅是单纯地对数据进行“死记硬背”,从而提升了模型的泛化能力。

同时,具备思维链(CoT)能力后,VLA模型能分解驾驶决策为逻辑连贯的中间步骤,增强了决策逻辑性、系统可解释性及泛化能力。

当驾驶员面对突发路况时,会本能地完成“观察→判断→动作”的认知过程。

2025年VLA浪潮重塑智能驾驶版图 VLA 智能驾驶 技术门槛 行业洗牌 第2张

VLA正是通过模拟这一逻辑,构建了“视觉感知-语言推理-动作输出”的闭环系统,实现对长时序路况的预判能力,尤其在长尾场景中展现出更强的泛化能力。

然而,由于多了“语言”这一层数据,VLA对算力与数据的需求已提升至传统方案无法企及的高度。在算力方面,训练端需吞吐22T token级多模态数据;数据方面,需同步采集并标注视觉-语言-动作三元组。

这意味着,VLA的量产落地是“千卡训练云+千TOPS车端+千亿级数据”三线并进的极限工程。对于年销量仅十余万辆的中小车企而言,如此高昂的投入难以通过规模化摊薄。

行业洗牌

在VLA所需的高昂成本面前,中小车企的生存困境愈发凸显。除了算力与数据的差距外,从规则时代到端到端1.0积累的先发优势也是多数品牌难以复现的关键环节。

最初,规则算法将驾驶任务拆解为可验证的模块;进入端到端1.0后,系统用大规模标注数据替代人工规则;而迈向VLA时,需将前两阶段的工程学积累整体迁移到新框架里。

2025年VLA浪潮重塑智能驾驶版图 VLA 智能驾驶 技术门槛 行业洗牌 第3张

在这样的差距下,VLA的降临无疑会让行业迎来一次大洗牌。中低端车企、品牌要么难以在新时代生存,要么只能成为“方案外购者”,或沦为低端代工。

头部之变

尽管VLA模型备受瞩目,但并非所有车企都认可这一路线。华为和蔚来主推的另一条路线——世界模型(WA),其核心是通过海量云端模拟数据让大模型“理解”世界而学会驾驶。

2025年VLA浪潮重塑智能驾驶版图 VLA 智能驾驶 技术门槛 行业洗牌 第4张

但尽管世界模型看似更“终极”,VLA这条更务实的路线对理想、小鹏等车企仍具“改命”意义。一方面,理想需用智能化重新定义产品;另一方面,小鹏选择VLA混合架构,为将来的机器人铺路。

从市场角度看,虽然华为与Momenta已占据90%份额,但VLA大模型的普及将显著改变竞争格局。传统智驾模型每新增一个少见场景都得补数据;而VLA模型通过多模态学习和推理能力在长尾场景上也能接近华为的表现。

因此,在新一轮智驾竞争中,现有格局不会立刻颠覆,但VLA已打开了一个新窗口。随着技术升级的到来,中小车企的危局及头部间差距的缩小将成为愈发显著的趋势。