自动驾驶领域正因“世界模型”而掀起一场技术路线之争。
这场争论的核心源于“世界模型”(World Model)的兴起,它引发了行业对WM、WEWA、VLM、VLA等术语的混淆与讨论。作为观察者,你是否能清晰区分这些概念?
随着“端到端”大模型的火热应用,“世界模型”的引入进一步丰富了高端智能驾驶的技术内涵,但也带来了复杂性。业界开始质疑:如何定义真正的“世界模型”?它与VLA之间又存在怎样的关联?
近期,一场“打假”风波浮现。小鹏汽车董事长何小鹏在全新小鹏P7发布会后的群访中直言:“据我所知,国内能真正实现VLA而非变种方案的企业,可能仅我们一家。”这番话虽未点名,但此前宣布VLA量产的只有理想汽车,因此被视为对友商的间接批评。
与此同时,对VLA和世界模型持不同意见的声音也在出现。华为智能汽车解决方案BU CEO靳玉志在同一日表示:“华为不会选择VLA路径,这看似取巧,却非实现真正自动驾驶的正途。”他解释道,华为更注重WA(World Action),即省略语言中间层,直接通过视觉信息控制车辆,从而提升效率与准确性。
那么,小鹏为何批评友商的VLA?华为又为何否定VLA?这背后反映了技术路线的深层次分歧。
首先,VLA(视觉-语言-行为大模型)本质上是端到端与VLM(视觉语言模型)技术进化的产物,旨在解决传统方案的局限性。它通过语言层增强可解释性,但在空间感知方面存在不足,这正是华为转向WA的原因。
元戎启行CEO周光则力挺VLA,称其“下限已超越端到端上限”,并强调思维链和长时序推理是VLA的核心能力。而小鹏汽车通过硬件升级(如搭载三颗图灵芯片)和OTA推送VLA,试图在车端实现突破,但对其车端参数量不足的问题持批判态度。
理想汽车则采用车端快慢双系统,慢系统部署22亿参数VLM,并计划升级为MindVLA,但其基座模型实际部署在云端,用于仿真训练。小鹏自动驾驶副总裁李力耘指出,车端模型参数量有限,难以实现智能“涌现”,因此小鹏研发了720亿参数的云端“世界基座模型”,通过蒸馏技术部署到车端,形成云端到车端的协同体系。
地平线相关负责人在HSD体验日上评论道,无论端到端、VLM还是VLA,本质都是端到端的演变,国内业界可能过于热衷新概念,而真正关键在于产品收益。
“世界模型”概念最早由特斯拉提出,旨在通过AI大模型构建虚拟环境,以学习和验证自动驾驶能力。其做法是将真实数据转化为虚拟场景,实现“重建”与“生成”,从而优化决策规划。
在国内,蔚来率先发布世界模型(NWM),目标是从“感知驱动”转向“认知驱动”,直接在车端构建平行世界引擎,无需人工标注。但这对车端算力要求极高,实时优化仍是挑战。华为则提出云端+车端的WEWA模型,云端WE作为“AI驾校”,车端WA作为“AI驾驶大脑”,据称算力消耗降低75%。
从技术角度看,世界模型通过生成式方法(如视频生成加提示控制)解决数据难题,利用虚拟环境模拟Corner Case,但实现路径各异。蔚来依赖SORA类复合模型,特斯拉采用SVD扩散模型,而华为强调效率提升。
地平线市场负责人指出,世界模型的前景取决于产品收益:新方法前期收益易获,后期难突破,端到端基础未夯实前,盲目转向可能带来问题。最终,技术之争应回归实际应用效果,而非概念炒作。
总之,自动驾驶技术正处快速迭代期,世界模型与VLA的路线博弈反映了行业对未来的探索。无论是云端协同还是车端优化,核心仍在于通过创新提升驾驶安全与体验。这场争论或许会持续,但实践验证将是最终的裁判。
本文由主机测评网于2025-12-31发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251214031.html