当前位置:首页 > 科技资讯 > 正文

智驾革命:从“说话”到“思考”的跨越

当理想i8在暴雨肆虐的山区公路上,精准识别出路肩损毁并规划出安全绕行路线;当小鹏P7 Ultra仅凭视觉传感器就巧妙避开了横穿马路的流浪猫与突发变道的货车时,智能驾驶行业悄然迎来了技术革新的临界点。

新能源汽车市场的淘汰赛已激战正酣,从电池续航、充电速度到座舱智能化,竞争之下市场已步入红海,而智能驾驶能力也正从饱受争议的“加分项”转变为决定车企命运的“生存项”。

今年8月,理想、小鹏、元戎启行在短短两周内相继宣布将VLA(Vision-Language-Action)大模型应用于车辆,规划帧率从10Hz跃升至20Hz,端到端时延压缩至100ms。与此同时,华为在松山湖实验室里展示了一辆搭载激光雷达的轿车,在仿真环境中连续“预见”未来5秒,成功从复杂路况中脱困,背后正是WA(World Action)世界模型的助力。

智驾革命:从“说话”到“思考”的跨越 智能驾驶 VLA WA 技术革命 第1张

两条截然不同的路径,却导向了相同的终点。VLA让汽车能够“开口说话”,而WA则让汽车能够“动脑想象”。谁能在“说话”与“思考”之间架起桥梁,谁就能在这场新能源淘汰赛的最后一节获得发球权。

后端到端的时代变革

在智能驾驶行业的早期阶段,硬件无疑是竞争的核心。车企深知,要让车辆具备智能驾驶能力,首先得让车辆“看”得见、“听”得清、“反应”得快。因此,它们在传感器、芯片等硬件上投入了大量资金与精力。

传感器如同车辆的“眼睛”和“耳朵”,能够感知周围环境。激光雷达、摄像头、毫米波雷达等各有千秋,车企需根据自身技术路线和成本预算进行选择与搭配。

芯片则是车辆的“大脑”,负责快速处理传感器数据并作出决策。高性能芯片提供强大计算能力,支持复杂算法运行,实现更高级的智能驾驶功能。英伟达、英特尔等芯片巨头不断在算力、功耗上取得突破,成为车企争相合作的对象。

智驾革命:从“说话”到“思考”的跨越 智能驾驶 VLA WA 技术革命 第2张

然而,在以往的硬件竞赛逻辑中,车企们普遍认为“传感器数量决定感知能力”,但这种思路很快陷入了高成本与低效率的双重困境。以激光雷达为例,2020年一颗高性能激光雷达成本超过1万美元,搭载3颗激光雷达的车型仅硬件成本就增加3万美元,导致早期智驾车型售价普遍超过50万元,难以进入主流市场。

特斯拉作为端到端路线的先行者,于2019年为智能驾驶发展开辟新道路。其通过大量实际路测数据训练模型,使车辆直接从传感器输入到控制输出,实现自动驾驶技术的快速迭代。

特斯拉利用其庞大的车队和用户群体,收集海量实际路测数据,涵盖各种路况、天气和驾驶场景。通过对这些数据进行分析与训练,自动驾驶模型不断优化改进,实现自动辅助导航驾驶、自动变道、自动泊车等高级功能。

国内车企看到端到端路线的成功,纷纷效仿。它们加大数据采集与模型训练投入,希望在智能驾驶竞赛中占得一席之地。

不过,端到端路线并非完美。在处理长尾场景时存在局限,如突然出现行人、违规行驶车辆、恶劣天气道路状况等。由于这些场景出现频率低,端到端模型难以通过少量数据充分学习与训练,面对这些情况往往难以作出准确判断与决策。

VLA的闪电逆袭

端到端路线的局限为VLA路线的崛起埋下伏笔。

2023年底,理想汽车率先提出VLA技术概念。其核心在于整合视觉、语言、行动三种模态,让智驾系统像人类一样“观察、推理、决策”。

与端到端的“数据映射”不同,VLA系统能将视觉感知信息转化为语言描述,再通过语言模型进行逻辑推理,最后输出具体行动指令。

在智能驾驶赛道上,“先发优势”曾被视为不可逾越的壁垒。然而VLA路线的出现让理想、小鹏等“后发者”实现了闪电逆袭彻底改写了行业竞争格局。

...(内容继续)