当前位置:首页 > 科技资讯 > 正文

自动驾驶技术路线:视觉与传感器融合的未来

全球自动驾驶的商业化应用正在快速推进,但技术挑战依旧严峻。

截至2025年5月,Waymo在美国多个城市运营了1500辆自动驾驶出租车,每周完成超过25万次付费出行服务;百度Apollo则在全球部署了超1000辆无人驾驶汽车,累计提供超1100万次出行服务,安全行驶里程超过1.7亿公里。

尽管大规模落地看似技术已成熟,实则不然。自动驾驶领域仍存在诸多未决的争议和分歧。

自动驾驶技术路线:视觉与传感器融合的未来 自动驾驶 视觉方案 多传感器融合 技术路线 第1张

例如,传感器方案选择、系统架构设计,以及视觉语言模型(VLM)与视觉语言动作模型(VLA)的优劣等,都是亟待解决的问题。

这些争议引领着自动驾驶驶向一个尚未完全确定的未来。而理解这些不同的技术路线,就是理解自动驾驶的起源、发展方向,以及如何实现技术的自我进化。

视觉与传感器的对决

纯视觉 vs 多传感器融合

自动驾驶的基石在于汽车如何感知世界。这里存在两大对立的阵营:纯视觉和多传感器融合。

早在2004年,美国莫哈韦沙漠的一场挑战赛就揭示了这两大阵营的渊源。

美国国防高级研究计划局设立了高额奖金,吸引顶尖高校和科研机构参与,试图解答车辆如何感知周围环境的问题。激光雷达因能生成精确3D点云图而胜出,被谷歌旗下的Waymo继承和发展。

然而,激光雷达的高成本成为其大规模商业化的障碍。相比之下,特斯拉代表的视觉派选择了另一条路,通过深度学习算法从二维图像中重建三维环境,成本极低。

自动驾驶技术路线:视觉与传感器融合的未来 自动驾驶 视觉方案 多传感器融合 技术路线 第2张

视觉派主张“机器为何不能像人类一样靠一双眼睛和一个大脑就开车?”而多传感器融合派则认为,在恶劣天气下,激光雷达等硬件冗余是弥补软件不足的必需。

目前,主流车企大多站在多传感器融合的阵营,认为安全是自动驾驶不可逾越的红线,而冗余是保障安全的唯一途径。

传感器的抉择

激光雷达 vs 4D毫米波雷达

在多传感器融合派内部,也面临着选择:是选择成本仅数百元的毫米波雷达,还是早期要数万美元的激光雷达?

激光雷达能构建出周围环境的精细3D点云图像,解决其他传感器无法解决的“Corner Case”。然而,其高昂成本和在恶劣天气下的性能局限,使得4D毫米波雷达成为必要的补充。

自动驾驶技术路线:视觉与传感器融合的未来 自动驾驶 视觉方案 多传感器融合 技术路线 第3张

4D毫米波雷达能全天候工作,在恶劣天气下表现优异,但分辨率较低,无法成为主传感器。因此,二者互补,不同车型有不同配置。

算法的设计

端到端 vs 模块化

如果说传感器是眼睛,那么算法就是大脑。很长一段时间里,自动驾驶系统都采用模块化设计,但存在信息损失的问题。

特斯拉FSD V12的端到端模型颠覆了传统范式。

自动驾驶技术路线:视觉与传感器融合的未来 自动驾驶 视觉方案 多传感器融合 技术路线 第4张

端到端模型通过学习海量人类驾驶数据构建神经网络,直接映射传感器数据到驾驶控制指令。尽管性能优异,但存在黑箱问题。

“灵魂”的探讨

VLM vs VLA

随着AI发展,新的战场在大模型内部开辟。自动驾驶的灵魂应该是辅助驾驶的思考者(VLM),还是执行者(VLA)?

自动驾驶技术路线:视觉与传感器融合的未来 自动驾驶 视觉方案 多传感器融合 技术路线 第5张

VLM信奉协同,追求过程可控;而VLA信奉涌现,追求结果最优。目前,大部分主流车企和自动驾驶公司都走在VLM路线上。

回顾这些技术争论,我们发现它们从未以一方完全胜出告终,而是在碰撞中相互融合,推动自动驾驶不断向前发展。