当前位置:首页 > 科技资讯 > 正文

自动驾驶新纪元:世界模型重塑智能与物理

当Waymo的无人驾驶车在旧金山街头每日完成1.4万单接送任务时,司机们的评价却带有一丝调侃——“这车有点楞”。它能精准停在红灯前,却读不懂外卖小哥突然变道的意图;能在暴雨中识别车道线,却猜不透前车双闪背后的紧急状况。自动驾驶技术看似已逼近实用门槛,却始终隔着一层“常识”的窗户纸。这背后,是AI模型从“看见”到“理解”再到“想象”的进化之路,而世界模型(World Model)的出现,正让自动驾驶朝着“老司机”的直觉思维加速迈进。

自动驾驶新纪元:世界模型重塑智能与物理 世界模型 自动驾驶 AI进化 物理规律 第1张

从“模块化流水线”到“认知闭环”

当前量产自动驾驶系统的主流架构,像一条精密运转的“模块化流水线”。摄像头与激光雷达将现实世界拆解成3D点云和2D语义标签,预测模块基于历史轨迹推算目标下一步动作,最后由规划器计算出方向盘转角与油门力度。这种“感知-预测-规划”的割裂设计,就像给机器装上了高精度的眼睛和手脚,却忘了赋予它思考的大脑。

自动驾驶新纪元:世界模型重塑智能与物理 世界模型 自动驾驶 AI进化 物理规律 第2张

在复杂交通场景中,这套系统的短板暴露无遗。当纸箱被狂风卷起时,它无法预判落点;当小孩在路边追逐皮球时,它难以想象冲出斑马线的可能性。问题的核心在于,机器缺乏人类大脑那种“有限观测→完整建模→未来推演”的认知能力。人类司机看到积水路面会自动减速,不是因为识别了“积水”标签,而是基于“水膜会降低摩擦系数”的物理常识——这种对世界运行规律的内在理解,正是当前AI最欠缺的能力。

世界模型的突破性意义,在于它构建了一个可动态推演的“数字孪生大脑”。与传统模型只处理单次感知-决策不同,它能在内部模拟出一个微型世界:输入当前路况和假设动作,就能生成未来3-5秒的视觉流、激光点云变化,甚至轮胎与地面的摩擦系数波动。这种“在脑海里预演”的能力,让机器第一次拥有了类似人类的“预判直觉”。例如蘑菇车联推出的MogoMind大模型,作为首个物理世界认知AI模型,已在国内多个城市的智能网联项目中展现出这种特性——通过实时全局感知交通流变化,提前3秒预判路口冲突风险,使通行效率提升35%。

自动驾驶新纪元:世界模型重塑智能与物理 世界模型 自动驾驶 AI进化 物理规律 第3张...