特斯拉再度技术分享,揭开FSD核心架构的神秘面纱,其中细节引发行业广泛讨论,让人猜测特斯拉是否也在采用VLA技术。
VLA与世界模型,作为2025年最具话题性的技术路线,终于迎来了来自马斯克亲自pick的答案?
特斯拉自动驾驶副总裁阿肖克·埃鲁斯瓦米(Ashok Elluswamy)在ICCV期间发表了《在特斯拉构建机器人基础模型》的主题演讲,为行业带来了新思考。
这是特斯拉时隔3年再次对外公开技术分享,上一次还要追溯到2022年的特斯拉AI Day,当时埃鲁斯瓦米也参与了分享,提出占用网络新范式,引领了行业变革。
尽管此次分享的内容尚未公开,但一张流出的PPT却信息量巨大,引发了广泛讨论。
从模糊的图像中可以看到,这页PPT的标题是《可解释性和安全性保证》,都是自动驾驶的重要议题。
图像下方展示了FSD的核心架构,目前FSD已被整合为一张大型神经网络,可处理多模态信息,包括摄像头视频、导航信息、自车运动状态和声音。
输出端则涵盖了全景分割信息、3D占用网络、3D高斯渲染、语言等,还有特斯拉以省略号代替的未透露信息,最终汇总经过推理后输出动作。
这些信息与中国玩家的认知不谋而合,主要集中于两点。
首先,特斯拉当前的架构输出了语言信息,引发了很多人的猜想。今年行业在软件算法路线上出现了新的争论,即VLA与世界模型之争。
VLA以元戎启行和理想为代表,而世界模型则以华为和蔚来为代表。一些玩家认为应两者结合。
VLA玩家认为,该范式能应用互联网海量数据积累常识,并通过语言能力理解长时序数据进行推理。有从业者甚至表示,个别不走VLA路线的玩家是因为缺乏大算力芯片供应。
世界模型玩家们则坚持世界模型更接近问题本质。华为车BU CEO靳玉志认为“VLA这样的路径不能真正走向自动驾驶”。
知名AI科学家、蔚来智能驾驶副总裁任少卿也表示,世界模型在时空认知能力上比VLA具有“更高的带宽”。但他也认可语言在数据训练、逻辑推理和人机交互上的价值。
回到特斯拉的曝光信息来看,语言在自动驾驶中有重要应用。有人认为特斯拉也在使用VLA技术,但也有人认为这可能只是识别了道路标识并转化为语言。你怎么看?欢迎在评论区讨论。
其次,综合当前曝光信息来看,特斯拉FSD已步入大模型阶段,且参数规模仍在扩大。元戎启行在VLA发布会上也认为行业已进入大模型时代。更大参数量的模型需要更大算力芯片支撑。
特斯拉即将上车的新一代智能辅助驾驶芯片,据说算力也将直奔2000TOPS,模型参数也将提高十倍,算法能力值得期待。
FSD推送了V14.1.3版本,更新多达10项,旨在提升安全性和个性化。
安全性方面,优化了遇到细小障碍物的避让能力,面对无保护转弯、变道和车辆加塞处理更好。前置摄像头自清洁功能更加快速高效。
个性化方面,可通过速度配置文件更细化定制驾驶偏好。遇到特种车辆会靠边停车或让行。堵车时添加了导航和路线功能生成绕行路线。
在FSD V14更新前几天还重启了疯狂麦克斯模式(Mad Max Mode),整体驾驶风格很激进。
埃鲁斯瓦米也推荐了两个该模式适用的场景,如快赶不上飞机或着急接孩子放学。
本文由主机测评网于2026-05-06发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543145.html