特斯拉是否也在采用VLA技术?这一疑问在行业内引发了广泛讨论与猜测。
经过多年沉寂,特斯拉再度进行技术披露,在计算机视觉国际顶级会议ICCV上公开了其全自动驾驶(FSD)的核心系统架构。其中一个关键细节激起行业热潮,众多专家推测特斯拉可能已应用视觉语言行动模型(VLA)技术。
特斯拉自动驾驶部门副总裁阿肖克·埃鲁斯瓦米近期作为特邀嘉宾,在ICCV大会上发表了题为《在特斯拉构建机器人基础模型》的主旨演讲。
这是特斯拉三年来首次对外进行技术分享。上一次还需追溯到2022年的特斯拉AI日,当时埃鲁斯瓦米也参与分享,提出了占用网络新范式,引领了行业变革。
从流出的模糊图像可见,这页PPT标题为《可解释性和安全性保证》,均为当前自动驾驶领域的关键议题。
图像下方展示了FSD的核心架构,目前FSD已被整合为一张大型神经网络,可输入多模态信息,图中涉及摄像头视频、导航数据、车辆自身运动状态及声音。
输出端包括全景分割信息、3D占用网络、3D高斯渲染、语言以及特斯拉以省略号代指未公开的输出信息,最终经推理后输出动作指令。
此图显示与隐含的信息,与中国业界当前的一些认知高度吻合,主要体现于两点。
首先,特斯拉现有架构最终输出语言信息,引发诸多猜测。众所周知,今年行业除传感器选型存在分歧外,软件算法路线也出现新争议,即VLA与世界模型之争。
前者以元戎启行和理想为代表,后者以华为和蔚来为代表,亦有厂商认为应将二者结合。
VLA支持者认为,该范式一方面可利用互联网已有海量数据,积累丰富常识,从而更深入地理解世界。另一方面,模型通过语言能力实际具备思维链能力,能理解长时序数据并进行复杂推理。
甚至有从业者指出,个别不采纳VLA路线的企业,是因为自身缺乏大算力芯片供应,导致无法搭载大模型。
世界模型倡导者则坚持世界模型更接近问题本质,华为车BU CEO靳玉志认为“VLA这样的路径看似取巧,并不能真正走向自动驾驶”。
知名AI科学家、蔚来智能驾驶副总裁任少卿近期在采访中表示,世界模型在时空认知能力上比VLA具有“更高的带宽”,即能识别和利用更多信息。
但他也承认当前语言很重要,在数据训练、逻辑推理和人机交互上有重大价值。
回到特斯拉曝光信息,语言在自动驾驶中确有重要应用。有人据此认为特斯拉也在使用VLA技术,但也有人表示这可能只是特斯拉识别道路标识后转化为语言。您怎么看?欢迎在评论区讨论。
其次,综合当前曝光信息,特斯拉FSD已步入大模型阶段,且参数规模持续扩大。此前元戎启行在VLA发布会上就指出,行业现已进入大模型时代。更大参数量的模型需更大算力芯片支撑,因此今年二十万级以上车型涌现众多1000TOPS甚至2000TOPS算力的新车。
特斯拉即将搭载的新一代智能辅助驾驶芯片,据称算力也将达2000TOPS,模型参数提升十倍,算法能力值得期待。
或许基于对未来能力的充分自信,近期FSD重启了激进驾驶模式。
FSD推送了V14.1.3版本,更新多达10项,更安全且更具“人性化”。
安全性方面,优化了遇到细小障碍物如树枝、轮胎和箱子等的横向避让能力。面对无保护转弯、变道和车辆加塞,处理也更为出色。
前置摄像头自清洁功能更快速高效,若前挡风玻璃上有残留物影响前置摄像头可见度,现会发出警报,用户可联系服务部门处理。
个性化方面,驾驶前可通过速度配置文件更细化定制驾驶偏好。FSD在路上遇到特种车辆如警车、救护车和消防车时,增加了靠边停车或让行动作。
若遇堵车,现FSD神经网络中增添了导航和路线功能,能实时处理并生成绕行路线。
到达终点后,用户还可选择停车位置,例如停在路边或进入停车场。
在此小版本更新前几天,FSD还重启了疯狂麦克斯模式,整体驾驶风格激进,有车主分享视频显示,FSD在此模式下于夜晚洛杉矶车流中灵活变道加塞,看似比直升机通勤效率更高。
埃鲁斯瓦米看到后推荐了两个该模式适用场景,例如当你快赶不上飞机时,或着急接孩子放学。
埃鲁斯瓦米本人的社交平台更新,停留在ICCV演讲前一天,故在占用网络和端到端后,特斯拉FSD V14现今采用何种技术,仍是未解之谜。
已知的是,特斯拉不再对外分享后,中国玩家仍在持续突破,无论是VLA还是世界模型,皆是在无人区探索。
即便特斯拉选择了其中一条路线,也不代表此为标准答案,正如何小鹏所说,“实际上,国内任何一家有实力AI玩家,早就不care马斯克在做什么了”。
车辆本体告别BBA崇拜后,中国自动驾驶算法,也正告别特斯拉崇拜。
本文由主机测评网于2026-01-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260117040.html