当前位置:首页 > 科技资讯 > 正文

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议

特斯拉是否也在采用VLA技术?这一疑问在行业内引发了广泛讨论与猜测。

经过多年沉寂,特斯拉再度进行技术披露,在计算机视觉国际顶级会议ICCV上公开了其全自动驾驶(FSD)的核心系统架构。其中一个关键细节激起行业热潮,众多专家推测特斯拉可能已应用视觉语言行动模型(VLA)技术。

特斯拉是否采用VLA技术?

特斯拉自动驾驶部门副总裁阿肖克·埃鲁斯瓦米近期作为特邀嘉宾,在ICCV大会上发表了题为《在特斯拉构建机器人基础模型》的主旨演讲。

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议 特斯拉FSD  VLA 世界模型 自动驾驶 第1张

这是特斯拉三年来首次对外进行技术分享。上一次还需追溯到2022年的特斯拉AI日,当时埃鲁斯瓦米也参与分享,提出了占用网络新范式,引领了行业变革。

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议 特斯拉FSD  VLA 世界模型 自动驾驶 第2张

从流出的模糊图像可见,这页PPT标题为《可解释性和安全性保证》,均为当前自动驾驶领域的关键议题。

图像下方展示了FSD的核心架构,目前FSD已被整合为一张大型神经网络,可输入多模态信息,图中涉及摄像头视频、导航数据、车辆自身运动状态及声音

输出端包括全景分割信息、3D占用网络、3D高斯渲染、语言以及特斯拉以省略号代指未公开的输出信息,最终经推理后输出动作指令。

此图显示与隐含的信息,与中国业界当前的一些认知高度吻合,主要体现于两点。

VLA与世界模型之争,迈向大模型阶段

首先,特斯拉现有架构最终输出语言信息,引发诸多猜测。众所周知,今年行业除传感器选型存在分歧外,软件算法路线也出现新争议,即VLA与世界模型之争

前者以元戎启行理想为代表,后者以华为蔚来为代表,亦有厂商认为应将二者结合。

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议 特斯拉FSD  VLA 世界模型 自动驾驶 第3张

VLA支持者认为,该范式一方面可利用互联网已有海量数据,积累丰富常识,从而更深入地理解世界。另一方面,模型通过语言能力实际具备思维链能力,能理解长时序数据并进行复杂推理。

甚至有从业者指出,个别不采纳VLA路线的企业,是因为自身缺乏大算力芯片供应,导致无法搭载大模型。

世界模型倡导者则坚持世界模型更接近问题本质,华为车BU CEO靳玉志认为“VLA这样的路径看似取巧,并不能真正走向自动驾驶”

知名AI科学家、蔚来智能驾驶副总裁任少卿近期在采访中表示,世界模型在时空认知能力上比VLA具有“更高的带宽”,即能识别和利用更多信息。

但他也承认当前语言很重要,在数据训练、逻辑推理和人机交互上有重大价值。

回到特斯拉曝光信息,语言在自动驾驶中确有重要应用。有人据此认为特斯拉也在使用VLA技术,但也有人表示这可能只是特斯拉识别道路标识后转化为语言。您怎么看?欢迎在评论区讨论。

其次,综合当前曝光信息,特斯拉FSD已步入大模型阶段,且参数规模持续扩大。此前元戎启行在VLA发布会上就指出,行业现已进入大模型时代。更大参数量的模型需更大算力芯片支撑,因此今年二十万级以上车型涌现众多1000TOPS甚至2000TOPS算力的新车。

特斯拉即将搭载的新一代智能辅助驾驶芯片,据称算力也将达2000TOPS,模型参数提升十倍,算法能力值得期待。

或许基于对未来能力的充分自信,近期FSD重启了激进驾驶模式。

FSD最新更新:呈现以下变化

FSD推送了V14.1.3版本,更新多达10项,更安全且更具“人性化”。

安全性方面,优化了遇到细小障碍物如树枝、轮胎和箱子等的横向避让能力。面对无保护转弯、变道和车辆加塞,处理也更为出色。

前置摄像头自清洁功能更快速高效,若前挡风玻璃上有残留物影响前置摄像头可见度,现会发出警报,用户可联系服务部门处理。

个性化方面,驾驶前可通过速度配置文件更细化定制驾驶偏好。FSD在路上遇到特种车辆如警车、救护车和消防车时,增加了靠边停车或让行动作。

若遇堵车,现FSD神经网络中增添了导航和路线功能,能实时处理并生成绕行路线。

到达终点后,用户还可选择停车位置,例如停在路边或进入停车场。

在此小版本更新前几天,FSD还重启了疯狂麦克斯模式,整体驾驶风格激进,有车主分享视频显示,FSD在此模式下于夜晚洛杉矶车流中灵活变道加塞,看似比直升机通勤效率更高。

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议 特斯拉FSD  VLA 世界模型 自动驾驶 第4张

埃鲁斯瓦米看到后推荐了两个该模式适用场景,例如当你快赶不上飞机时,或着急接孩子放学

特斯拉FSD核心技术ICCV曝光:VLA与世界模型路线之争引行业热议 特斯拉FSD  VLA 世界模型 自动驾驶 第5张

埃鲁斯瓦米本人的社交平台更新,停留在ICCV演讲前一天,故在占用网络和端到端后,特斯拉FSD V14现今采用何种技术,仍是未解之谜。

已知的是,特斯拉不再对外分享后,中国玩家仍在持续突破,无论是VLA还是世界模型,皆是在无人区探索。

即便特斯拉选择了其中一条路线,也不代表此为标准答案,正如何小鹏所说,“实际上,国内任何一家有实力AI玩家,早就不care马斯克在做什么了”

车辆本体告别BBA崇拜后,中国自动驾驶算法,也正告别特斯拉崇拜。