中国智能汽车产业,尤其是智能辅助驾驶技术,未来将如何发展?其路径取决于行业共识的推进程度。作为以共识驱动著称的地平线,已率先交出答卷。
自主计算硬件领军者——地平线J6P,正式实现装车应用。
行业首个开源端到端框架——UniAD,已升级为最先进的单一段式端到端系统HSD,并投入实际使用。
征程系列芯片累计出货量突破1000万片——这标志着地平线成熟的工程化能力,现已全面赋能其自研的全栈解决方案。
凭借自有计算架构、自研AI驾驶大模型以及经过市场验证的量产经验,全行业仅有少数企业具备这种综合实力,而此前特斯拉和华为已凭借类似路径创造了行业奇迹。
这正是地平线备受业界瞩目的关键原因,随着HSD系统达到业界领先水平(SOTA),它必将推动更广泛的智能汽车量产体验迈向新高度。
因为地平线已明确宣告——“中国版FSD”——HSD,正式登场。
那么,其实际表现究竟如何?
简而言之,该系统已脱离测试阶段,无限接近量产状态:
底层采用地平线J6P计算硬件,算力高达560TOPS;软件算法基于单一段式端到端架构,彻底摆脱了对传统规则兜底的依赖。
测试车辆也并非改装的大众ID系列,而是奇瑞集团旗下的星途星纪元量产车型。
事实上,星纪元将成为地平线HSD系统的首发量产交付平台,在即将开幕的成都车展上,其全新车型即将亮相:
这一版本HSD最显著的提升在于纵向速度控制,体现在红绿灯起步、自动跟车等场景中,系统能够张弛有度,起步响应迅捷,往往率先驶出,但驾乘体感依然平稳舒适:
在缓慢跟车或交通博弈时,仪表盘显示车速有时为零,但车辆仍会细微调整姿态持续挪动,旨在保持合理跟车距离,避免被其他车辆加塞:
“细腻感”同样体现在路口转向处理上,无论是面对机动车还是非机动车,系统都不会生硬刹停,而是持续平稳前进,方向盘操作也流畅无抖动:
从体验上看,端到端系统始终模拟老司机风格,但HSD的准量产版本显然更加“娴熟”。
以往是“先感知再决策”,而现在则是感知瞬间即同步执行转向,决策路径更短,反应更迅速,系统容错能力也更强。
采用视觉-语言-动作(VLA)路线的厂商,强调语言模型(L)对场景的认知理解能力,进而指导轨迹生成。
而HSD系统的场景判断能力清晰可感:
当遮挡视野的大型车辆转弯后,对面有骑行而来的老人,经验不足的驾驶员难以准确判断距离,但HSD系统毫不犹豫安全通过,因为实际距离远大于安全阈值。
此外,HSD的绕行避障能力突出,在条件允许时会主动压线或借道避让其他车辆,在无明确标线的路段,绕行操作更加顺滑自然:
在这个三岔路口,HSD需要左转,前车正在掉头,系统灵活地见缝插针完成左转,同时礼让了一台非机动车。
当然,测试过程中也发现了一些待优化之处:
在双向单车道路段,HSD将正常等待红灯的车流误识别为路边违停车辆,直接绕行至对向车道,进行了一次逆向超车。
这至少证明HSD的“端到端”特性非常纯粹,基本不依赖硬性规则干预。
但该问题确实较为严重,可能源于效率优先的开发策略,即在训练数据选择上,系统被鼓励避免跟随慢车无效等待。
然而,解决此类问题的方法和周期,已与传统模式截然不同。
真正实现“100%数据驱动”,端到端特性显著。
今年年初,我们已初步体验过地平线HSD系统。
当时硬件采用顶级J6P芯片,但软件仍是两段式端到端架构,并依赖部分规则保障安全,测试车辆也非量产车型。
这实际上也是目前多数主机厂实现端到端量产的常见路径。
但地平线在研发过程中,识别出两段式架构的若干局限:
训练过程极不稳定:模型极易出现发散(Diverge)或不收敛(Not Converge)现象,难以稳定习得有效驾驶策略。
存在因果混淆(Causal Confusion):模型难以精准理解历史行为与当前决策间的因果关系,可能导致错误的关联学习。
关键能力习得困难:模型自然掌握防御性驾驶(Defensive Driving)和紧急自动刹车(AEB)等安全行为面临巨大挑战,需经历多阶段训练,过程复杂艰巨。
总之,这些不足并非设计理念错误,而是实现路径上的技术挑战。
于是,在短短半年内,地平线快速完成了向单一段式端到端的转型,其核心思想是由一个统一的深度学习模型直接处理传感器原始数据(或经预处理的特征),并输出最终的车辆控制轨迹或指令。
在核心架构上,主要实现三大创新:
稠密模态信息处理:利用高维度、无损的抽象特征,而非感知模块输出的简化结果(如边界框)。这保留了环境不确定性信息,为拟人化决策奠定基础。
横纵向联合优化:模型直接输出融合横向(方向)与纵向(速度)信息的原始轨迹,从根本上避免传统架构中横纵向控制分离导致的“先转向后加速”或“先刹车后转向”的机械感和顿挫感。
后处理与安全校验:原始轨迹会经过轻量级后处理层进行平滑优化,并由高优先级安全校验模块最终把关,确保输送给线控系统的指令绝对安全。系统目标是通过持续提升模型能力,逐步减少对后处理的依赖,使代码日益简洁。
感知、认知决策与控制执行等模块均实现了迭代升级。
尽管采用端到端架构,精准感知仍是系统基石,HSD在感知环节也实现了创新。
例如,通过深度学习模型实现通用障碍物占据网络(OCC)检测与告警建模,不仅能识别标准车辆、行人,还能对非常规障碍物(如土堆、散落物)进行建模,输出高精度3D占据栅格。
同时,借助先进视觉算法与模型训练,实现极高精度的距离与位置估计,为窄道通行、极限泊车等场景提供可靠输入。
此外,还有长时序信息融合能力。模型并非处理单帧图像,而是融合连续时序的视觉信息,这是实现防御性驾驶和准确预测运动趋势的关键。
作为系统的“智能中枢”,它负责理解场景并做出拟人化驾驶决策,HSD引入了“快慢思考”双系统机制。
快思考系统即端到端模型,处理即时反应,应对大多数常规驾驶场景。它基于感知到的稠密特征,通过模仿学习人类驾驶员行为,输出流畅、连续的轨迹。
慢思考系统则整合大语言模型与世界模型:处理需要逻辑推理和常识理解的复杂场景(如理解特殊交通标志、判断前车状态、复杂路口规划等)。
其中,大语言模型用于理解交通规则、标志牌语义等符号化信息,进行跨领域常识与逻辑分析。世界模型则用于构建物理世界的因果关系,预测其他交通参与者意图,并进行更长时间的序列推理。
最后,通过强化学习手段连接并增强快慢思考系统。让AI在仿真环境中进行自主探索,学习如何处理罕见和危险场景,从而持续提升模型的推理与泛化能力。
负责将认知决策模块输出的轨迹转化为车辆可执行的精准控制指令。包括直接轨迹控车:端到端模型输出的轨迹经平滑与安全校验后,直接下发至线控系统执行,确保控制的整体性与流畅性。
此外,通过大规模学习人类驾驶数据,模型输出的控制指令在加减速、转向节奏上高度拟人,避免不必要的点刹、重刹和方向盘大幅晃动,显著提升乘坐舒适度与安心感。
这是支撑整个系统持续进化的“基础设施”。
尤其是大规模数据驱动,系统性能的提升不再依赖工程师手动编写规则,而是取决于大规模、高质量的真实与仿真数据对模型的持续训练。
其中包含高精度仿真平台,构建了覆盖大量长尾场景的仿真测试集,可高效、安全地复现罕见危险场景,用于模型测试与训练,极大加速了长尾问题的解决效率;
还建立了自动化迭代流程,实现从真实路测数据回收、场景提取、仿真验证、模型训练到版本测试的全自动化闭环,能够实现快速迭代,持续提升系统性能上限。
经过这一系列技术演进,地平线官方认为,当前的HSD不是一次渐进式技术升级,而是范式革命——通过单一段式端到端架构、数据驱动与大模型融合,实现更拟人、更安全、更流畅的智能驾驶体验。
年初,余凯博士对自动驾驶行业趋势与格局做出预判:
三年时间,行业大局将基本确定。
具体而言,智能辅助驾驶体验将在三年内实现双手脱离(hands off),五年内实现视线脱离(eyes off),十年内实现注意力完全脱离(minds off)。
无法跟上这一节奏的企业,很可能面临出局风险。
即将在奇瑞星纪元新车上量产交付的HSD,对应的正是hands off目标的第一步。
整个过程中,地平线的策略是稳扎稳打。例如,在hands off的第一步技术体系上,并未追逐时下热门的VLA路线,而是攻坚单一段式端到端,优先打磨极致体验。
地平线的逻辑如下:
从技术视角看,大语言模型在车端有限算力条件下,很难将延迟降至理想水平。
难度有多大?举例而言,英伟达六月份发布的Thor平台延迟测试报告显示,即便使用内部自研且参数量仅20亿的视觉语言模型,在经过大量优化后,在1000TOPS的ThorX平台上仍达到530毫秒延迟,频率低于2Hz,远低于自动驾驶所需的10Hz左右实时性底线。
系统延迟无法有效降低,意味着VLA方案应用于实时性要求极高的智能辅助驾驶系统,对技术实力和成本投入要求极高,多数车企可能仅能实现“语音控车”等非核心功能。
表面上是技术优化问题,本质则是成本挑战:更顶尖的AI工程师团队,必然对应更高昂的投入。
但对地平线而言,最终交付的量产方案必须服务于全行业,而非仅为特定车企或车型独家定制。
这在一定程度上解答了当前主机厂的普遍困惑:采用VLA路线,就一定能形成代际优势吗?
实际上,单一段式端到端已涵盖了VLA中“视觉”与“动作”的核心部分,模型直接学习从输入数据到输出轨迹的映射关系。
并且可能更贴近驾驶的“第一性原理”:
人类驾驶行为本质是“视觉-动作”的自然反射,并不存在“从图像提取语义,再将语义转化为动作”的中间过程。
归根结底,自动驾驶领域没有银弹,不存在一劳永逸的捷径。
本文由主机测评网于2025-12-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251212658.html