在自动驾驶和人工智能领域,特斯拉的埃隆·马斯克尚未完全实现的愿景,小鹏汽车的何小鹏已宣布取得重大突破——
小鹏通过自研多模态大模型,实现了智能涌现能力,从量产智能辅助驾驶起步,整合Robotaxi、具身智能和飞行汽车的底层架构,跃升至通用物理AI的新高度:
物理AI的智能涌现不仅体现在小鹏人形机器人上,从去年步履蹒跚到今年以优雅猫步亮相T台:
其逼真程度甚至引发网友质疑,小鹏通过一镜到底视频证明并非角色扮演:
何小鹏的回应更具趣味性:
回归汽车制造主业,小鹏最直接的进展是量产车系统超越传统辅助驾驶范畴,能大规模处理各种极端案例:
通过在Robotaxi和量产车之间打通底层软硬件架构,消除了落地应用的范围和规模限制:
这意味着普通用户将率先体验到L4级自动驾驶量产车。物理AI与以往智能驾驶模型的直观区别在于,终端AI控制的维度从二维前后左右扩展到飞行汽车的三维空间,甚至机器人的数十个运动关节……
从汽车到复杂AI场景的智能涌现基础,何小鹏透露始于对车端VLA架构的重构。
从用户体验看,小鹏第二代VLA最显著的进步是覆盖智能辅助驾驶的最后一公里场景,包括郊区、城乡结合部和胡同等地,平均接管里程提升13倍。
何小鹏认为,对狭窄和不规则路段的优化,本质上代表城市NOA能力提升10倍,高速辅助驾驶安全性提高100倍,这是一个质的飞跃。
第二代VLA的第二大特点是能像经验丰富的司机一样理解和处理复杂路况,包括主动应对交警检查时的停车手势,以及红绿灯起步时的自然蠕行。甚至在左右仅各3公分的极限窄路中自主通行:
何小鹏表示,这些高度拟人化的操作并非通过针对性代码开发,而是系统在训练过程中自主涌现的能力。端到端技术的普及使智能辅助驾驶摆脱开城限制,而VLA的迭代则让车载AI一定程度突破数据分布限制,实现对不同国家和地区道路的基本理解与操作。
在此基础上,小鹏开发了Super LCC加人机共驾系统,无需导航也能在直路上实现丝滑的自动辅助驾驶,符合中国及全球法规:
小鹏最新VLA展现的理解认知能力,与当前市面上常见的VLA不同,并非直接依赖大语言模型,而是进行了彻底重构。从第一性原理出发,小鹏认为现有VLA结构存在明显缺陷——通过语言模型理解场景耗时且信息易遗漏。因此,小鹏最新的VLA不再以超大规模语言模型为核心,而是直接从视觉到行动,以物理世界模型为核心。
这好比车载AI拥有一个内部小剧场,基于对物理世界的理解推演可能场景,再根据各目标轨迹判断不断修正行车路径。系统像人类一样认知、学习和观察世界,无需语言中间转译,直接转换为运动轨迹,大幅降低信息损耗并提升推理效率。语言模型现在主要用于智驾可视化,增强用户信任感。
第二代VLA基座模型的训练使用了近1亿个视频片段,涵盖各种极端案例,相当于普通人驾驶65000年遇到的极限场景总和。
物理世界模型内部通过重构摄像头原始数据,生成新场景以寻找决策依据。为实现这一能力,小鹏动用了阿里云超3万张卡的算力集群和720亿参数的基础大模型,明年算力需求预计达5~10万张卡。
何小鹏透露,2024年起内部有两个VLA团队并行,一个负责当前量产版本,另一个由刘先明带领探索世界模型路线。
该项目月耗资一亿且长期无突破,几乎被砍掉,但今年二季度智能突然涌现。随后,刘先明从基座模型负责人晋升为自动驾驶中心组织负责人。
从另一角度看,随小鹏新P7首发量产的VLA系统在半年内就被颠覆性替代。但用户无需担心,因底层硬件架构通用,第二代VLA将于年底进行早鸟测试,预计明年一季度大规模OTA。
从技术层面,小鹏承诺完全可行,体验与展示一致。2026年起,小鹏新车智能化SKU将在Max、Ultra基础上新增Robo版,算力、传感器和软件版本与即将量产的Robotaxi完全相同:
当然,对普通用户而言,购买无人车进行商业运营在技术上可行,但法规尚未明确放开。小鹏正效仿特斯拉,用大模型自动驾驶技术体系模糊L4与L2界限,以体验说服用户和监管机构。
小鹏即将落地的Robotaxi算法架构同样基于最新VLA体系,但为满足L4全无人安全要求,能力倍增:
配备四颗图灵芯片,总算力达3000TOPS,其中三颗2250TOPS提供核心算力,一颗750TOPS用于冗余和安全增强。同属第二代VLA,Robotaxi版本将训练为注重极致安全和零接管的驾驶风格。2026年内预计投入三款Robotaxi车型,均基于小鹏量产车平台,并与高德地图合作提供服务,计划用一年时间走完传统L4玩家近十年的发展路径。
在物理形态、AI大脑和商业场景三个维度,小鹏最新人形机器人IRON相较去年实现脱胎换骨的进化。物理形态上,流畅的猫步源于机器人骨架的重构:
仿生脊椎使其能像人类一样弯腰、双手触地,完成站、坐、蹲、躺、爬和摔倒等自主动作。灵巧手拥有22个关节自由度,关节直径仅16毫米。仿生皮肤内置触觉传感器,可检测触觉信息并给予用户反馈。
仿生肌肉允许机器人定制不同体型,适应多样用途:
机器人头部集成3D曲面显示屏,配备摄像头、毫米波雷达、惯导和鱼眼相机,具备视听和表情识别能力,可通过显示屏展现丰富表情与人互动。
AI大脑层面,IRON集成三个大模型——VLT、VLA和VLM,由三颗图灵AI芯片共2250TOPS算力支持。
这些模型与量产车和Robotaxi同源同架构:VLA负责运动控制(与车载VLA同团队),VLM负责人机交互,VLT作为机器人的慢大脑,通过思考决策和任务分解,判断在物理环境中的下一步行动,包括身体动作、手势和语言指令。
但何小鹏指出,当前具身智能尚未达到大规模落地的泛化阶段,主因是机器人数据来源有限。相比之下,车载VLA只需处理二维运动,而IRON有82个关节需协调。小鹏已建立具身智能数据工厂,具体数据收集方法暂未公开。
目前,小鹏人形机器人已在部分场景产生商业价值,如导览、导购和导询,适用于购物中心前台、顾客引导和公司保安巡逻等。
例如,宝钢集团已成为小鹏机器人IRON项目的生态合作伙伴,探索工业巡检等复杂应用。2026年底,小鹏人形机器人将实现量产,且第一代机器人已入驻小鹏4S店担任导购角色。
全球已预订7000辆的是量产就绪的陆地航母:
同时亮相的还有全倾转混电飞行汽车A868:
陆地航母聚焦个人低空飞行体验,而A868实现多人长航程高效出行。飞行器采用鲲鹏超级增程系统,续航超500公里,最高航速360公里/小时,最多容纳6人,目前已进入试飞阶段。
陆地航母首创六轴六桨双涵道安全构型,即使单桨失效也能安全飞行和着陆。舱内仅设1块屏幕和1个操作杆,支持单手操控,颠覆传统飞行汽车操作逻辑,并配备副驾操作台保障安全。
值得一提的是,小鹏汇天执行高管先飞计划,管理团队亲身体验飞行安全,量产前必须累计飞行超5000公里——何小鹏本人亦参与其中。
飞行汽车的商用落地场景已初步明确:
例如,小鹏已与旅游胜地敦煌合作,建立至少5个飞行营地,提供空中游览服务。对个人用户,小鹏正筹建全球首家飞行汽车6S店,集展示、销售、交付、培训和服务于一体,购车同时提供一对一飞行驾校培训。
在智能汽车领域,小鹏的思考与行动独树一帜。VLA的上车应用,多数玩家采用现有开源大语言模型(如通义千问)作为外挂参考,而小鹏在推进量产的同时,坚持第一性原理探索,投入真金白银验证新路径。
从小鹏开始,国内自动驾驶的大模型路线可能与语言模型分流,转向以世界模型为核心的新范式,形成适用于多物理场景的通用AI大脑。
如果小鹏能成功融合L4与L2架构,证明泛化性与安全性可并存,Robotaxi的地理围栏限制有望逐步放宽,升维降维之争也将终结。
更进一步,通用AI司机的基座大模型将启发超越自动驾驶的广泛应用。
2025年,主流汽车工业正努力转型,摆脱传统制造业标签,向智能汽车靠拢;而身处第一梯队的小鹏汽车,已难以用智能汽车单一维度衡量,其物理AI突破正重新定义行业边界。
本文由主机测评网于2026-01-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260119107.html