当前位置:首页 > 科技资讯 > 正文

物理AI:科技巨头竞相角逐的未来战场

人工智能的终局虽迷雾重重,但科技巨头们正疯狂下注,以期在这场科技盛宴中占据一席之地。

2025年秋季,"物理AI"跃居人工智能舞台中央,成为全球科技企业的必争之地。

当英伟达站在5万亿美元市值的门槛前,物理AI成为了其敲门砖。在今年的GTC大会上,黄仁勋全面阐述了物理AI的技术战略,并公布了量子计算、6G网络等前沿领域的重大布局。

在2025小鹏科技日以“涌现Emergence”为主题的活动上,小鹏汽车描绘了物理AI在未来出行中的蓝图,并围绕其发布了第二代VLA、Robotaxi、全新一代人形机器人IRON,以及小鹏汇天飞行体系等四项重要应用。

一场席卷全球的物理AI竞赛已全面打响,从硅谷到中国,科技巨头们正以千亿级投入争夺下一个技术时代的话语权。

物理AI:科技巨头竞相角逐的未来战场 物理AI 科技巨头 人工智能 生产力重塑 第1张

物理AI落地三大关键环节

2020年,瑞士联邦材料科学与技术实验室Aslan Miriyev与伦敦帝国理工学院Mirko Kovac在《Nature Machine Intelligence》首次提出“物理AI”概念,强调机体、控制、感知等要素的协同演进。

2024年,英伟达首席执行官黄仁勋将其视为AI发展的核心方向,提出通过感知、推理和行动链实现物理交互能力。

物理AI将人工智能从“数字理解”推向“物理交互”的维度跨越,已成为衡量科技企业核心竞争力的新标尺。其落地依赖三大关键环节:虚拟环境的物理建模与训练、高质量物理数据的生成与推理、真实场景的感知与决策闭环。

物理AI:科技巨头竞相角逐的未来战场 物理AI 科技巨头 人工智能 生产力重塑 第2张

虚拟建模是物理AI的基础,其核心是通过融合经典物理定律与深度学习,构建与真实世界高度一致的仿真环境。这主要通过生成式物理引擎和强化学习技术实现,结合神经网络模拟物理规律并生成训练数据。

生成式物理引擎融合经典物理定律(力学、热力学等)与深度学习,构建多物理场耦合的仿真系统,支持刚体、流体、电磁等多场景的动态模拟。这其中需要平衡仿真精度与实时性,同时具备可扩展性,以适配不同复杂度的物理场景(从简单运动到复杂材料交互)。高精度建模与实时计算存在天然矛盾,需通过算法优化(如分层积分、动态阻尼调整)缩小差距。

物理AI的性能依赖于高质量数据的支撑。而“合成数据+真实数据”的虚实融合模式,解决了真实物理数据稀缺、标注困难的痛点。高质量数据的生成与推理主要依赖于物理建模、数据采集技术和生成模型的结合,通过真实数据采集、物理约束优化和算法生成等方式实现。

该环节通过物理引擎生成合成数据,并结合生成式AI扩展数据多样性;推理阶段需要嵌入物理约束,实现对物体运动、交互关系的预测与归因。其中,数据需要满足“物理真实性”(符合客观规律)与 “分布全面性”(覆盖极端场景与边界条件)要求。推理过程需具备可解释性,而非纯黑盒预测。挑战在于合成数据与真实数据存在域差距,需通过数据增强、虚实融合技术缩小差异。同时,物理数据的高效推理对算力与算法架构提出了更高要求。

物理AI的最终价值在于落地真实场景。真实场景中的感知与决策闭环主要依赖于多模态数据融合、端到端模型架构和实时算力支持。通过感知环境、理解意图、快速决策和精准执行实现闭环。

物理AI:科技巨头竞相角逐的未来战场 物理AI 科技巨头 人工智能 生产力重塑 第3张

该环节将虚拟训练的模型与真实物理世界对接,完成“感知-决策-执行-反馈”的闭环迭代,让AI适配真实环境的不确定性。多传感器融合(视觉、力控、惯性测量等)实现环境与物体状态的精准感知;决策算法需结合模型预测控制与强化学习,兼顾实时性与鲁棒性。而真实环境的复杂性(非结构化、动态变化)远超虚拟场景,需要解决模型泛化能力不足的问题。同时,端侧部署需要进一步平衡推理速度、精度与硬件功耗。

海外科技巨头的战略卡位

当物理AI已成为人工智能领域下一个关键赛点,全球科技巨头凭借各自优势,形成了特色鲜明的发展路径。

在巴塞罗那智慧城市博览会世界大会上,英伟达集中展示其物理AI应用成果。其整合Omniverse、Cosmos和Metropolis等平台,不仅能模拟真实世界环境,还能生成合成数据、训练视觉语言模型(VLM),并通过AI代理分析城市视频流,形成一个从数据到决策的完整生态闭环。

针对真实场景训练成本高、风险大的痛点(如机器人高危作业测试、飞行器气动实验),Omniverse通过“高精度物理建模+数字孪生”提供解决方案。这不仅可以模拟重力、摩擦力、流体力学等多物理场效应,还能支持机器人硬件设计与算法验证的虚拟化,缩短原型迭代周期。

另一个痛点是数据枯竭危机。需要附带物理属性的高质量数据。Cosmos通过“生成式建模+物理推理”双重能力突破瓶颈。其通过文本、图像输入生成物理逼真的视频数据,解决了传统VLM无法处理多步骤物理任务的缺陷。它可以基于先验知识预判物理变化,自主推理下一步骤或动作。

在动态现实场景中,物理AI需要低延迟感知和实时决策(如自动驾驶避障、智慧城市交通调度)。Metropolis通过“边缘视觉分析+算力协同”构建感知底座。这既可以通过感知设备进行多模态物理动态捕捉,还能在边缘端进行实时推理加速秒,满足物理AI毫秒级动作生成需求。

谷歌DeepMind则选择了通用智能的路线。今年9月,DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。这一系列由两大模型组成:Gemini Robotics 1.5(GR 1.5)负责动作执行的多模态大模型;Gemini Robotics-ER 1.5(GR-ER 1.5)强化推理能力,提供规划与理解支持。其中,ER代表“具身推理”。该系列模型不仅理解语言、图像,还结合了视觉、语言与动作(VLA),并通过具身推理实现“先思考,再行动”。

两者结合能让机器人不仅完成单一动作,还能解决多步任务。它甚至能根据特定地点的特定要求(如北京和上海的不同垃圾分类标准),自己上网搜索以帮助人们完成垃圾分类。该模型还能够在多种不同的机器人之间进行能力的零样本跨平台迁移。

物理AI:科技巨头竞相角逐的未来战场 物理AI 科技巨头 人工智能 生产力重塑 第4张

特斯拉坚持产品驱动策略。Optimus二代机器人搭载自研的物理引擎。其拥有22个自由度的灵巧手能够完成叠衬衫、在工厂分拣物品等任务。它还能将千万辆特斯拉汽车的驾驶数据转化为物理AI训练素材形成出行场景反哺机器人研发的独特闭环。马斯克对Optimus项目寄予厚望并设定了激进目标:计划到今年年底生产多达5000台Optimus机器人。

今年6月,亚马逊宣布在其神秘的硬件研发部门Lab126内组建一支新的Agentic AI团队开始研发工作。这一决定标志着亚马逊正式进军该领域特别是针对机器人技术的深度探索。

亚马逊仓库中的岗位可能会成为首批受到影响的领域。近期亚马逊发布了一款名为“Blue Jay”的新型多功能仓库机器人系统并透露其已在美国南卡罗来纳州的一处仓库投入测试。Blue Jay整合了拣选、分类和整合包裹等多个环节旨在将此前三个独立的机器人工作站合而为一。

亚马逊计划到2027年实现75%仓储物流自动化或减少超50万岗位招聘节省126亿美元人力成本。

物理AI重塑生产力

这场全球竞赛背后是物理AI重塑生产力格局的巨大潜能。

Gartner预测到2030年IT部门的所有工作都将与AI深度绑定AI将彻底重塑传统工作模式与人才需求格局。未来五年内25%的IT工作将完全由机器人独立执行剩余75%的工作则需人类从业者借助AI工具协同完成。

其终极价值在于将人类从重复劳动中解放出来。当Robotaxi自动完成城市通勤机器人承担高危作业飞行汽车打通低空通道人类得以专注于更高价值的活动。这种解放将带来生产力的巨大跃升当每个机器都能理解世界人类将获得前所未有的自由。