你是否曾疑惑,为何我们至今仍无法制造出能真正适应现实世界复杂环境的机器人?
尽管人工智能(AI)模型的规模不断扩大,个体性能日益增强,但具身机器人在执行协同任务时,却常常因响应迟缓而无法满足实时需求,或因难以适应新环境而频频失效。
近日,英国剑桥大学计算机科学与技术系的集体智能与机器人学教授Amanda Prorok在权威期刊《Science Robotics》上撰文,深入剖析了机器人「集体智能失灵」的根源:
她指出,传统上强调机器人独立自主的方法,已经无法适应那些将交互与合作视为核心要素的复杂现实场景。
换言之,机器人智能的发展方向,绝非依赖单一“超级大脑”,而是需要众多专业个体协同工作。
Prorok教授进一步强调,这种思路“本质上是错误的”。根据缩放定律,要实现更复杂的行为,所需的资源投入将呈指数级增长,从而导致这种机器人自主性方法既缺乏可扩展性,也难以持续。
她呼吁研究人员实现范式转型:将机器人群体设计为由多样化、专业化的智能体构成,使其在更庞大的系统中协同运作。
文章链接:www.science.org/doi/10.1126/scirobotics.adv4049
当前顶尖的机器人系统,多数依赖于一个集中控制的巨型模型,旨在用单一模型处理导航、感知、交互等所有任务。
Prorok教授认为,当前机器人自主性的追求存在偏差。在机器人的整个运行周期中,与其他智能体的互动是不可避免的。然而,直到现在,智能体间的集体行为仍常被看作偶然事件,而非智能的内在组成部分。
无论是物理机器人还是虚拟AI系统,其初始设计往往忽略了与机器或人类等其他智能体的交互需求。现有的认知框架和基础AI教材仍然将经典AI问题定义为孤立机器在非社交环境中的对抗。
同样,传统的机器人自主性定义将机器人视为能够独立应对外部环境、无需任何外部依赖的智能体。
深度学习的缩放定律表明,要使机器人行为更加复杂,模型规模和数据需求将呈指数级上升。目前,典型的AI产品采用集中式控制的单体架构,参数数量可达数百万甚至数十亿。这意味着,要让机器人变得更智能,就需要投入更多的能源、时间和资金。
更糟糕的是,这些大型模型往往不切实际:仅模型计算就需要数百GB内存,前向传播的延迟使得它们只能在离线状态下低速运行,难以应用于高频控制场景,从而限制了许多机器人应用的可能性。
下图展示了四种大型模型在两种平台上的运行性能。数据表明,即使在性能更强大的开发板上,也只有最小的模型能够勉强满足“实时响应”的要求。
图|DINOv2模型在两种平台上的推理频率对比(a);模型数据的线性拟合结果(b)。
Prorok教授指出,当前机器人研究领域正流行将现成的集中式、单体化AI模型整合到自主系统架构中,这种设计决策推动了通用型机器人的研发热潮。然而,智能并非单一的超级有机体,也并非所有预设任务都能由单个超级机器人独立完成。
既然单一模型路径受限,那么让机器人像人类一样协作是否可行?
答案是肯定的。科学家认为,与其追求由统一通用大脑控制的独立机器人,不如专注于设计心智与躯体相互依存、形态多样且功能专业化的机器人集群,使其作为更庞大系统的一部分协同工作。
因此,集体机器人智能需要在硬件和软件设计上采用更模块化、组合式的方法。在这种架构下,多个模型不仅可以相互学习,还能在实体机器人内部及跨实体之间进行交互。
首先,集体智能的核心在于专业化分工。
并非让一个模型承担所有任务,而是让每个机器人专注于一项技能,再通过协作整合出复杂能力。
由专业模型智能体组成的群体,能够通过技能组合实现超线性提升,并以新颖且未经训练的方式整合个体能力。
这种模块化、组合式的自主方法,使得智能体和机器人能够有效模拟庞大神经网络的行为模式,并在运行时动态重组以适应任务需求,实现“超线性增益”,即随着技能组合数量的增加,性能提升速度远快于单个模型。
图|机器人模型集群的缩放定律示意图
其次,某些技能只能通过集体中的社交学习获得。
基于从零开始训练互动的理念,协作学习过程还能让单个专家模型更深入地理解自身的能力与局限。这种认知自然会使其认识到在何时、何种情境下需要与其他模型合作,以克服不足、实现更复杂的任务目标。
例如心智理论和元认知等技能并非天生,而是在集体环境中学习获得的。这些技能对于涉及与人类或其他智能体及机器人互动的任务至关重要。
此外,集体学习能够提升单个智能体的性能表现,即使在面对单一任务时,也能通过加速学习进程和优化长期效果来实现。
这种优势源于经验共享机制:在机器人领域,由于执行的是物理操作而非虚拟模拟,收集实验数据往往成本高昂、风险较高甚至存在安全隐患。借助他人经验可以加速学习过程,更重要的是能够避免重复危险行为。知识共享还能通过分摊和共享特定技能来缓解灾难性遗忘问题。
当然,让机器人“团队协作”,并非简单地将几个机器人组合在一起。目前这一领域仍存在诸多亟待解决的挑战,需要研究人员持续攻关。
当前机器人间的显式局部交互通常依赖于窄带通信网络。然而,如何设计帮助机器人确定“交流内容、时机及对象”的方法仍是一个未解难题。
现有的机器人间通信大多依赖窄带网络,且很难设计出“该说什么、何时说”的策略。
尽管有研究者尝试使用可微分通信信道让机器人自动生成交互信号,或利用图神经网络规划协作路径,但这些技术仍处于起步阶段。要理解这些新兴方法在构建鲁棒且适应性强的机器人集群时的权衡与局限性,仍需更多研究。
尽管该领域进展迅速,但“机器人混合”范式的概念仍不明确,设计能够应对不同且可能互不重叠动作领域的模型颇具挑战性。
在“混合机器人”方法中,这一难题可转化为连接各类模型的算法或机制。初步探索可借鉴集成模型、混合专家、超网络及层次学习等研究成果,但最终目标是根据底层任务需求组装机器人集群。
在这些方面,当前仍存在诸多技术空白,尤其是在实现专业机器人技能与行为的实时组合方面。
当前对性能的定义仍停留在基础层面,往往被简化为学习损失的替代指标或单个机器人模型的优化目标,而忽视了包括团队满意度和集体韧性等更复杂的综合指标。
这种评估体系既不考虑任务多样性,也不考量团队适应不同协作场景、物体分布和类型的综合能力。结果导致系统在受控的单机测试中表现优异,但在需要灵活团队协作或精准角色分配的环境中却力不从心。
因此,Prorok教授建议,我们需要制定更全面的基准测试标准,从而建立超越单纯个体成功率的综合性评估体系。
如今,虽然运用AI技术至关重要,但真正的突破仍需我们抵制为追求短期利益而回避深层基础性挑战的诱惑。
在Prorok教授看来,未来的机器人将不是单一的庞大模型,而是默契的协作团队。只有当机器人学会“团结”,它们才能真正具备融入现实世界的能力。
本文由主机测评网于2026-01-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114492.html