近年来,AI技术通过聊天机器人等工具深刻改变了我们的生活,并在医疗、气象和材料设计等领域得到广泛应用。这一进步主要得益于GPU算力和数据规模的增长。然而,随着模型规模的不断扩大,传统数字GPU的局限性愈发明显。要突破这一瓶颈,AI需要在保证精度和吞吐量的同时,降低训练与推理的延迟和能耗。
一个备受关注的研究方向是“物理神经网络”(Physical Neural Networks,PNNs),它利用光、电、振动等物理系统进行计算,有望摆脱对传统数字芯片的依赖,实现更高效、更大规模的AI训练与推理。
日前,来自洛桑联邦理工学院的研究团队及其合作者,在权威科学期刊 Nature 上发表了一篇最新综述,从训练角度全面回顾了物理神经网络的发展,并以“从零开始”的视角探索其普适性方法。
论文链接:https://www.nature.com/articles/s41586-025-09384-2
研究团队表示,“只要有足够的研究投入”,未来的物理神经网络就有可能改变人工智能(AI)计算的方式。
物理神经网络是一类利用模拟物理系统进行计算的类神经网络,能够比传统计算硬件更直接、更灵活、更随机地利用模拟物理计算,可能会改变AI系统的可实现性与实用性。目前分为两类:
尽管物理神经网络还处于实验室阶段,但已经显现出较大潜力。它能更直接地利用物理规律,理论上比传统硬件更节能、速度更快,最终可应用于数据中心和边缘计算场景,既能驱动大型生成式模型运行,又能辅助本地推理或智能传感器。
无论哪种应用场景,都需要对神经网络进行训练,但具体约束条件会因应用领域而异。主要训练技术包括:
1.计算机模拟训练(In silico training)
训练PNNs最直接的方法是在计算机仿真环境中对其进行训练。该方法采用PNNs的数字孪生模型,从而实现权重梯度计算和反向传播运算。数字孪生通常通过两种方式构建:一是直接对PNNs进行特征描述,二是采用数据驱动法——即获取PNNs的输入-输出样本数据,并将数字孪生模型拟合到这些数据上。训练时在数字世界算梯度、更参数,再把结果套到物理硬件上。
2.物理感知反向传播(PAT)
物理感知训练法(PAT)强化了一个核心理念:只要对物理系统建立近似预测模型,就能可靠实现梯度提取。其核心机制是物理系统执行前向传播,而通过微分数字模型来完成反向传播,关键在于前向与反向传播的非匹配性。与多数训练算法相似,仅需数字模型生成的估计梯度与真实梯度保持近似对齐即可。相较于要求完美数字模型的严苛条件,这种宽松标准使PAT在多数场景下可直接替代计算机模拟训练,同时保留原位训练算法的诸多优势。
这种方法已经在光学、机械、电子系统上验证过。既能减少物理噪声的影响,又能保持反向传播的精准度。缺点在于物理参数更新慢时,训练会变缓。
大型AI模型在物理尺寸上确实非常庞大,但这并不意味着物理神经网络毫无应用前景。
事实上,对于这种规模的计算,任何硬件设备都不可避免地需要较大的物理空间。这或许揭示了未来大规模物理神经网络AI系统最重要的扩展性考量:若物理神经网络硬件设计得当,其底层物理特性可能使其展现出与数字电子设备不同的能量扩展特性。
需要强调的是,算力的拓展并非只依赖硬件升级。Transformers架构之所以成为当下主流,不仅因其算法突破,更在于与可扩展硬件形成了协同效应。展望超大规模物理神经网络的发展,或将受限于对现有算法框架的固守。未来必须构建软硬件协同的新型组合方案。
考虑到基础设施的路径依赖,以及高效数字大模型的快速进展,若要具备商业可行性,物理神经网络的能效必须较数字电子设备高出数千倍乃至数百万倍。要实现这一目标,需要设计能够整体应对规模挑战的物理计算机,并以硬件与软件的协同优化为核心,将高效挖掘物理计算能力作为首要目标。
本文由主机测评网于2026-04-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440854.html