近年来,生成式人工智能的迅猛发展导致全球范围内超大规模人工智能集群的部署速度前所未有地加快。然而,随着摩尔定律的放缓,只有通过并行计算才能实现更高的性能,导致数据处理和/或传输性能的提升必然伴随着能耗的增加。因此,人工智能基础设施的快速增长带来了严重的能源危机。如图1所示,随着数据量的指数级增长,所需的能源供应量也将呈指数级增长。从这个意义上讲,解决这一能源问题的唯一有效途径是开发一种能够将能源增长与数据增长分离的技术。
光子学具有巨大的潜力,因为光波的传播和干涉无需消耗能量,因此可以通过工程设计来实现可扩展的功能,而无需增加能耗。硅光子学在过去二十年中得到了广泛的发展,如今已完全具备提供近乎理想的平台的能力,从而释放其巨大的潜力。事实上,硅光子学能够提供高效的高密度互连,实现高带宽和长距离链路;能够实现低能耗的光路切换,且不受信号带宽的限制;以及能够进行光速计算的光子神经网络,从而加速人工智能计算。
在本文中,我们将回顾这些光子技术的发展趋势和进展,并将论证,为了使这些光子技术成为人工智能时代可持续基础设施的重要组成部分,硬件和软件以及电子和光子学需要以互补的方式进行开发。
A. 能耗扩展
图2绘制了光收发器和超大规模数据中心常用的电交换机专用集成电路(ASIC)的能效(单位为 pJ/bit)随时间的变化曲线。通过与光收发器的趋势进行比较,发现交换机ASIC的可扩展性不如光收发器,这表明瓶颈在于交换机而非收发器。令人惊讶的是,光收发器的能效已经赶上了摩尔定律的步伐,基于硅光子学的近封装/共封装光学器件的能效已经超过了5 pJ/bit,而交换机ASIC的能效提升却明显缓慢。
事实上,ASIC交换机的功耗会随着吞吐量的增加而增加,在100Tbps吞吐量下,每个芯片的功耗会超过1000W;而光交换机的功耗则极低且在吞吐量增加的情况下保持稳定(图3)。因此,使用光交换机替代电交换机越多,系统效率就越高。以下将讨论一些实际问题。
B. 光交换机的系统应用案例
光交换机的一个关键缺点是无法进行数据包处理,而数据包处理正是ASIC交换机的核心功能。光交换机仅作为“光路交换机(OCS:optical circuit switches)”运行,因此不能简单地替代ASIC交换机。为了控制OCS,需要一个控制平面,而编排器或操作系统需要了解OCS的状态,并根据系统需求,通过控制平面发送相应的命令来控制光交换机。这种系统与依赖专用集成电路交换机(ASIC)的传统分组系统截然不同,因此,使用光通信系统(OCS)需要从零开始重建整个系统,并对架构进行全面优化。显然,目前世界上除了谷歌之外,没有其他公司能够做到这一点。在谷歌宣布已在其数据中心和人工智能基础设施中大规模使用OCS之后,光交换机开始得到广泛发展。
早在谷歌推出OCS系统之前,日本产业技术综合研究所(AIST)就已经开始研发大规模硅光子交换机。图4展示了AIST开发的硅光子交换机刀片。该交换机提供32 x 32个严格无阻塞连接,并带有数字控制接口,通过配置9级Clos网络,可扩展至131,072 x 131,072个连接。实验证明,在可组合的解耦基础设施中,这些交换机可以将网络功耗降低75%。
用于制造这些大规模硅光子开关的制造设备是日本产业技术综合研究所(AIST)基于标准CMOS技术的内部试验生产线,该技术采用45纳米工艺规则,实现了足够高的均匀性和良率,可以大规模生产包含数千个器件(例如马赫-曾德尔干涉仪(MZI:Mach-Zehnder interferometers))的大规模光子集成电路。
本文由主机测评网于2026-06-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647622.html