在本文中,谷歌深入探讨了面向未来的光电路交换机(OCS)技术,着重分析了其在数据中心网络和机器学习超级计算机中的应用潜力。包括插入损耗、串扰、端口数量、重构时间以及偏振敏感性在内的多个器件参数,均对最终系统的性能与可靠性产生重要影响。
大规模系统的信息传输依赖于网络交换机。当前,大多数大规模数据网络基于电分组交换机(EPS)及固定的Clos拓扑结构构建。尽管这类网络支持任意通信模式,但在成本、时延和可重构性等关键指标上的扩展性并不理想。因此,光电路交换机(OCS)被提出,以动态调整网络拓扑,满足各种通信需求。本文旨在介绍现有的商用OCS,并探讨其未来可能的发展方向。
数字电分组交换机在共享存储器中对数据包进行排队,并基于数据包头信息进行本地路由决策,将数据包转发到相应的输出端口。而光电路交换机则在输入端口和输出端口之间建立一条端到端的光路或电路,所有数据包均沿同一条光路传播,时延相同,非常适合同步的机器学习工作负载。
此外,许多光电路交换机对速率不敏感,因此同一台交换机可跨越多个不同数据速率的光收发器世代使用。然而,大规模OCS部署的控制平面开发工作量可能超过硬件本身。
表 I 列出了用于商用和研发型OCS的多种器件技术的四个关键性能指标。这些指标取决于交换功能是基于空间还是基于波长实现,以及是在三维还是二维结构中实现。
表 I:商用及研发型OCS的关键性能指标。
现有商用OCS使用基于定制硬件与控制方案的器件,尚未出现能在所有应用场景中均表现最优的单一交换器件技术。当前设计主要聚焦于大端口数量及低插入损耗。
图 1 展示了基于MEMS的交换机器件技术示例。MEMS反射镜采用深反应离子刻蚀工艺制造,高电压信号控制其旋转以构建三维光路。
图 1:MEMS执行器细节图及四个梳齿驱动器。
基于图 1 所示的MEMS器件,OCS在大规模数据中心网络中提供了显著的成本优势,并提升了TPU超级节点的系统可用性和性能。
与三维自由空间交换机相比,二维器件基于交叉矩阵结构,每个方向有N条波导。在N²个波导交叉点处放置二进制交换器件以控制光传播方向。
许多研发中的二维光交换机采用硅光子(SiP)技术,与标准CMOS工艺兼容。SiP平面光交换机有望实现更低的单端口成本、更快的交换速度及更高的可靠性。然而,挑战包括高损耗和有限的端口数量。
随着OCS技术的商业化,未来光交换机器件技术的研究活动正在加速。随着应用场景的不断扩展,预计部分研发阶段的器件技术将被引入未来的计算与网络系统中并实现量产应用。
谷歌近年来一直在默默改造其数据中心,用光代替电子,并用OCS取代传统网络交换机。这一计划被称为“阿波罗计划”,旨在通过OCS技术提高数据中心通信效率。
数据中心通信存在效率低下的问题,因为数据处理在电子设备上进行,而信息在光域中传输更快。在传统网络拓扑中,信号在电信号和光信号之间频繁转换,成本高昂且效率低下。
“阿波罗计划”通过OCS技术将数据尽可能长时间保留在光域中,使用微型镜子将光束从源点重定向到目标端口,作为光交叉连接。这不仅降低了通信延迟,还减少了电力消耗。
“阿波罗计划”需要许多定制组件和生产设备。包括MEMS反射镜、光纤准直器、光芯及其组成部件以及整个OCS产品的测试、对准和组装工作站等。
谷歌还设计了跨越四代光互连速度的低成本波分复用收发器,并结合高速光学、电子和信号处理技术的发展。这些收发器能够承受适度的插入损耗,并且能效高。
“阿波罗计划”面临的挑战之一是重配置时间。虽然EPS系统可以将所有端口相互连接,但OCS的灵活性不如EPS。然而,谷歌通过构建数据中心基础设施来减少重新配置的频率。
“我们相信这项技术的潜力巨大。随着技术的不断进步,我们将能够进一步提高效率和可靠性。”谷歌表示。
本文由主机测评网于2026-06-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647415.html