在昨日的报道中,我们深入探讨了Hot Chips 2025大会首日的亮点,详情可参阅文章《一文看遍热门芯片》。而今天,大会聚焦于光芯片领域,英伟达、Ayar Labs、Lightmatter、Celestial AI等传统巨头与创新企业分享了前沿技术。以下是我们整合的精华内容,以飨读者。
Hot Chips 2025大会的这一环节令人振奋。Gilad发表了关于千兆级共封装硅光子交换机的演讲,探讨了共封装光子学如何满足AI工厂的扩展需求。
英伟达指出,与传统云数据中心相比,AI工厂的光功率消耗高达17倍,这主要源于GPU集群需要大量光收发器进行通信。因此,网络光子学成本约占AI工厂总计算能力的10%,而英伟达计划通过Spectrum-X以太网光子学技术来降低这一成本。
英伟达将数据中心视为一个整体计算机,而非孤立GPU。
BlueField-3 DPU被设计为接入网络的智能网卡。
人工智能应用需要零抖动通信,因其规模庞大、结构复杂且覆盖远距离。
以太网架构多样,尽管都基于以太网标准,但目标和要求各异。
英伟达Spectrum-X以太网旨在支持大型GPU集群高效使用以太网。
据悉,Spectrum-X以太网光子学采用了独特的实施方案,据称是首个应用200 G/通道SerDes的技术,处于电信号传输的前沿。与可插拔收发器相比,该技术因光子引擎紧邻交换机ASIC,具有更优的信号完整性和更低的DSP需求,从而减少了PCB走线长度和激光器数量。例如,1.6 Tb/s链路的激光器从8个降至2个,实现了更低功耗和更高可靠性。
Spectrum-X致力于为AI工作负载提供低抖动通信。AI网络中的抖动会导致GPU闲置,降低效率并增加成本。英伟达通过端到端设计,将功能分布而非仅集中于交换机。
Spectrum-X提升了NCCL性能,确保大型基础设施上多任务并行时不相互干扰。
今年新产品的数据显示,Spectrum-X在混合专家模型调度上优于标准以太网。
以下是Spectrum-X对多租户数据中心的影响分析。
英伟达的硅光子解决方案采用CPO芯片,传输速率达1.6T,集成了MRM以提升带宽、降低功耗和空间占用。更重要的是,该方案率先在光子层与电子层间应用3D堆叠,减少了布线复杂性并提高了带宽密度。英伟达与台积电合作推进硅光子技术。
据称,相比光学标准,该技术能效提升3.5倍,弹性提高10倍,运行时间增加1.3倍,预示光互连将极大推动AI计算。公司还展示了集成光子技术的全尺寸交换机Spectrum-6 102T,其主要特点包括:
以下是Spectrum-X以太网与现成(如博通)以太网的对比摘要。
光纤网络元件的高功耗是扩展的主要挑战。
下一代Spectrum-X以太网光子技术无需为连接光学引擎供电,从而大幅节能。
英伟达Photonics是一款1.6T CPO芯片,采用新型微环调制器,并专注于可拆卸光纤连接器。Spectrum-X和Quantum-X的CPO连接方式因方案演进而不同。
实现此功能需要多组件协同,设计中包含可插拔激光器。
英伟达展示了其现场运行功能。
英伟达推出了集成硅光子学的Spectrum-6 102T交换机,容量达102T。
该技术提升了可靠性,同时降低了功耗。
英伟达拥有Quantum-X和Spectrum-X交换机,并将推出CPO版本。
从纵向扩展到横向扩展,再到跨数据中心扩展,需要高速网络支持。
Spectrum-XGS是英伟达将横向扩展网络延伸至跨域扩展的方法,需结合距离感知算法。
英伟达表示,该技术可使跨域性能提升1.9倍,并有进一步优化空间。
这是一项大规模训练任务的运行示例。
目标是实现多站点AI训练,打破单站点资源限制。
跨规模网络的起始距离约500米,超此范围需算法调整以适应距离变化。英伟达光子学旨在降低功耗、简化扩展,并利用光子加速互连。共封装硅光学器件可在相同功耗下将GPU性能提升3倍,激光器总数减少约4倍,从而将更多功率用于GPU集群提升性能。
在Hot Chips 2025上,Celestial AI展示了其光子结构链路技术,该技术利用光连接下一代大规模GPU和加速器芯片,替代现有电连接。
Celestial AI不仅推进共封装光学器件,还将其集成到具有适当封装和散热的大型GPU中。
当前重点是基于中介层的HBM。Celestial AI PFLink包含硅光子层,集成了无源和有源元件。公司通过SerDes与通道匹配以实现高能效,并构建自己的光学MAC以实现RAS功能。
该公司采用不同于其他的调制技术。虽然环形调制器常见,但从热管理角度看,EAM更具优势。
带宽与计算带宽的扩展速度不匹配。随着多芯片封装尺寸增大,封装外I/O周长线性增长,但面积呈平方增长。
这张幻灯片探讨了边界优势,可能影响芯片缓存的设计和使用。
其应用之一是实现封装间互连。
这一光子技术可释放边界限制。传统CPO类似于博通的交换机模型,而Celestial AI的光I/O可位于ASIC中心,其余部分用于电气I/O如HBM。
这是CoWoS-L芯片组结构,包含EIC、OIMB和光学多芯片互连桥。制造中光学接口的稳定性是挑战,Celestial AI声称拥有封装解决方案。
在光子结构模块Gen1中,它被用于16端口交换机,连接交换机和内存。
这里提供了模块和设备的详细统计数据。
公司已完成四次流片。
这是封装示意图。
Ayar Labs在Hot Chips 2025上展示了一款UCIe光纤I/O重定时器,其核心理念是基于标准构建UCIe芯片组,便于将光纤I/O集成到封装中。该芯片组提供8Tbps级带宽,大幅提升封装外传输能力。
当前最大挑战之一是如何从数千芯片集群扩展到数百万芯片规模,这使得互连至关重要,尤其在AI领域。
机架功率密度是另一重大挑战。
Ayar Labs的光学I/O芯片有助于利用光学技术实现横向扩展。
这是Ayar Labs的TeraPHY光学I/O芯片和SuperNova光源。
公司推出UCIe光学I/O芯片。UCIe是一种基于标准的方法,企业可依据通用规范轻松集成封装。
UCIe chiplet的组织方式如下所示。
架构设计如下:
UCIe接收器对数据进行重定时后传输至光端,这有助于解耦光信号与电信号传输的挑战。
这是端口架构图。
Ayar Labs经过多年发展,其chiplet速率已达8Tbps,设计更为成熟。
以下是UCIe链路测试结果:
以下是链路边际验证:
公司还在测试长期链路稳定性。
这是热循环测试,重要因为芯片热胀冷缩会影响光通道传播。
这是一款一体封装的500W设备,功耗更接近现代CPU而非AI加速器。
这是模拟热斜坡测试:
这是端到端链路设置。Ayar Labs表示已从EVT进入DVT阶段,接近量产。
这是10小时端到端测试结果。
光学I/O可使互连规模超越电气I/O,支持更大系统构建。
最后是总结。
UCIe标准颇具意义,尽管短期内可能未大规模量产,但标准化芯片封装将促进集成。电气I/O需求依然旺盛,UCIe提供了高效集成途径。
在2022年的Hot Chips 34大会上,Lightmatter介绍了Passage,将共封装光学和硅光子技术带入Chiplet时代。三年后,他们推出了Passage M1000。
据观察,计算扩展速度快于互连。
主要挑战之一是芯片外围用于片外I/O的边界限制,制约了I/O能力。
Lightmatter探讨了将硅光子技术贴近芯片的优势。第一代类似英特尔硅光子100GbE QSFP28 500m光纤。
Lightmatter的新解决方案是Passage M1000。
理念是在Passage光学中介层上封装计算和内存芯片。
新设计承诺最高114Tbps带宽,即每个方向57Tbps。
采用3D堆叠芯片后,光发射器/接收器需紧凑。GPU芯片连接SerDes,再连至Passage M1000光端。挑战在于光学元件需匹配电SerDes尺寸以维持封装密度。
Lightmatter使用硅微环调制光信号。
这些微环实现紧凑的光学I/O。
这很有趣。Lightmatter演示了为何微环最优。Celestial AI此前也展示过类似图表解释EAM优势。
Lightmatter拥有自研的16波长激光器,称为Lightmatter指南。
Lightmatter提供参考平台。
这是配备CoolIT液体冷却器的Passage M1000外观。
这是晶圆上芯片组装后的形态。
这是彩色版本示意图。
Passage M1000还具备一定可重构性。
这里详述了16条水平总线的块设计及其与片外链路的连接。
这是用于电气连接的十字形金属缝线。
Lightmatter表示其具备光路交换功能,可实现冗余。
这是一个施加功率和热负荷的测试台。
这是设备顶视图。
这是参考设备正面的16个光纤连接器。
这是两者连接后的样子。
中介层平台启用了高带宽。
M1000是迈向超过200Tbps XPU和400Tbps带宽交换机的第一步。相比之下,高端博通Tomahawk 6是102.4T交换芯片。
Lightmatter表示其已做好生产准备。
让我们再审视其可能形态。
我一直认为Lightmatter的平台非常出色。主要问题在于实际应用时间。公司表示将在今年SC25大会公开演示。
事实上,光芯片领域不仅限于上述企业。例如,本土公司曦智科技联合燧原科技推出了国内首款xPU-CPO光电共封芯片。
近日,数据中心互连设计和制造初创公司OpenLight Photonics Inc.在从母公司Synopsys Inc.分拆并完成3400万美元A轮融资后,希望加速硅光子学过渡。
OpenLight旨在成为硅光子学设计和制造的关键参与者,该技术用于连接数千GPU和其他芯片集群,为AI和高性能计算提供动力。
硅光子技术可解决紧迫瓶颈:AI处理能力不再受计算限制,而是受连接限制。当前最先进AI模型由庞大GPU集群驱动,需要快速通信,但网络限制导致GPU利用率仅约25%。
问题在于现有数据中心依赖电子互连,吞吐量不足,GPU常处于空闲状态。硅光子技术利用光传输数据,速度更快。
OpenLight设计并构建光子专用集成电路(PASIC),为新型光互连提供动力。PASIC是光子等效的ASIC,可优化性能、成本和效率,推动下一代数据中心互连,也可用于电信、汽车、工业传感和量子计算。
首席执行官亚当·卡特表示,PASIC可大幅提升现有光互连速度。
他解释说:“传统硅光子学性能上限约每波导200 Gbps,但OpenLight的异构集成,尤其是磷化铟集成,使高性能200G和400G调制器直接内置芯片中,实现高密度、可扩展光互连,功耗更低、带宽更高,对AI工作负载至关重要。”
卡特表示,初创公司专注于设计和构建PASIC,提供三种服务:设计服务,与客户合作定制PASIC;设计支持,通过工艺设计套件(PDK)让客户自设计PASIC。OpenLight的PDK基于磷化铟和硅光子学异构集成,提供广泛有源和无源组件库。
设计完成后,OpenLight与Tower Semiconductor Inc.合作生产实体PASIC。Tower已验证其PDK,确保设计可投产。初创公司允许客户使用已验证构建模块快速设计和构建PASIC,加速产品上市。
卡特解释,定制PASIC是关键区别和优势,因为每个客户和应用对组件如激光器、调制器和放大器有特殊要求。
“OpenLight不提供一刀切芯片。我们提供强大且可投产的PDK及组件库,让客户设计自己的PASIC,根据应用量身定制,”卡特说道。“客户购买的不只是芯片,而是工具包和灵活性。这种敏捷性在快速演变市场尤为重要,标准如CPO仍在形成中,使客户能比使用现成方案更快创新和差异化。”
卡特表示,OpenLight客户涵盖半导体公司、网络设备制造商、系统集成商和超大规模数据中心运营商。“我们还支持激光雷达、高速计算、工业传感和量子计算等相关市场客户,”他说道。“首批客户将于2025年底开始生产,2026年为OpenLight带来首笔专利费收入。预计届时将发布公告。”
融资在OpenLight从新思科技子公司转型为独立公司后不久进行。OpenLight表示已准备好满足AI数据中心对更快、更高效数据传输的需求。卡特指出,OpenLight受益于资金和投资者在半导体行业的专业知识,这些人脉将帮助构建技术生态系统。
他表示:“资金将使我们扩大业务、深化研发,并更快推出突破性产品。我们相信,异构集成硅光子技术将革命数据处理和传输,我们很高兴站在前沿。”
OpenLight计划扩展PDK库中的有源和无源元件数量,提供速率高达400 Gbps的调制器和更先进片上激光技术。卡特表示,目标是提供业内最灵活元件设计库。同时,计划扩大团队以支持早期采用者实现PASIC量产。
Capricorn管理合伙人Dipender Saluja表示有信心,由于AI模型数据需求增长和基础设施成本降低需求,光互连快速采用不可避免。
他表示:“OpenLight的异构架构在性能、可靠性和成本三方面表现出色,此前这些方面阻碍光互连普及。OpenLight建立的强大代工厂关系和PDK为满足下一代AI硬件大规模需求创造了理想机会。”
让我们共同期待光时代的到来。
本文由主机测评网于2025-12-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251212816.html