当前位置:首页 > 科技资讯 > 正文

CPO:未来已来,但尚未成为主角

CPO:未来已来,但尚未成为主角 CPO 硅光子学 数据中心 互联技术 第1张

在AI基础设施浪潮中,任何与“光”“互联”“带宽”“功耗”相关的技术,都被视为“下一代核心技术”的候选。共封装光学(CPO)正是这股热潮中的明星。

然而,当行业对CPO的讨论如火如荼时,博通CEO陈福阳却在财报电话会议上泼了一盆冷水。

“硅光子学短期内不会在数据中心发挥实质性作用。”

陈福阳并未否定CPO的未来,他解释称,硅光子、CPO并非对现有技术的“跳跃式”替代,而是在现有技术路径潜力耗尽后的终极选择。他梳理了互联技术的演进逻辑:先是机架级铜互联的规模化,随后是可插拔光模块的迭代升级,只有当这两条路径均达到性能与成本的极限,硅光子/CPO才会成为刚需。

“这一天一定会到来,但不是现在。”

除了博通,巴克莱全球技术大会上,包括Arista、Credo、Marvell等在内的行业巨头也传递了相似观点。

从“算力不足”到“互联焦虑”

过去几年,AI行业逐渐走出“单纯堆算力”的阶段。即便如英伟达这样的算力巨头,也在淡化单点计算性能,转而强调互联、网络及系统级架构的重要性。在大模型时代,决定上限的早已不只是芯片本身。

随着模型参数与集群规模同步扩张,AI集群的核心瓶颈从计算能力转向互联能力。考验行业巨头的,不仅是能否采购更多GPU,更是如何在超大规模系统中实现高效互联:通信效率、延迟、系统稳定性正成为关键。

行业早已预见到这一变化。博通透露其客户正在规划超大型AI集群;Arista指出,目标已指向百万GPU级别的集群架构。多位产业领袖认为,当集群规模扩展至数十万乃至百万级别时,网络不再只是“带宽够不够”的问题,而是系统性挑战。

横向扩展与纵向扩展的未解之谜

横向扩展(Scale-Out)通过增加独立服务器分散负载,提高计算容量。对于巨头而言,目前似乎还用不到CPO。

博通表示,800G可插拔技术将持续增长;Lumentum预测光端口总量将翻倍。Marvell认为CPO技术最终会到来,但需数年时间。Arista强调在1.6T速率下仍能实现低功耗稳定运行。

纵向扩展(Scale-Up)曾被视为CPO的“第一战场”。但量产时间表也被推迟。Marvell将营收目标推迟至2027-2028年。Astera预计将在2028-2029年实现大规模部署。

Lumentum认为供应链需时间成熟;Credo强调产能需求将大幅提升。更深层次的原因是过渡方案的生命力超出预期。

功耗与可靠性:比带宽更真实的约束

功耗和可靠性是巨头迟迟不愿全面拥抱CPO的原因。Credo用案例说明挑战严重性:xAI计划从18个机柜压缩到6个,强调可靠性。

Lumentum的ZeroFlap光学解决方案通过带内通信实现遥测数据,提升可靠性。Arista称产品功耗低25%。

过渡方案正在蚕食CPO的叙事空间

LPO、AEC、ALC等过渡方案持续蚕食CPO的应用空间。LPO通过去DSP降低成本和功耗;AEC在数据中心广泛应用;ALC则提供接近铜缆的可靠性和光学带宽。

Credo强调AEC在数据中心的应用广泛;Marvell推出“黄金线缆计划”展示产品打造。ALC技术则具有低功耗优势。

CPO的现实问题清单

CPO面临的挑战集中在工程与商业层面。可维护性是最痛点的挑战;系统设计复杂度是另一重障碍;成本结构不确定性困扰所有参与者;生态尚未形成。

超大规模云厂商为何谨慎?

超大规模云厂商对CPO态度谨慎。Lumentum称客户仍依赖现有供应链;Arista指出合作模式不同;Credo强调可靠性要求高;运维体系惯性巨大;供应链安全优先于技术领先;架构灵活性需求强烈。

CPO不是伪命题,但现在“被讲早了”

CPO是终极解法之一,但不是当前阶段的最优解。LPO、AEC、ALC以及ZR光模块将继续承担主力角色。CPO应用场景将更收敛。多家厂商给出的技术路线与时间表也印证了这一点。