当前位置:首页 > 科技资讯 > 正文

英伟达从DGX Cloud到Lepton:算力霸主的转型之路

即便市值已突破4万亿美元大关,英伟达依旧潜力无限,令人惊叹。

在许多人的认知中,英伟达仍是那个“核弹厂”。事实上,在AI迫切需要的芯片之外,英伟达一直怀揣着云平台的梦想。

2023年,英伟达的DGX Cloud高调登场,每台实例配备八颗H100,月租36999美元,定价直逼市场巅峰,也被视为挑战AWS、Azure等老牌云厂商的信号。

然而,到了2025年中,这个“亲儿子”却悄然退出C位。英伟达不再将其数十亿美元的云支出承诺与DGX Cloud挂钩,其角色转变为内部基础设施与研发用途,而非面向企业市场的主打产品

取而代之的,是2025年新上线的Lepton——一个GPU租赁与调度的市场型产品。从定义来看,新的Lepton是一个算力管理和分发平台,更像是一个算力需求的“入口”。

DGX Cloud为何退场?Lepton能否承接住英伟达在AI时代成为云计算霸主的野心?

01

以退为进

许多人或许还记得2023年的“GPU荒”,即使企业资金充裕,也往往难以购得H100。于是,英伟达顺势推出了DGX Cloud,将自有高端算力集群“按月出租”,企业开通即用。

推出第一年,DGX Cloud确实收获了大量关注。到2024年底,英伟达的财报显示其软件与服务收入(包括DGX Cloud)达到了20亿美元的年化水平。

然而,转折点出现在2024年下半年后,随着GPU供应逐渐缓解,亚马逊、微软、谷歌等云厂商纷纷“砍价”,DGX Cloud的优势随之消散。以亚马逊的AWS为例,其对H100和A100实例的降价幅度高达45%,远低于DGX Cloud的租赁价格。

对客户而言,DGX Cloud的紧缺溢价很快失去了立足点。

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第1张

更现实的问题还在于“渠道冲突”

亚马逊、微软和谷歌是英伟达最大的芯片买家,对英伟达的营收构成了极大支撑。DGX Cloud的直接客户模式意味着英伟达和这些合作伙伴抢生意。每一份DGX Cloud合同,都有可能挤压AWS、Azure或GCP的收入。

买家的担心是可预期的,更长远的后果是推着这些伙伴加码自研芯片,如AWS的Trainium、谷歌的TPU,以降低对英伟达的结构性依赖。

而且短时间内,建立稳定的客户黏性也是挑战。有些企业会把DGX Cloud当作临时方案,在产能紧绷、项目启动急的窗口期租上几个月,随后再迁回长期合作的AWS、Azure或谷歌云。

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第2张考虑到这些,到最新的财年,英伟达的财务披露中不再将巨额的云支出承诺归于DGX Cloud。这项服务仍然列在收入类别中,但其角色已明显转向内部基础设施。换句话说,DGX Cloud仍然存在,但它逐渐退回英伟达内部,不再打算与微软、亚马逊、谷歌等公司正面竞争

除了选择把DGX Cloud“转为内用”,英伟达还把外部注意力引向一个新的平台化入口:

Lepton。

英伟达在2025年5月推出这个新平台,也在DGX Cloud体系名下。但不同于DGX Cloud那种把“英伟达自己的AI芯片直接租给客户”的模式,Lepton完全不碰GPU库存,只是负责“把需求导向合适的云服务商”,包括AWS、Azure,也包括英伟达自己一手扶持的云服务商

“Lepton会将我们的全球GPU云提供商网络与AI开发者连接起来。”英伟达创始人兼CEO黄仁勋在发布Lepton时称,目标是:

“打造一个全球规模的AI工厂”

简而言之,为了不缓解和渠道的竞争,英伟达的策略重点已经不再是一个“英伟达云”。

02

Nvidia“朋友圈”

但DGX Cloud角色的淡出并不意味着英伟达放弃了云。在过去两年里,英伟达一直在扶持自己的云服务商“小弟”。而且还出现过让人觉得匪夷所思的一幕——英伟达一边把GPU卖给云伙伴,一边又从这些伙伴那租回算力。

以CoreWeave为例,英伟达不仅在2023年投资了CoreWeave 1亿美元,还向其优先供货H100 GPU。在供需紧张时期,这让CoreWeave成为少数能大规模提供英伟达GPU的云服务商。而英伟达自己又回过头来从CoreWeave租用这些GPU。

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第3张Lambda也类似。这是一家规模小得多的GPU云服务提供商。2025年9月,英伟达与Lambda签订了一份价值15亿美元的租赁协议,租期为四年,其中包括租回万台搭载自家顶级GPU服务器。这个交易让英伟达成为Lambda最大的客户,而英伟达自己的研发团队将使用这些GPU训练模型。

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第4张具体来说,英伟达先通过销售芯片获得即时收入,让财报好看、股东满意;合作伙伴则依靠出租GPU获得稳定现金流,从而扩大规模;随后英伟达再以租赁的方式把算力锁定在自己手中。此外,这和普通公司选择租用云服务而不是自建机房的逻辑是一样的,可以更灵活地应对研发波峰和波谷。

这个操作的精妙之处在于:芯片卖出的那一刻收入立刻计入英伟达账面;支出则后置;租金在未来几年慢慢摊销转化为运营成本。与此同时,英伟达无需自建数据中心资产压力最小化。

对合作伙伴来说英伟达成了最大甲方算力与现金流被绑定强化了其生态黏性。更微妙的是这种操作还能稳定市场心理。当连英伟达都愿意以这个价格回租便相当于为AI算力行情做了一次背书锚定了价格预期最终变成一石三鸟。

这套玩法复制到了各种英伟达系云计算初创公司中:卖芯片-投资客户-租回服务-再次卖芯片最终变成一个自循环的AI芯片生态资金链。

与此同时英伟达还通过旗下专门的风险投资部门Nventures在更广阔的AI生态下注。它投资了很多初创公司从模型开发到应用层的初创企业。虽然这些公司并非都做云服务但逻辑是一致的:通过投资绑定潜在客户和未来生态只要这些初创公司成长壮大它们的算力需求最终都会转化为对英伟达芯片的采购。

可以说英伟达不仅仅是在卖芯片它就像是在经营一个庞大的AI创业孵化器来打造一套“英伟达系”云生态

03

AI算力的“App Store”

说回Lepton它与英伟达“卖一手、租一手”的本质有一点相似就是给算力“做市”。

与DGX Cloud直接对客户不同Lepton并不亲自经营云服务而是作为“流量调度者”把客户的任务分发给生态合作伙伴的数据中心

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第5张而且Lepton将所有GPU云资源整合到英伟达的软件栈之下比如NIM微服务和NeMo框架。开发者无需关心背后的提供商只需通过Lepton平台即可获得一致的开发体验和环境。

更关键的是Lepton化解了英伟达与云巨头的冲突

英伟达从DGX Cloud到Lepton:算力霸主的转型之路 英伟达 DGX Cloud Lepton 算力市场 第6张对于开发者来说“在哪里算”变得次要;能不能算多久能算成本如何才是核心而这些正是Lepton试图统一的体验层。