当前位置:首页 > 科技资讯 > 正文

微软GPU闲置:电力与基础设施成新挑战

你或许难以想象,微软堆积如山的GPU,只能黯然躺在库房里

在最新的播客节目BG2中,微软CEO纳德拉亲自透露了公司面临的尴尬处境:微软手中握有成堆的GPU,却因为电力短缺和存储空间不足,只能无奈地让它们闲置。

然而,真正的问题并非算力过剩。纳德拉在节目中强调:

真正的挑战并非芯片供应,而是供电能力和我们能否迅速建立靠近电源的数据中心。否则,这些芯片就只能被封存在仓库中。

微软缺电,大量GPU成摆设

在微软内部,大量英伟达的AI芯片被闲置,并非因为算力已经足够或过剩,而是当前的基础设施无法支持这些芯片的运行。

一方面是因为电力短缺。

另一方面则是因为缺乏可立即投入使用的数据中心——也就是纳德拉所说的“warm shells”,即已经建成、具备充足供电与冷却能力的机房外壳。

这并非他首次公开谈及微软的困境。

去年,当被问及微软在2024年是否仍受英伟达芯片供应限制时,纳德拉表示:

我们面临的是电力限制,而非芯片供应限制。

微软GPU闲置:电力与基础设施成新挑战 微软 GPU闲置 电力短缺 基础设施 第1张

今年,这似乎已成为大模型巨头们共同面临的问题。

奥特曼也在同期提到,行业面临的总体挑战不仅仅是算力问题,更是能源和基础设施的匹配问题。

奥特曼对这个问题的关注比多数科技公司要早。

过去两年,他陆续投资了裂变能源公司Oklo、聚变能源公司Helion,以及太阳能创业公司Exowatt。

然而,这些新型能源技术距离大规模商用还很远。短期内,数据中心仍需依赖燃气和可再生能源混合供电。

缺电之外:囤芯片亦非良策

过去五年,美国整体电力需求曲线突然被拉高。

随着AI和云计算驱动的数据中心建设进入高峰期,用电需求开始以超出预期的速度增长,远超公用事业公司的新增发电规划

供给端的反应明显滞后。

传统电厂从立项到并网通常需要数年时间,而AI产业扩张的节奏以季度计算。因此,为了跟上算力扩张的步伐,越来越多的数据中心开发商不得不自己发电。

因此,越来越多的数据中心开发商选择采用所谓的“计量表后”(behind-the-meter)供电方式——直接将电力接入数据中心,绕过公共电网,以弥补供能缺口。

尽管如此,数据中心、电力与冷却系统的建设节奏仍然无法满足现实需求。

微软GPU闲置:电力与基础设施成新挑战 微软 GPU闲置 电力短缺 基础设施 第2张

光伏太阳能被视为目前建设周期最短、部署最灵活的能源形式。但在时间维度上,它与数据中心几乎同步——从选址、施工到并网动辄数月甚至一年。

而AI需求的变化往往只需一次模型更新或产品发布。

举个例子来说:当算力曲线每季度刷新纪录时,能源系统还在审批表格上打转(无奈摊手.jpg)。

部分业内人士担心,如果未来AI需求增速放缓,当前为了支撑AI算力而大规模投资的电厂和储能项目可能会出现闲置风险。

但奥特曼并不这么认为。

奥特曼坚信,AI的用电需求将持续增长,不会回落。也就是说,更高效、更便宜的算力只会激发更多应用场景。

网友建议:研发低能耗芯片?

自20世纪90年代末以来,美国电力生产一直徘徊在约4万亿千瓦时/年。

但这个世界变化得太快了:

人口增长了20%,部分物理电网老化,新的城市生活和科技进步都对电力提出了不断增长的需求。

GPU生产可以按季度迭代,但电力系统、数据中心冷却与输电网络的建设却是以年为单位的工程

One More Thing

周一,微软在𝕏上宣布,相关部门已批准其向阿联酋运送英伟达芯片以建设训练AI模型所需的数据中心。微软还表示未来四年将在海湾国家投资80亿美元用于数据中心、云计算和其他人工智能项目。

微软GPU闲置:电力与基础设施成新挑战 微软 GPU闲置 电力短缺 基础设施 第3张

中东地区资金雄厚、能源丰富。外媒分析称,这笔交易也标志着AI基础设施正在从硅谷迁往能源充足的新兴市场。或许在那里,微软囤积的英伟达GPU能摆脱闲置的命运……