当前位置:首页 > 科技资讯 > 正文

AI驱动存储周期:HBM供需紧平衡与AI存储角色解析

在AI需求的驱动下,存储行业从HBM延伸至传统存储领域,开启了全面上行周期。以美光为例,存储产品持续涨价,公司的毛利率已达到相对高位。美光公司更是将下季度毛利率指引提高至66-68%,创下历史新高,这意味着这轮存储周期的猛烈程度高于以往。

AI驱动存储周期:HBM供需紧平衡与AI存储角色解析 AI存储 HBM 供需平衡 内存墙 第1张

存储产品的涨价,实际上是存储市场供需关系的反应。本轮“供不应求”的现象,主要由AI服务器等相关需求的带动。在当前本轮存储周期上行已成为共识的情况下,海豚君将主要围绕以下问题展开:

1)AI服务器中各类存储的角色以及当前AI存储面临的问题?

2)三大原厂重视的HBM需求如何,是否存在供需缺口?

3)AI需求爆发的情况下,对传统存储市场的影响如何,供给能否跟上?

AI浪潮的爆发彻底重塑了存储行业格局,带动HBM、DRAM、NAND、HDD等全品类存储产品进入全面上行周期。

从供需角度来看:①需求端,AI服务器从训练向推理的重心转移,催生了对“低延迟、大容量、高带宽”存储的差异化需求;②供给端,存储厂商资本开支向高附加值的HBM与DRAM倾斜,形成结构性供需失衡,推动产品价格大幅上涨。

本文主要解答前两个问题,至于传统市场的影响,海豚君将在下篇中继续展开。

当前AI数据中心领域的核心矛盾是“内存墙”瓶颈——算力增长速度远超数据传输速度,导致GPU等计算单元空置率高达99%

短期来看,HBM向16-Hi堆叠升级(带宽提升至16-32TB/s)与3D堆叠SRAM的商用(延迟压缩至 2ns)形成互补解决方案;中长期则依赖存算一体架构的突破,彻底消除数据搬运的速度问题。

在当前AI存储旺盛需求的情况下,HBM依然是三大原厂最为重视的存储品类,HBM4也将在2026年开启量产。

由于三大原厂(三星、海力士、美光)的资本开支主要投向于HBM领域,2026年HBM的供应量有望增长60%以上。HBM需求量受AI芯片及CoWoS产能的影响,需求量有望提升至42亿GB左右,HBM市场将呈现出“供应紧平衡”的状态

AI驱动存储周期:HBM供需紧平衡与AI存储角色解析 AI存储 HBM 供需平衡 内存墙 第2张

下文将深入拆解存储层级的核心角色定位、破解“内存墙”的技术演进路径,并对HBM这一细分市场的供需情况等方面展开全景解析。而在下篇文章中,将围绕传统市场继续展开,更清晰地看到本轮AI需求点燃的存储行业超级周期。

以下是详细分析

01 AI服务器带来了怎样的存储大周期?

AI存储在服务器中的角色:

回归计算机存储最原始的两大性能维度:a. 存储,作为数据仓库,解决仓库到底有多大的问题;b. 延迟和带宽,解决数据存入和取出的速度问题。

按这两个维度,目前整个大存储行业产品大致可以分为四大类——HBM、DRAM、NAND和HDD。

其中,HBM完全基于AI GPU而生的全新需求,通过Cowos封装技术,是放在GPU“脑壳”的产品,延迟极低;而DRAM(简单理解内存条)读取时间延迟也比较短,是更靠近但独立于算力端(GPU、CPU)的“热存储”,这两者其实都同属于大类DRAM;而HDD虽然延迟较高,但具有大容量的“冷存储”。

AI驱动存储周期:HBM供需紧平衡与AI存储角色解析 AI存储 HBM 供需平衡 内存墙 第3张

各类存储产品在AI服务器中都是什么角色呢?具体来看:

a)HBM:和GPU芯片3D堆叠在一起,是GPU的“专用显存”,具有高带宽、高功耗的特点,价格也相对较高。HBM是AI服务器的“性能天花板”,决定单GPU可承载的模型规模与响应速度。

b)DRAM(DDR5):是数据交换枢纽,由CPU和GPU共用,连接着HBM与NAND的“桥梁”。虽然DDR5的速度比HBM慢一些,但容量大了很多倍。DDR5是AI 服务器的“内存基石”,其容量决定单服务器可同时处理的任务数。

c)NAND(SSD):是热数据仓库高频访问数据的“快速持久层”,连接着DRAM 与 HDD。作为AI 数据中心的“性能-容量平衡者”,SSD是训练数据“快速补给站”,也是推理服务“快速响应核心”。

d)HDD:海量冷数据的低成本容器。HDD虽然带宽最低,但具有大容量、成本低的特点,适合低频使用、长期存放的“冷数据”。

由此可见,一条清晰的AI服务器数据流动路线:HDD的冷数据->SSD预热->DRAM中转->HBM配合计算,其中的各个部分在训练和推理服务器中都是所需要的。

当前AI存储呈现什么样的特点

本轮存储大周期完全由AI需求带动,因此对AI存储的表现也应该主要从下游AI服务器的市场情况入手。

AI驱动存储周期:HBM供需紧平衡与AI存储角色解析 AI存储 HBM 供需平衡 内存墙 第4张

当前现状下,对AI存储需求的影响

“内存墙”瓶颈:大模型到推理阶段,需先从HBM加载模型权重(GB 级)与KV缓存(GB 级)到GPU缓存,再执行计算——计算本身仅需微秒级,但数据搬运则需要毫秒级。

02 HBM市场:升级至HBM4,供需紧平衡

HBM供给端:产能->产量

HBM需求端:CoWoS->AI芯片->HBM

本文主要介绍了各类存储在AI服务器中的角度以及HBM的供需情况。综合上述HBM的供应量(41.9亿GB)和需求量(42.1亿GB)来看,2026年的HBM市场是相对紧张的。这主要是在三大存储原厂大力扩产之下呈现出的紧平衡状态。