AI浪潮的迅猛推进,让原本周期性波动的存储市场步入了一个前所未有的“超级繁荣周期”。在AI大模型训练和推理的双重驱动下,算力需求激增,HBM(High Bandwidth Memory)成为AI服务器的关键组件。它通过多层DRAM堆叠,与GPU紧密结合,为AI计算提供快速的数据通道,成为AI时代的“黄金存储”。
HBM的火爆也带动了整个存储产业链的升温。全球三大存储巨头——三星电子、SK海力士和美光科技,均迎来了业绩的爆发。三星第三季度净利润同比增长21%,SK海力士创下公司史上最高季度利润,美光则实现净利同比增长三倍。SK海力士透露,其2025年前的HBM产能已被客户预订一空。
同时,传统DRAM和NAND芯片也意外走俏。由于存储厂商集中扩产HBM,常规内存产能趋紧,市场供需再平衡。数据中心巨头如亚马逊、谷歌、Meta等,为了扩充AI推理与云服务能力,正大规模采购传统DRAM。在AI推理阶段,普通内存依然发挥着不可替代的作用,使得整个存储市场呈现“全线紧俏”的局面。
先于这一切爆火的,是几乎所有智能手机都在使用的LPDDR(Low-Power Double Data Rate)。
近日,高通发布了全新的AI200和AI250数据中心加速器,预计分别于2026年和2027年上市。这两款新加速器在运行大规模生成式AI工作负载时,凭借更高的效率和更低的运营成本,与AMD和英伟达的机架级解决方案展开竞争。此次发布也重申了高通每年发布更新产品的计划。
Qualcomm AI200和AI250加速器均基于专为数据中心AI工作负载定制的Qualcomm Hexagon神经处理单元(NPU)。近年来,高通一直在逐步改进其Hexagon NPU,因此这些处理器的最新版本配备了标量、矢量和张量加速器(采用12+8+1配置),支持多种数据格式以及用于减少内存流量的技术。对于高通来说,将Hexagon扩展到数据中心工作负载是一个自然的选择。
高通的AI200机架级解决方案将是其首款由AI200加速器驱动的数据中心级推理系统,配备768GB LPDDR内存,通过PCIe实现纵向扩展,并通过以太网实现横向扩展。该系统采用直接液冷,每机架功率高达160kW。此外,该系统支持企业部署的机密计算,将于2026年上市。
一年后推出的AI250保留了这一架构,但增加了近内存计算架构,有效内存带宽提升了十倍以上。该系统支持分解推理功能,使计算和内存资源能够在不同卡之间动态共享。高通将其定位为一款更高效、高带宽的解决方案,针对大型Transformer模型进行了优化。
高通没有采用昂贵的HBM,而是将其在智能手机领域发展完善的低功耗LPDDR技术应用于数据中心。这一看似“降维”的选择背后,昭示了AI存储的另一种可能性。
三大芯片巨头不约而同地转向LPDDR,并非偶然事件,而是整个产业的一次调整。有机构预测,到2030年,推理工作负载的数量将是训练工作负载的100倍。
业内人士将AI目前的瓶颈称为“马提尼吸管问题”:计算引擎是酒杯,而数据却通过吸管流动。无论芯片多么强大,其性能都受限于数据流入和流出的速度。现代AI推理工作负载越来越受内存限制而非计算限制——随着模型规模扩大和上下文窗口扩展,挑战在于如何快速将数据输送给处理器。
存储的瓶颈正是LPDDR方案的价值所在。根据高通引用的研究,LPDDR内存的性价比比HBM高出13倍,使得大型语言模型推理工作负载可以直接在内存中运行。
当然,LPDDR方案并非没有代价。相比HBM,它存在内存带宽较低、由于较窄接口导致的更高延迟等问题。但关键在于应用场景的差异:在训练场景中,需要极致的内存带宽来处理海量数据;而在推理场景中,模型参数已固定,重点是大容量存储和高效读取。
AI存储技术路线的转变也酝酿了一场可能波及全球消费电子市场的供应链危机。
一个AI推理机架配备的LPDDR内存量惊人。以高通AI200为例,单个机架可能包含数十张加速卡,每张768GB,总内存容量可达数十TB。这相当于数十万甚至上百万部智能手机的内存用量。
当高通、英特尔、英伟达等公司在2026-2027年大规模量产LPDDR方案时,对LPDDR的需求将呈现指数级增长。目前LPDDR产能主要由三星、SK海力士和美光三家供应商控制。数据中心客户采购量巨大、利润率高、订单稳定且长期。
这可能导致数据中心订单挤占消费电子份额,类似过去加密货币挖矿导致GPU短缺的情况。手机厂商可能面临LPDDR采购成本上升、交货周期延长等问题。
全球半导体标准制定组织JEDEC(固态技术协会)近日发布了最新标准文档JESD209-6,标志着下一代低功耗内存——LPDDR6正式登场。这是LPDDR系列的重大进化,也是首个在官方规范中提及DDR6的标准。
JEDEC表示,LPDDR6在性能、能效、安全性和稳定性方面实现了系统性升级。其核心架构由传统的双通道演进为四个24位子通道,实现更高的并行度与更低的访问延迟。此外,LPDDR6在功耗管理上进行了深度优化。
在性能指标上,LPDDR6的数据速率可达10,667至14,400 MT/s,有效带宽约为 28.5至38.4 GB/s。这一速度已经超越目前DDR5-12054的超频纪录。
作为新一代LPDDR6有望在短时间内被行业广泛采用。虽然目前JEDEC尚未公布面向桌面平台的DDR6最终规范,但官方表示相关标准也将在年内发布。
这场从HBM到LPDDR的转向是AI产业从不计成本的技术竞赛走向精打细算的商业化部署的标志。
尽管英伟达的CUDA软件栈在AI训练领域仍然无可匹敌但推理领域的情况完全不同:模型已经训练完成只需要高效运行对价格极为敏感。
这为高通、英特尔等公司打开了以全新方式竞争的大门。它们并非试图制造更大的GPU来正面挑战英伟达而是着眼于一个现实:大多数AI模型无需每天重新训练只需要高效运行且能在任何地方运行。
未来的AI硬件市场可能呈现明显的分层结构训练市场中HBM依然不可替代英伟达/AMD继续主导但在推理市场中LPDDR有望异军突起成为新一代AI芯片的选择。
本文由主机测评网于2026-05-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543767.html