【导读】港科大与西电团队携手港大,登上Nature子刊,成功破解AI芯片的核心难题。他们通过创新性地利用忆阻器的可编程特性,打造出自适应数据分布的“智能标尺”,使AI芯片的功耗锐减57.2%,面积缩小30.7%,为高效AI硬件系统开辟了新的道路。
随着AI算力需求的指数级增长,为了突破算力瓶颈,“存算一体”(CIM)架构被视为AI推理芯片的未来。然而,模数转换器(ADC)这一占能耗高达87.8%的“黑洞”严重阻碍了其发展。
在先进的存算一体芯片中,ADC不仅消耗大量能量,还占据了大量面积,极大压制了存算一体AI芯片应有的潜力。近期,来自香港大学、香港科技大学与西安电子科技大学的联合研究团队成功攻克了这一难题。
该设计利用忆阻器的可编程特性,让ADC变得智能且高效,极大地降低了能耗和面积,为下一代高效AI硬件系统铺平了道路。
要理解这项突破的意义,我们首先要明白AI芯片为何“渴求”存算一体。传统的冯·诺依曼架构中,计算单元和存储单元是分离的,导致AI计算时消耗大量能量和时间。而“存算一体”架构则直接在存储器内部进行计算,消除了数据搬运的瓶颈。
其中,模拟域存算一体被认为极具潜力,但模数转换器(ADC)却成为新的瓶颈。这个“翻译官”的工作效率极低,使得存算一体芯片无法发挥应有的能效优势。
硬件笨重:传统ADC需要一个庞大的电阻或电容阵列作为“标尺”,精度越高,阵列越庞大,能耗和面积也随之激增。
标尺僵化:传统“标尺”通常是固定且均匀的,但AI模型中不同网络层的计算结果分布往往是非均匀的。用一把均匀的尺子去测量分布不均的数据,会造成巨大的精度损失。
研究团队提出了一个颠覆性的解决方案:利用忆阻器来打造这把“标尺”。忆阻器是一种可编程非易失器件,其电阻值可通过施加电压来调控,并且能“记住”这个电阻值。
基于忆阻器设计的新型“量化单元”(Q-cell)替代了传统ADC中的庞大电阻/电容阵列。这把新“标尺”的核心优势在于它是完全可编程的,具备低能耗和紧凑的面积。
团队将忆阻器ADC与先进ADC设计进行了对比。结果显示,在5-bit精度下,忆阻器ADC的能效提升了15.1倍,面积缩小了12.9倍。
集成高效的忆阻器ADC后,以VGG8网络为例,ADC模块在系统总能耗中的占比从79.8%锐减至22.5%,在总面积中的占比也从47.6%压缩至16.9%。这意味着系统功耗和面积分别降低了57.2%和30.7%。
研究团队独创性地提出了“超分辨率”策略,巧妙地将器件差异转化为优势。通过同时使用两个忆阻器ADC来量化同一个信号,他们实现了超越单个ADC的“超分辨率”。
为了确保研究的可靠性,团队实际制造了8×8的忆阻器阵列,并进行了全面的实验表征。实验证明这些器件具有高度一致的可编程性和稳定性。
这项工作直面了模拟存算一体落地中最关键的ADC瓶颈,通过将忆阻器的可编程性与ADC的功能需求结合,打造出了一款高效、智能、自适应的硬件原生ADC。
这项研究为下一代高效、精准AI硬件系统的研发提供了新的技术路径,有望加速存算一体芯片的产业化进程。
本文由主机测评网于2026-05-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544616.html