当前位置:首页 > 科技资讯 > 正文

微软自研Maia 200芯片震撼发布:3nm工艺助力GPT-5.2推理,性能领跑数据中心

据最新科技动态,微软在1月27日正式揭晓了其自主研发的AI推理专用芯片——Maia 200。微软官方将其评价为“当前超大规模数据中心领域效能顶尖的自研加速器”,该芯片的推出旨在从根本上优化AI Token生成的经济效益与运行效率。

在硬件规格方面,Maia 200基于台积电3nm先进制程打造,集成了超过1400亿个晶体管。它搭载了原生的FP8/FP4张量核心,并配备了经过深度优化的内存架构,包含容量高达216GB的HBM3e(带宽峰值达7TB/s)以及272MB的片上SRAM,辅以高效的数据传输引擎,确保大规模AI模型能够实现极速响应。

针对低精度计算趋势,Maia 200展现了强悍的性能:在FP4精度下其算力超过10PFLOPS,在FP8精度下则突破了5PFLOPS。令人瞩目的是,这些高性能输出均被控制在750W的SoC热设计功耗(TDP)之内。

对比竞品,Maia 200的FP4性能达到了亚马逊AWS Trainium3的3倍以上,而其FP8处理能力也成功超越了谷歌的TPU v7。

微软自研Maia 200芯片震撼发布:3nm工艺助力GPT-5.2推理,性能领跑数据中心 微软Maia 200  3nm AI芯片 GPT-5.2推理 数据中心算力 第1张

▲Azure Maia 200与AWS Trainium3、谷歌TPU v7的核心规格横向对比

该芯片重新设计的内存子系统以高带宽数据交换为重心,通过专用DMA引擎、片上SRAM以及定制的片上网络(NoC)架构,大幅提升了推理过程中的Token吞吐率。

在集群互联维度,Maia 200提供了高达2.8TB/s的双向专用扩展带宽,这一指标优于AWS Trainium3(2.56TB/s)及谷歌TPU v7(1.2TB/s)。

作为微软目前投入使用的最强推理系统,Maia 200相比上一代硬件,在每美元性能产出上提升了约30%

01.

不仅适配当前主流模型,

更将全面支持GPT-5.2

微软在技术博客中强调,Maia 200具备运行当代顶级规模模型的实力,并为未来的巨型模型预留了充足的算力冗余。

作为Azure异构算力版图的关键一环,Maia 200将重点支持OpenAI即将推出的GPT-5.2模型,为Microsoft 365 Copilot等应用提供更高的算力性价比。

微软自研Maia 200芯片震撼发布:3nm工艺助力GPT-5.2推理,性能领跑数据中心 微软Maia 200  3nm AI芯片 GPT-5.2推理 数据中心算力 第2张

▲Maia 200芯片实拍图

为了降低开发门槛,微软同步推出了Maia软件开发工具包(SDK)预览版,涵盖了PyTorch集成、Triton编译器及底层内核库,方便开发者在不同硬件间无缝迁移模型。

此外,微软的超级智能团队将利用该芯片进行合成数据构建强化学习训练,以此加速下一代自研模型的迭代过程。

目前,Maia 200已在微软爱荷华州的数据中心率先投产,随后将扩展至亚利桑那州等更多全球节点。

02.

2.8TB/s带宽护航,

支持六千余块芯片集群互联

系统架构层面,Maia 200引入了基于以太网标准的双层可扩展网络方案。通过定制传输层,无需绑定私有协议即可实现高可靠与低成本的算力扩展。

单个集群可支持多达6144块芯片互联,每块芯片均具备2.8TB/s的极速双向带宽。

微软自研Maia 200芯片震撼发布:3nm工艺助力GPT-5.2推理,性能领跑数据中心 微软Maia 200  3nm AI芯片 GPT-5.2推理 数据中心算力 第3张

▲Maia 200刀片服务器内部架构示意

在服务器内部,4块Maia芯片通过无交换链路实现全互联。通过统一的Maia AI传输协议,系统能够以最少的跳数完成跨机架的通信需求,降低了延迟并提高了灵活性。

03.

交付速度倍增,

端到端方案优化能效比

得益于“芯片前验证”策略,Maia 200从首批封装件到货到实现数据中心机架部署的时间,缩短了至行业平均水平的一半以下

这种从底层芯片到顶层软件、再到数据中心基础设施的整体协同,直接转化为了更高的资源利用率和更优的每瓦性能表现。

微软自研Maia 200芯片震撼发布:3nm工艺助力GPT-5.2推理,性能领跑数据中心 微软Maia 200  3nm AI芯片 GPT-5.2推理 数据中心算力 第4张

▲Maia 200机架及其配套的液冷散热单元

微软通过高保真模拟环境,在物理芯片问世前就完成了对大语言模型计算模式的软硬协同优化。同时,第二代闭环液冷技术的应用,也进一步确保了在大规模部署下的高可靠性。

04.

结语:构筑未来AI基础设施的基石

随着Maia 200在全球范围内的广泛部署,微软正在为未来几代的AI演进奠定坚实基础。这不仅是硬件的升级,更是对未来算力范式的重新定义。

目前,微软已正式向开发者和学术界开放Maia 200 SDK,邀请各界共同探索超大规模算力下的模型优化新路径。