当前位置:首页 > 科技资讯 > 正文

摩尔线程S5000与GLM-5的“零时差”适配:国产算力的飞跃

在国产AI算力领域,硬件性能的堆砌只是入场券,而软硬协同的生态适配才是胜负的关键。随着智谱AI最新一代“国模顶流”GLM-5的发布,这一Coding能力位居全球开源第一、总榜第四的模型迅速引发行业热议。

与此同时,摩尔线程宣布其AI旗舰级计算卡MTT S5000实现了对GLM-5的Day0“发布即适配”,并首次披露了硬件性能参数,不仅单卡算力达1000 TFLOPS,还提供原生FP8支持,在显存容量、互联带宽上与英伟达H100对标。从2024年推出至今,这款专为训推一体设计的全功能GPU智算卡,不仅在纸面参数上对标国际主流产品,更在实战中展现出挑战英伟达高端算力的实力。

摩尔线程S5000与GLM-5的“零时差”适配:国产算力的飞跃 摩尔线程 GLM-5 国产算力 MUSA软件栈 第1张

摩尔线程究竟做对了什么,使其能够从GLM-4.6一路无缝衔接到GLM-5,让“零时差”适配成为国产算力的常态?

生态的飞跃,GLM-5“Day-0”适配背后的全栈协同

此次GLM-5发布即适配的背后,是摩尔线程软硬协同技术路线的集中爆发。作为定位Agentic Engineering的旗舰模型,GLM-5相比上一代性能提升20%,对长序列推理和复杂系统工程能力提出极高要求。MTT S5000凭借充沛的算力储备与对稀疏Attention的架构级支持,在大规模上下文处理中保持高吞吐与低延迟,完美承接了GLM-5在长程Agent任务中的计算需求。

更关键的是,MUSA软件栈的敏捷性成为实现“Day-0”适配的胜负手。基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%,使得绝大多数通用算子可直接复用,极大降低了移植成本。

通过高效算子融合及框架极致优化,MTT S5000在GLM-5的运行中展现极低的首字延迟(TTFT)和流畅的生成体验,特别是在函数补全、漏洞检测等Coding核心场景中表现优异。

摩尔线程S5000与GLM-5的“零时差”适配:国产算力的飞跃 摩尔线程 GLM-5 国产算力 MUSA软件栈 第2张

硬实力的底气,S5000性能逼近Blackwell

MTT S5000性能的首次全面曝光,揭示了国产GPU在架构设计与集群扩展上的成熟度。作为摩尔线程第四代MUSA架构“平湖”的集大成者,S5000在单卡规格上能力接近国际一流水平,搭载80GB显存,显存带宽高达1.6TB/s,卡间互联带宽达到784GB/s,单卡FP8算力飙升至1000 TFLOPS,在显存、卡间互联、单卡算力上与英伟达H100基本一致。

摩尔线程S5000与GLM-5的“零时差”适配:国产算力的飞跃 摩尔线程 GLM-5 国产算力 MUSA软件栈 第3张

此外,MTT S5000对FP8到FP64全精度计算的完整支持,特别是硬件级FP8 Tensor Core的引入,成为其性能跃升的核心引擎。据接近测试项目的行业人士透露,MTT S5000在产品精度层面已超越H100,技术特性更逼近英伟达下一代Blackwell架构。

摩尔线程S5000与GLM-5的“零时差”适配:国产算力的飞跃 摩尔线程 GLM-5 国产算力 MUSA软件栈 第4张

来自互联网厂商场景的实测反馈进一步印证了其在算力上的优势。数据显示,在典型端到端推理及训练任务中,MTT S500...