当前位置:首页 > 科技资讯 > 正文

亚马逊AWS发布Trainium 3,挑战英伟达主导地位

亚马逊AWS发布Trainium 3,挑战英伟达主导地位 亚马逊AWS Trainium 3 英伟达 AI芯片 第1张

(亚马逊AWS CEO马特·加曼在re:Invent 2025发布Trainium 3)

作者按:re:Invent是全球最大云厂商亚马逊AWS一年一度的战略和技术大会。re:Invent 2025于12月1日-5日在美国拉斯维加斯召开。我们在现场,记录美国云计算行业这一年最新的变化。

以下是正文:

在re:Invent 2025大会上,亚马逊AWS宣布推出全新AI芯片Trainium 3以及一系列自研模型,展示了其强大的创新实力。

马特·加曼(Matt Garman),亚马逊AWS的CEO,宣布了Trainium 3的正式上线。这款芯片采用了先进的3nm工艺制程,其性能令人瞩目。同时,他们还透露了下一代AI芯片Trainium 4的研发进展。

此外,亚马逊AWS还发布了Amazon Nova 2系列自研模型,包括Lite、Pro、Sonic和Omni等四款,这些模型已经吸引了数万家企业客户,如海信和印孚瑟斯(印度第二大IT企业)等。

01

亚马逊AWS已部署百万枚自研AI芯片

马特·加曼提到,目前亚马逊已经部署了超过100万枚Trainium系列AI芯片,这些芯片每年为亚马逊AWS带来数十亿美元的收益。

部署这些芯片需要巨大的电力资源。在过去12个月里,亚马逊AWS新增了3.8GW的算力,其算力电力容量是2022年的两倍,并计划在2027年再次翻倍。

Trainium 3在电力效率方面表现卓越,每兆瓦电力能产生的Token数量是上一代芯片的五倍。与其他产品相比,其训练成本最多可降低50%。

路线图显示,Trainium 4在FP4计算精度下的性能将比Trainium 3提升6倍以上,进一步增强了亚马逊AWS在AI芯片市场的竞争力。

尽管Trainium系列芯片不直接对外销售,但通过云服务的方式,它们已经服务于包括Anthropic和databricks在内的众多企业客户。

亚马逊AWS发布Trainium 3,挑战英伟达主导地位 亚马逊AWS Trainium 3 英伟达 AI芯片 第2张

Trn3 UltraServer服务器集成了144枚Trainium 3芯片,总算力高达362PFlops。尽管单卡性能稍逊于英伟达GB200 NVL72,但通过提升服务器集群的算力和带宽,亚马逊AWS成功地缩小了与英伟达之间的差距。

这是亚马逊通过系统优化弥补单卡性能不足的成功案例。

02

云厂自研芯片,挑战英伟达

亚马逊AWS等云厂商自研AI芯片的主要目标是降低TCO(总拥有成本)。

截至2025年,英伟达在全球AI芯片市场占据超过60%的份额,其综合毛利率高达69%。这意味着,其他云厂商每采购一枚英伟达的芯片,都要支付高额的成本。

为了减少对英伟达芯片的依赖,一些科技公司选择了ASIC技术路线。云厂商的自研芯片一旦实现量产,其成本将逐渐降低,甚至可能以低于英伟达同等规格芯片三分之一的价格获得自研芯片。

谷歌TPU v7就是一个成功的例子。其运行成本仅为英伟达GB200的56%,显示出自研芯片在成本上的巨大优势。

亚马逊AWS发布Trainium 3,挑战英伟达主导地位 亚马逊AWS Trainium 3 英伟达 AI芯片 第3张

目前,成功自研AI芯片并规模化替代英伟达的云厂商包括亚马逊和谷歌。这两家公司在英伟达占据主导的市场中,已经取得了显著的进展。