当前位置:首页 > 科技资讯 > 正文

AI推理革命:TPU v7成本骤降70%,定制化ASIC正终结通用芯片霸权

AI推理革命:TPU v7成本骤降70%,定制化ASIC正终结通用芯片霸权 TPU v7  AI推理成本 博通Broadcom ASIC芯片 第1张

近期,高盛(Goldman Sachs)一份名为《Inference Cost Curve》的深度报告在科技圈引发剧震。

这份发布于1月20日的报告指出,随着谷歌与博通(Broadcom)联合打造的最新一代 TPU v7 芯片进入量产,其单位算力的推理成本实现了高达 70% 的断崖式下跌。

01

这 70% 的降幅究竟意味着什么?如果仅看硬件迭代,你可能觉得这只是硅片性能的常规跨越。

但高盛的核心洞察在于:这七成的成本缩减,本质上正在物理与经济规律层面重塑AI行业的底层逻辑。

要透彻理解这一点,我们需要厘清「大模型训练」与「大模型推理」的商业本质区别。

在过去的两年中,全球AI巨头都在疯狂“基建”,即训练大模型。彼时,算力是核心引擎,谁拥有最强的英伟达 H100/H200,谁就能最快打磨出顶尖的AI模型。

那是一个不计成本追求速度的时代,英伟达的溢价虽高,但别无选择。但现在,行业已由“造车”阶段转向“运营”阶段,即模型的大规模推理。此时,决策者最关注的不再是爆发力,而是:每产生一个Token,需要燃烧多少成本。

高盛报告的毒辣之处在于,它敏锐地意识到:AI商业化的下半场,是关于“每瓦性能”和“每Token成本”的肉搏。

那么,这 70% 的红利是如何压榨出来的?

在传统的芯片升级路径中,能提升 30% 的效能已属顶尖。TPU v7 能够实现翻倍级的飞跃,高盛认为这是「系统级工程对单体算力工具的降维打击」

我们可以做一个形象的类比:

英伟达的 GPU 像是一台配置了 V12 发动机的超级跑车,为了极致的爆发性,它容忍高昂的油耗、巨大的发热和复杂的传动冗余。

而谷歌的 TPU v7 则更像是一列高度定制化的高铁系统。单节车厢的极限性能或许未必超越超跑,但当它将成百上千节车厢有机整合后,整体效率便发生了质变。

在高并发处理海量数据流时,高铁的人均能效比可以直接将超跑模式“按在地上摩擦”。

具体而言,这 70% 的成本红利源于三个维度:

首先是数据互联的极速化,芯片间的通信延时被压缩至近乎零等待;其次是先进封装的重构,将计算单元与存储模块极度靠近,大幅减少了信号传输中的能效损耗。

更为关键的一点,是架构的“断舍离”。

作为 ASIC(专用集成电路),TPU 剔除了一切不属于AI计算的冗余功能。它在硅片上的每一平方毫米,都是为了AI矩阵运算而生,不存在任何性能浪费。

高盛的数据显示,TPU v7 的绝对成本已能与英伟达 GB200 系统持平。这标志着一个转折点:以前选择定制芯片是“买不起英伟达”的无奈,而现在,它是追求商业利润最大化的主动抉择。

当 Meta、微软等巨头意识到定制算力能将原本昂贵的运营成本砍掉 70%,其带来的净利润增长足以改变资本市场的估值模型。这正是 ASIC 正式向通用 GPU 霸权宣战的信号:在商业化后期,专精特新方案必将超越通用算力。

02

如果说 70% 的降本是理论上的伏笔,那么 Anthropic 豪掷 210 亿美金的订单,就是炸开行业格局的惊雷。

210 亿美金,这是什么概念?

这笔资金规模,相当于 2024 年全球半数AI初创公司融资额的总和。根据高盛的市场研报,这笔巨资将覆盖自 2025 年底开始的、跨越数年的定制芯片采购周期。

很多人困惑 Anthropic 的底气何在?答案在于其身后的谷歌与亚马逊。尤其是谷歌,作为核心股东,这笔订单更像是一次战略级的“资源重组”。

Anthropic 此举,实际上是在重构AI时代的「算力主权」。

过去的大模型公司看似光鲜,实则是为英伟达“打工”。融资额的八成变成了老黄的利润,还要承受排队等货的不确定性。这种“寄人篱下”的模式显然不可持续。

Anthropic 砸出这 210 亿,目标有三:

其一,实现从“租房”到“买地”的阶级跨越。购买通用 GPU 就像租住高价豪宅,而自研 ASIC 则是自建庄园。高盛测算,长期来看,自建定制算力的整体持有成本将远低于支付给英伟达的超高溢价。

其二,锁定供应链的“确定性”。在AI赛道,比芯片贵更致命的是“断供”。通过博通与谷歌开“小灶”,Anthropic 获得了专属的生产通道,这种对节奏的掌控力,在瞬息万变的AI战场比黄金更贵。

其三,追求“软硬合一”的效率极致。

正如苹果的 M 系列芯片,Anthropic 的定制芯片在电路图阶段就是为 Claude 模型的算法特性量身定制的。算法需要多大的吞吐,芯片就预留多宽的“水管”;这种“量体裁衣”的配合,效率自然远超“均码”的通用方案。

因此,在高盛的成本曲线模型中,这 210 亿美金非但不是挥霍,反而是其确立长期护城河的最优投资。这也预示着,大模型阵营正在加速分化,拥有定制算力能力的“大户”正与普通玩家拉开代差。

03

在高盛的分析逻辑中,博通(Broadcom)正成为最大的“隐形赢家”。

现在的博通,已完成了从“组件商”到“AI军火总装厂”的身份迁跃。它是硅谷各大科技大厂在去英伟达化进程中的“白手套”:

从谷歌 TPU v7 的互联技术,到亚马逊的 Trainium 设计,再到 Anthropic 的天量订单,背后处处可见博通的影子。

博通的商业模式极具战略纵深:它不靠卖整卡赚取风险极高的毛利,而是依靠“NRE(定制研发费)+ 量产分成”的模式稳坐钓鱼台。

大厂自研芯片,无论成败,博通的研发费先入账;一旦量产,博通则按芯片颗数持续抽成。英伟达需要预测市场,而博通只需要服务客户,风险与收益的性价比极高。

为什么大厂离不开博通?因为在当下的芯片竞赛中,算力的天花板已不在核心制程,而在“连接”。博通掌握的先进封装技术和光互连方案,能让上万颗芯片协同如一人,这才是其真正的独门绝技。

更重要的是,博通极大地降低了造芯片的门槛。它告诉 Meta 和微软:你们只需懂模型算法,剩下的设计、流片、代工谈判,博通全包。这种“交钥匙工程”让自研芯片从梦想变成了现实。

相比于估值处于高位且面临增长瓶颈的英伟达,博通的收入结构更加多元且稳固。高盛认为,在AI行业从狂热转向理性的过程中,博通这类“收过路费”的基建方,其确定性更受聪明钱的青睐。

04

目光转回国内,高盛揭示的这套 ASIC 崛起逻辑,对中国AI产业有何启示?

一个吊诡的结论是:外部的技术限制,反而倒逼出了中国版的 ASIC 加速时代。由于难以获取英伟达最顶级的通用芯片,国内大厂如华为、字节、百度等,不得不提前进入“为模型定制芯片”的生存模式。

既然买不到最强的“通用工具”,就必须打造最契合业务的“专用利刃”。这种逻辑与 Anthropic 如出一辙。

然而,我们需要清醒地认识到:中国不缺设计单体芯片的公司,缺的是像博通这样的“总设计师”。

在先进制程受限的背景下,如何通过先进封装(CoWoS)、芯粒技术(Chiplet)和高速光模块将现有算力堆叠出更高的效率,才是真正的胜负手。这正是我们需要关注的投资主线:

真正的价值在于产业链上游的“卖铲人”。例如,在光通信互联、先进封装测试等领域具备核心壁垒的企业,其稳健性将远高于单纯的芯片设计公司。

同时,推理成本的骤降将彻底引爆国内的应用层市场。一旦调用模型的成本降低一个数量级,原本因为“算不起”而搁置的场景——如AI短剧、智慧教育、低成本电商导购等,将迎来井喷式爆发。

结论已经显现:AI芯片的下半场,是定制化的时代,更是系统级能力的竞争。

在这个时代,唯有拥有核心壁垒——无论是独家的算法适配、顶尖的封装技术,还是极致的落地场景——才能在算力革命的浪潮中立于不败之地。只会组装硬件的“方案商”,终将被成本曲线的剧变所淘汰。