当前位置：首页 > 科技资讯 > 正文

AI推理革命：TPU v7成本骤降70%，定制化ASIC正终结通用芯片霸权

主机测评网
科技资讯
2026-04-03
174

AI推理革命：TPU v7成本骤降70%，定制化ASIC正终结通用芯片霸权 TPU v7 AI推理成本博通Broadcom ASIC芯片第1张

近期，高盛（Goldman Sachs）一份名为《Inference Cost Curve》的深度报告在科技圈引发剧震。

这份发布于1月20日的报告指出，随着谷歌与博通（Broadcom）联合打造的最新一代 TPU v7 芯片进入量产，其单位算力的推理成本实现了高达 70% 的断崖式下跌。

01

这 70% 的降幅究竟意味着什么？如果仅看硬件迭代，你可能觉得这只是硅片性能的常规跨越。

但高盛的核心洞察在于：这七成的成本缩减，本质上正在物理与经济规律层面重塑AI行业的底层逻辑。

要透彻理解这一点，我们需要厘清「大模型训练」与「大模型推理」的商业本质区别。

在过去的两年中，全球AI巨头都在疯狂“基建”，即训练大模型。彼时，算力是核心引擎，谁拥有最强的英伟达 H100/H200，谁就能最快打磨出顶尖的AI模型。

那是一个不计成本追求速度的时代，英伟达的溢价虽高，但别无选择。但现在，行业已由“造车”阶段转向“运营”阶段，即模型的大规模推理。此时，决策者最关注的不再是爆发力，而是：每产生一个Token，需要燃烧多少成本。

高盛报告的毒辣之处在于，它敏锐地意识到：AI商业化的下半场，是关于“每瓦性能”和“每Token成本”的肉搏。

那么，这 70% 的红利是如何压榨出来的？

在传统的芯片升级路径中，能提升 30% 的效能已属顶尖。TPU v7 能够实现翻倍级的飞跃，高盛认为这是「系统级工程对单体算力工具的降维打击」。

我们可以做一个形象的类比：

英伟达的 GPU 像是一台配置了 V12 发动机的超级跑车，为了极致的爆发性，它容忍高昂的油耗、巨大的发热和复杂的传动冗余。

而谷歌的 TPU v7 则更像是一列高度定制化的高铁系统。单节车厢的极限性能或许未必超越超跑，但当它将成百上千节车厢有机整合后，整体效率便发生了质变。

在高并发处理海量数据流时，高铁的人均能效比可以直接将超跑模式“按在地上摩擦”。

具体而言，这 70% 的成本红利源于三个维度：

首先是数据互联的极速化，芯片间的通信延时被压缩至近乎零等待；其次是先进封装的重构，将计算单元与存储模块极度靠近，大幅减少了信号传输中的能效损耗。

更为关键的一点，是架构的“断舍离”。

作为 ASIC（专用集成电路），TPU 剔除了一切不属于AI计算的冗余功能。它在硅片上的每一平方毫米，都是为了AI矩阵运算而生，不存在任何性能浪费。

高盛的数据显示，TPU v7 的绝对成本已能与英伟达 GB200 系统持平。这标志着一个转折点：以前选择定制芯片是“买不起英伟达”的无奈，而现在，它是追求商业利润最大化的主动抉择。

当 Meta、微软等巨头意识到定制算力能将原本昂贵的运营成本砍掉 70%，其带来的净利润增长足以改变资本市场的估值模型。这正是 ASIC 正式向通用 GPU 霸权宣战的信号：在商业化后期，专精特新方案必将超越通用算力。

02

如果说 70% 的降本是理论上的伏笔，那么 Anthropic 豪掷 210 亿美金的订单，就是炸开行业格局的惊雷。

210 亿美金，这是什么概念？

这笔资金规模，相当于 2024 年全球半数AI初创公司融资额的总和。根据高盛的市场研报，这笔巨资将覆盖自 2025 年底开始的、跨越数年的定制芯片采购周期。

很多人困惑 Anthropic 的底气何在？答案在于其身后的谷歌与亚马逊。尤其是谷歌，作为核心股东，这笔订单更像是一次战略级的“资源重组”。

Anthropic 此举，实际上是在重构AI时代的「算力主权」。

过去的大模型公司看似光鲜，实则是为英伟达“打工”。融资额的八成变成了老黄的利润，还要承受排队等货的不确定性。这种“寄人篱下”的模式显然不可持续。

Anthropic 砸出这 210 亿，目标有三：

其一，实现从“租房”到“买地”的阶级跨越。购买通用 GPU 就像租住高价豪宅，而自研 ASIC 则是自建庄园。高盛测算，长期来看，自建定制算力的整体持有成本将远低于支付给英伟达的超高溢价。

其二，锁定供应链的“确定性”。在AI赛道，比芯片贵更致命的是“断供”。通过博通与谷歌开“小灶”，Anthropic 获得了专属的生产通道，这种对节奏的掌控力，在瞬息万变的AI战场比黄金更贵。

其三，追求“软硬合一”的效率极致。

正如苹果的 M 系列芯片，Anthropic 的定制芯片在电路图阶段就是为 Claude 模型的算法特性量身定制的。算法需要多大的吞吐，芯片就预留多宽的“水管”；这种“量体裁衣”的配合，效率自然远超“均码”的通用方案。

因此，在高盛的成本曲线模型中，这 210 亿美金非但不是挥霍，反而是其确立长期护城河的最优投资。这也预示着，大模型阵营正在加速分化，拥有定制算力能力的“大户”正与普通玩家拉开代差。

03

在高盛的分析逻辑中，博通（Broadcom）正成为最大的“隐形赢家”。

现在的博通，已完成了从“组件商”到“AI军火总装厂”的身份迁跃。它是硅谷各大科技大厂在去英伟达化进程中的“白手套”：

从谷歌 TPU v7 的互联技术，到亚马逊的 Trainium 设计，再到 Anthropic 的天量订单，背后处处可见博通的影子。

博通的商业模式极具战略纵深：它不靠卖整卡赚取风险极高的毛利，而是依靠“NRE（定制研发费）+ 量产分成”的模式稳坐钓鱼台。

大厂自研芯片，无论成败，博通的研发费先入账；一旦量产，博通则按芯片颗数持续抽成。英伟达需要预测市场，而博通只需要服务客户，风险与收益的性价比极高。

为什么大厂离不开博通？因为在当下的芯片竞赛中，算力的天花板已不在核心制程，而在“连接”。博通掌握的先进封装技术和光互连方案，能让上万颗芯片协同如一人，这才是其真正的独门绝技。

更重要的是，博通极大地降低了造芯片的门槛。它告诉 Meta 和微软：你们只需懂模型算法，剩下的设计、流片、代工谈判，博通全包。这种“交钥匙工程”让自研芯片从梦想变成了现实。

相比于估值处于高位且面临增长瓶颈的英伟达，博通的收入结构更加多元且稳固。高盛认为，在AI行业从狂热转向理性的过程中，博通这类“收过路费”的基建方，其确定性更受聪明钱的青睐。

04

目光转回国内，高盛揭示的这套 ASIC 崛起逻辑，对中国AI产业有何启示？

一个吊诡的结论是：外部的技术限制，反而倒逼出了中国版的 ASIC 加速时代。由于难以获取英伟达最顶级的通用芯片，国内大厂如华为、字节、百度等，不得不提前进入“为模型定制芯片”的生存模式。

既然买不到最强的“通用工具”，就必须打造最契合业务的“专用利刃”。这种逻辑与 Anthropic 如出一辙。

然而，我们需要清醒地认识到：中国不缺设计单体芯片的公司，缺的是像博通这样的“总设计师”。

在先进制程受限的背景下，如何通过先进封装（CoWoS）、芯粒技术（Chiplet）和高速光模块将现有算力堆叠出更高的效率，才是真正的胜负手。这正是我们需要关注的投资主线：

真正的价值在于产业链上游的“卖铲人”。例如，在光通信互联、先进封装测试等领域具备核心壁垒的企业，其稳健性将远高于单纯的芯片设计公司。

同时，推理成本的骤降将彻底引爆国内的应用层市场。一旦调用模型的成本降低一个数量级，原本因为“算不起”而搁置的场景——如AI短剧、智慧教育、低成本电商导购等，将迎来井喷式爆发。

结论已经显现：AI芯片的下半场，是定制化的时代，更是系统级能力的竞争。

在这个时代，唯有拥有核心壁垒——无论是独家的算法适配、顶尖的封装技术，还是极致的落地场景——才能在算力革命的浪潮中立于不败之地。只会组装硬件的“方案商”，终将被成本曲线的剧变所淘汰。

服务器教程高防服务器性价比服务器

本文由主机测评网于2026-04-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260433308.html

AI推理革命：TPU v7成本骤降70%，定制化ASIC正终结通用芯片霸权

01

02

03

04

英伟达智驾下个十年：从硬件霸主到AI全栈总承包商的范式转换

AI颠覆职业阶梯：吴恩达对话诺奖得主，揭秘“人机协同”时代的职场生存法则

AI推理革命：TPU v7成本骤降70%，定制化ASIC正终结通用芯片霸权

01

02

03

04

英伟达智驾下个十年：从硬件霸主到AI全栈总承包商的范式转换

AI颠覆职业阶梯：吴恩达对话诺奖得主，揭秘“人机协同”时代的职场生存法则

相关文章