多年来,谷歌的Tensor Processing Units(TPU)主要服务于自家的AI模型。然而,随着TPUv7的推出,这一战略正在经历重大转变。据芯片分析机构SemiAnalysis指出,谷歌正积极向第三方销售TPU芯片,直接与英伟达展开竞争。
Anthropic成为谷歌TPU的首批重要客户之一,交易涉及约100万颗TPU,包括直接采购硬件和通过谷歌云平台(GCP)租赁两种方式。这些硬件运行的基础设施功耗预计超过1吉瓦(10亿瓦)。
市场竞争格局已经发生变化。根据SemiAnalysis的报告,OpenAI在转向TPU或其他替代方案后,在与英伟达的谈判中获得了约30%的价格折扣。
TPU技术栈长期以来与英伟达的AI硬件竞争,但过去主要支持谷歌的内部工作负载。尽管在2018年将其提供给GCP客户后,TPU始终未能完全实现商业化。然而,近年来,谷歌已动员其全栈资源,通过GCP向外部客户提供TPU,甚至作为商业供应商销售完整的TPU系统。
这一举措与Anthropic(谷歌的关键客户)希望减少对英伟达依赖的战略不谋而合。因此,与Anthropic的合作是谷歌在这一战略上迈出的标志性一步。
除了通过GCP租用谷歌数据中心的容量外,Anthropic还将在其自有设施中部署TPU,这使得谷歌能够直接作为硬件供应商与英伟达展开竞争。
实际应用数据表明,TPU已不再是次选方案。近期发布的两大顶尖AI模型——谷歌Gemini 3 Pro和Anthropic Claude 4.5 Opus,都主要依托谷歌TPU和亚马逊Trainium芯片。其中Gemini 3更是完全基于TPU训练完成。
技术层面,TPUv7“Ironwood”在理论算力(FLOPs)和内存带宽上已接近英伟达Blackwell架构产品。但真正的竞争优势在于价格。
对谷歌而言,每颗TPU的总拥有成本比英伟达GB200低约44%。即使对外部客户如Anthropic(需支付额外溢价),每个有效计算单元的成本仍可能比英伟达系统低30%-50%。
软件兼容性长期制约TPU普及,英伟达CUDA平台仍是事实上的行业标准。为此谷歌正加大投入消除这一障碍,据称正在开发对PyTorch框架的原生支持,并集成vLLM等推理库。
谷歌的目标是让TPU成为可行替代方案,且不要求开发者重构整个工具链。然而,TPU软件栈核心的XLA编译器仍属专有技术。
面对谷歌的强势进攻,英伟达正筹备技术反击。预计将在2026年到2027年推出的“Vera Rubin”芯片将采用HBM4内存等激进设计。
谷歌的应对策略是TPUv8双线开发。据SemiAnalysis透露,谷歌计划推出两个版本:与博通合作的“Sunfish”,以及与联发科合作的“Zebrafish”。尽管实现多元化,但设计仍显保守且已有延迟。
“谷歌已亮出底牌,现在压力来到英伟达这边。”SemiAnalysis总结道。
本文由主机测评网于2026-05-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545465.html