当前位置:首页 > 科技资讯 > 正文

谷歌TPU崛起:挑战英伟达GPU的算力新纪元

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第1张

股价飙升,谷歌在科技界的王者地位再获肯定。

凭借性能卓越的新品Gemini 3,短短半个月内,股价不涨反跌,却在竞技场内外展现出了非凡的实力。

一次小挫败,不足为惧。

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第2张

谷歌股价持续攀升,背后有何奥秘?

老黄(黄仁勋,英伟达创始人)的失利,原因很简单。谷歌表示,Gemini 3 Pro是在自研TPU(Tensor Processing Unit)上训练的,至少在字面上,并未提及英伟达。

媒体和公众开始猜测,谷歌这次可能真要终结CUDA的垄断了。

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第3张

媒体关注,舆论沸腾。那么,TPU究竟是何方神圣?

从名字就可以看出,TPU是GPU的近亲,专为AI设计。虽然TPU最近才受到关注,但这是一个从2015年就开始的老项目。

第一代TPU的模样

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第4张

第一代TPU

当时,谷歌正经历技术转型的阵痛,希望将传统的搜索算法全部替换为深度学习。然而,他们发现GPU不仅不够用,还极其耗电。

GPU的问题在于其过于全能。为了什么都能干,它不得不搞了一套复杂的架构。但在芯片的世界里,搬运数据的成本远高于计算本身。数据从显存跑到核心,电子要翻山越岭。

GPU工作方式

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第5张

GPU

因此,电费大半都花在了数据传输上。最后变成热量,还得拜托风扇吹一吹。在做图形渲染时还好,因为画面高度随机。但AI的矩阵运算每个数怎么算、和谁算、算几次都是固定的。

AI专属工具人TPU应运而生。它拆除了GPU那些用不上的模块,优化了AI最常用的矩阵乘法。

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第6张

GPU

就这样,TPU每个周期的计算操作次数达到了数十万量级,是GPU的近十倍。初代TPUv1能效比达到同时期NVIDIA Tesla K80的30倍。

虽然最初谷歌只是试探性地使用TPU进行推理,不会训练,功能单一。但从第二代起,谷歌开始提升内存容量和传输速度,让TPU能一边计算一边记录修改数据。至此,TPU点亮了训练技能树。

随着TPUv3规模增加,模型训练速度显著提升

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第7张

TPU

然而,尽管使用TPU进行训练和推理的成本更低且性能与GPU不相上下,为何巨头们仍要抢英伟达的芯片呢?

事实上,并非大家不心动,而是谷歌一直控制供应。所有TPU只租不卖,绑定在谷歌云里。大公司无法将TPU带回家,相当于把身家性命交给谷歌云。

即便如此,苹果也抵挡不住便宜又实惠的诱惑,多多少少租了一些。

这次热度高涨一方面是因为Gemini 3证明了TPU的成功;另一方面是因为第七代TPU Ironwood,谷歌终于舍得卖了。

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第8张

第七代TPU Ironwood

据The Information报道,Meta正在与谷歌洽谈数十亿美元的大合同,准备从2027年开始在机房部署TPU,还计划明年就从谷歌那租用TPU。

消息一出,谷歌股价立即上涨2.1%,英伟达下跌1.8%。

华尔街对TPU也是青睐有加,认为其前景光明。就连负责设计制造的博通也受益被上调了业绩预期。

但是要说TPU会取代GPU真不至于。

TPU是ASIC(Application-Specific Integrated Circuit),即专用集成电路。除了擅长AI的矩阵计算外,其他什么也不行。

这是它的优点也是它的痛点。

TPU工作方式

谷歌TPU崛起:挑战英伟达GPU的算力新纪元 谷歌 TPU 英伟达 算力 第9张

TPU

大模型当道时期对矩阵计算需求大增让TPU迅速崛起。但如果未来有更新的AI技术路线不再使用当前这一套那么TPU将失业。

而且因为过于专精一旦在计算上没有性能优势就彻底失去价值。

另外CUDA生态依然是英伟达最大的杀招。