当前位置:首页 > 科技资讯 > 正文

谷歌TorchTPU计划:联手Meta挑战英伟达垄断

谷歌正加速推进一项名为「TorchTPU」的战略计划,旨在让全球主流的AI框架PyTorch在其TPU芯片上流畅运行,从而撼动英伟达在AI算力市场的统治地位。这一行动不仅是技术上的革新,更是一场商业上的战略布局。作为PyTorch的重要支持者,Meta也深度参与其中,两大巨头联手,试图打破英伟达的垄断格局。

谷歌正通过「TorchTPU」计划,挑战英伟达在AI算力市场的长期统治地位。

谷歌TorchTPU计划:联手Meta挑战英伟达垄断 TorchTPU 谷歌 Meta 英伟达 第1张

据知情人士透露,该计划的核心在于让谷歌自研的AI芯片(TPU)能够更顺畅地支持PyTorch,从而吸引更多开发者。

这是谷歌战略版图中的关键一环,他们希望TPU能成为英伟达GPU的有力竞争对手。

随着谷歌迫切需要向投资者展示其AI投资的回报,TPU的销售已成为推动谷歌云营收增长的重要动力。

然而,仅有硬件还远远不够。

知情人士指出,「TorchTPU」计划旨在消除TPU普及的障碍,让习惯于PyTorch环境的客户能够无缝迁移到谷歌的硬件平台上。

甚至有传言称,为了加速这一进程,谷歌正在考虑将部分软件开源。

与以往对PyTorch的有限支持相比,这次谷歌投入了大量资源和战略关注。

这一转变背后,是众多企业渴望采用TPU的呼声。对他们而言,芯片虽好,但软件栈却成了瓶颈。

在硅谷,PyTorch已成为AI开发者的通用语言,而Meta则是其最大的支持者。

在这个行业里,很少有开发者会为不同厂商的芯片逐行编写底层代码,他们依赖的是像PyTorch这样的工具库来简化开发任务。

自2016年发布以来,PyTorch的成长史几乎就是与英伟达CUDA生态的绑定史。

华尔街分析师普遍认为,CUDA是英伟达抵御竞争对手的最坚固盾牌。

多年来,英伟达的工程师们不仅制造芯片,还致力于确保PyTorch模型在其硬件上高效运行。

相比之下,谷歌选择了不同的道路。

他们拥有庞大的内部软件团队,使用名为Jax的代码框架,并通过XLA工具优化TPU的运行效率。

谷歌的AI软件栈和性能优化大多围绕Jax构建,这种封闭的做法使得谷歌芯片与外部客户的使用习惯存在差距。

面对路透社的询问,谷歌云发言人虽未透露项目细节,但确认了这一战略方向。

他强调,无论是TPU还是GPU基础设施,需求都在快速增长,谷歌致力于提供足够的灵活性和规模,以满足开发者在不同硬件上构建应用的需求。

从自用到外售:TPU角色的演变

曾经,谷歌将大部分TPU产能视为内部资源,仅供内部使用。

这一局面在2022年发生变化,谷歌云部门成功争取到TPU的销售主导权。

此后,谷歌云大幅增加了对外分配的TPU额度,试图在客户对AI兴趣高涨的当下,通过扩大产能和销售来抢占市场。

然而,供需之间存在不匹配。

全球大多数AI开发者使用PyTorch,而谷歌芯片最擅长的是Jax。

这意味着,想要使用谷歌芯片并获得与英伟达相当的性能,开发者需要进行大量额外的工程适配工作。

在分秒必争的AI竞赛中,这种时间和成本的消耗是企业难以承受的。

如果「TorchTPU」计划成功,它将显著降低企业寻找英伟达GPU替代方案时的转换成本。

英伟达难以被撼动的原因不仅在于硬件性能,更在于CUDA生态已经深深嵌入PyTorch,成为训练和运行大模型的默认选择。

盟友Meta:敌人的敌人就是朋友

为了加速开发进程,谷歌找到了关键盟友——PyTorch的创造者Meta。

据知情人士透露,这两大科技巨头正在商讨协议,以让Meta获得更多TPU的使用权。此前,《The Information》也曾报道过这一动向。

在早期合作中,谷歌主要通过托管服务的形式向Meta提供支持。

Meta使用谷歌设计的芯片运行谷歌的软件和模型,并由谷歌提供运营维护服务。

对Meta而言,推动软件适配TPU具有极高的战略价值。这不仅有助于降低推理成本,还能通过硬件基础设施的多元化减少对英伟达的依赖,从而在谈判桌上获得更多筹码。

谷歌TorchTPU计划:联手Meta挑战英伟达垄断 TorchTPU 谷歌 Meta 英伟达 第2张