近期,OpenAI再度传出大动作,其芯片采购名录上出现了一个令人意外的名字,而非大家熟知的英伟达或谷歌。
据业界消息,这笔规模宏大的订单已授予晶圆级芯片先锋Cerebras。双方达成的协议总金额突破100亿美元,旨在锁定最高约750兆瓦的算力容量,并计划在2026至2028年间分步实施落地。
众所周知,OpenAI的成长史深度依赖英伟达的GPU集群。然而,随着AI竞赛进入深水区,OpenAI正加速推进“算力多元化”战略,拒绝将所有筹码押注在单一供应商身上。
早在去年6月,便有消息称OpenAI尝试通过Google Cloud租赁芯片,以此支撑ChatGPT等产品的推理算力需求。
这种算力策略演变的背后,折射出美国AI产业界两大生态阵营的博弈:一方是以英伟达为核心、CUDA生态为护城河的传统GPU势力;另一方则是以谷歌自研TPU为代表、深度整合云服务的专用加速器阵营。
在大模型竞赛的起步阶段,英伟达凭借软硬一体的绝对优势成为行业唯一的灯塔。无论是训练还是推理,CUDA生态几乎是开发者的必选项。
但在过去两年,这种“单极格局”正逐渐瓦解。一方面,GPU供应紧张与成本激增令企业不堪重负;另一方面,大规模推理负载的爆发,迫使行业寻找更高能效比的替代架构。
在此背景下,谷歌的TPU生态脱颖而出。通过将底层芯片与Gemini模型、Vertex AI平台深度绑定,谷歌构建起了一套“从硬件到模型再到服务”的全栈自研体系。
而此次选中的Cerebras,则是OpenAI在传统双雄之外布下的一枚奇兵。Cerebras凭借其独特的晶圆级芯片技术,在低延迟推理和超大规模吞吐上展现出显著优势,被视为美股市场极具潜力的IPO明星。
在英伟达与谷歌的“双雄对峙”中,顶尖AI厂商正在“灵活站队”与“跨界协作”之间寻找精妙的平衡。
即便算力格局出现分化,英伟达的市场统治力依然难以撼动。IDC数据显示,截至2025年第二季度,英伟达在AI算力市场的份额依然维持在85.2%的高位。
但在瞬息万变的AI战场,盟友与对手的身份往往交织在一起。通过观察巨头的算力偏好,我们可以发现微妙的生态裂痕。
在英伟达的坚定阵营中,微软与亚马逊(AWS)始终将其最新硬件作为云端基石;与此同时,谷歌正致力于提升TPU的通用性,通过优化对PyTorch等框架的支持,试图吸引更多Meta等外部开发者,打破生态闭环。
以微软为例,Omdia估算其在2024年采购了约48.5万块英伟达Hopper GPU,规模冠绝群雄,体现了双方极深的战略互信。
2025年11月,微软斥资约97亿美元与IREN签署合同,其中包括价值58亿美元的英伟达GB300系统,旨在继续加码Azure的算力霸权。
此外,马斯克的xAI同样是英伟达的大客户,其Colossus超算已部署20万块GPU,并计划在2025年进一步扩产。
尽管英伟达地位稳固,但其高昂的软硬件锁定成本,促使越来越多的头部玩家开启“B计划”。
谷歌TPU在特定场景下的成本优势及其与云端的无缝衔接,使其成为极具吸引力的备选项。近期有消息称,Meta正评估在2027年后引入谷歌芯片的可能性,合作规模可能高达数十亿美元。
Anthropic也做出了类似选择。去年10月,Anthropic宣布深化与Google Cloud的合作,计划调用百万颗TPU芯片来训练下一代Claude模型,预计今年上线的计算能力将突破1吉瓦。
Google Cloud CEO指出,Anthropic对TPU的重度使用,有力证明了该架构在性能功耗比上的卓越表现。
当然,这种合作带有深厚的资本色彩。谷歌作为Anthropic的重要股东,已累计投资超过30亿美元,持有约14%的股份。
通过这种绑定,Anthropic获得了稳定的低成本算力保障,而谷歌也借此稳固了其云基础设施的市场份额。
然而,这种“基建联盟”并不意味着业务上的停战。正如行业观察所言,如果Anthropic利用谷歌的算力练就了超越Gemini的模型,谷歌在应用层将面临“亲手扶植竞争对手”的尴尬。
这种复杂的博弈形成了AI界的“合纵连横”:在算力底座层,为了对抗英伟达,厂商选择“合纵”结盟以控制成本;在模型应用层,各方则通过“连横”在市场上短兵相接。
这场算力霸权之争,其根源可以追溯到生成式AI爆发前的十年。
2006年,英伟达推出CUDA架构,将GPU从单纯的图形卡转变为通用的并行计算平台。此后,全球开发者围绕CUDA建立了庞大的软件生态,使英伟达成为AI时代的绝对标准。
CUDA的护城河不仅在于硬件性能,更在于其不可替代的软件兼容性与开发者习惯。
英特尔前掌门人帕特·基辛格曾坦言,英伟达真正的壁垒在于CUDA及NVLink等互联体系,而非单一的芯片指标。
2012年AlexNet的成功,标志着大规模神经网络与GPU并行计算的结合正式开启了深度学习时代。
然而,随着模型规模的呈几何倍数增长,通用GPU的能耗与成本弊端开始显现。谷歌敏锐地意识到,搜索、翻译等核心业务需要更高效的专用芯片。
2015年,谷歌秘密研发的TPU问世。起初,它仅服务于内部推理任务,旨在以极低的功耗处理海量请求。
2018年,TPU正式入驻Google Cloud,向外界证明了专用加速器在缩短模型训练周期、降低云端成本方面的潜力。
但在2020至2022年的生成式AI初期,英伟达凭借A100等成熟产品的稳定供应,依然是模型厂商的首选。
转折点出现在2023年。随着大模型对电力与资金的消耗达到极限,TPU的高能效比优势开始被重新审视。
在能源紧缺的大背景下,AI巨头们甚至开始跨界投资核电。此时,TPU在节省每一度电、降低每一分成本上的优势,成为了其破局的关键。
为了打破软件壁垒,谷歌近年来全力投入生态建设。据传,代号为“TorchTPU”的项目正稳步推进,旨在让TPU原生支持PyTorch,抹平与英伟达在开发环境上的差距。
从宏观视角看,TPU生态的崛起有效稀释了市场对英伟达“一家独大”的担忧。美国监管机构对英伟达的反垄断调查呼声,也侧面反映了市场对算力多样化的渴求。
对于OpenAI而言,多路径布局不仅是出于成本考虑,更是应对潜在风险的战略选择。
在创业早期,OpenAI曾动用数万块英伟达GPU训练GPT-3,双方的关系可谓唇齿相依。
即便现在,OpenAI仍计划部署规模达10吉瓦的英伟达算力系统,由数百万块GPU组成,用于支撑下一代前沿模型的运行。
但在表面的盟友关系下,OpenAI正悄然推进“算力去中心化”。
去年6月,OpenAI试水Google Cloud TPU,这标志着其首次大规模引入非英伟达硬件。分析师指出,这反映了OpenAI在推理成本压力下,对专用加速方案的迫切需求。
随后,OpenAI又与AMD达成协议,计划部署最高6吉瓦的GPU资源。而在最新的2026年规划中,Cerebras的百亿订单则成为了其“韧性组合”战略的重要补丁。
Cerebras的独特之处在于其“晶圆级”架构。WSE-3芯片面积是传统GPU的数十倍,通过将数万亿晶体管集成在同一块硅片上,彻底消除了板级通信的延迟瓶颈。在OpenAI看来,这种架构是处理特定推理负载的理想武器。
值得玩味的是,奥特曼曾以个人身份投资Cerebras,这种深层的资本纽带也为双方的合作增添了更多想象空间。
除了引入外部盟友,OpenAI还迈出了最关键的一步:自研芯片。
据悉,OpenAI已组建内部团队并联手博通,旨在开发专为自身算法优化的AI加速器。奥特曼表示,将模型设计的经验直接注入硬件,将释放出前所未有的算力潜能。
在谷歌、英伟达与其他新兴供应商之间游走,OpenAI正以一种极具前瞻性的姿态重塑供应链。
苹果选择Gemini作为Apple Intelligence的底色,这无疑加剧了OpenAI的竞争焦虑。而在基础设施层,无论阵营如何划分,OpenAI的逻辑始终如一:在底层通过“合纵”构建最强算力群,在上层通过“独走”保持模型领先。
2026年,美国AI产业的“楚河汉界”将更加分明,而在这条分界线上,关于算力的“合纵连横”才刚刚拉开大幕。
本文由主机测评网于2026-04-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260433523.html