据芯东西12月17日报道,上海GPU领军企业沐曦股份今日在科创板正式挂牌,开盘价报700.00元/股,午间休市涨幅高达687.79%,公司总市值飙升至3298.82亿元,标志着全球算力产业的竞争态势已迈入全新阶段。
近期,全球算力产业正处于一系列重大事件的密集爆发期。
在海外,非GPU赛道的谷歌TPU斩获千亿级订单,于GPU垄断的算力市场中开辟新径;上周博通CEO透露Anthropic向博通下达总值210亿美元(约合人民币1486亿元)的订单,同时Meta等科技巨头也表露采购意向。GPU方面,出于对中国市场的重视,美国已批准英伟达H200 AI芯片对华销售。
反观国内,算力产业热度同样持续高涨。北京AI芯片明星企业清微智能获得超20亿元大额融资,投资阵容在业界罕见。此外,国内AI芯片初创企业纷纷披露并购与上市计划,本土算力生态正加速成形。
上述海内外算力产业的密集动向,共同指向一个不可逆转的行业变革:长期由英伟达GPU垄断的全球算力市场格局正开始松动。
在大模型发展初期,市场对通用算力的强烈需求让英伟达GPU迅速占据主导地位,几乎形成“无GPU不训练”的行业常态。
如今,一方面谷歌TPU、亚马逊Trainium3等非GPU芯片在部分场景实现对GPU的规模化替代;国内市场2025年上半年非GPU算力卡占比已达30%,寒武纪MLU、昆仑芯ASIC、清微智能可重构芯片(RPU)等产品已形成差异化优势。
另一方面在投资市场,英特尔据传计划以16亿美元(约合人民币112.9亿元,含债务)收购非GPU路线AI芯片独角兽SambaNova,以挽救自身在AI时代的竞争力;非GPU路线独角兽Groq则在两年内获得超30亿美元(约合人民币213亿元)融资。
▲海外非GPU路线企业最新动向汇总
可见,非GPU芯片势力的崛起已势不可挡。
在此背景下,全球算力产业下一步将走向何方?非GPU路线能拓展多大市场空间?未来会百花齐放还是一支独大?非GPU赛道中哪条路线有望率先突围?我们试图通过剖析全球算力格局及国内几家头部企业的技术路径,探寻这些问题的答案。
从需求端、底层技术、全球算力生态构建的三个核心维度来看,全球算力产业格局变革具有紧迫性与必要性。
首先在需求端,今年被视为大模型落地元年,推理场景算力需求激增,单纯堆砌GPU的粗放模式已难以适应当前大模型规模化落地需求,这正倒逼企业寻求更高效的算力解决方案。
同时,AI深入千行百业催生了多元、细分的行业需求,如AI视频生成、AI医疗诊断、工业数字孪生等场景对算力能效比、适配性要求各异。叠加企业为分散供应链风险、规避单一厂商依赖,非GPU算力产品迎来了关键的市场切入机遇。
其次是技术端,传统冯·诺依曼架构的存算分离矛盾日益凸显,其设计逻辑已难以突破硬件性能的物理边界,亟需架构革新以突破瓶颈。
非GPU路线实现多点突破,如谷歌TPU专用架构、国产可重构芯片的动态适配能力等,已在特定场景下形成性能与成本优势。
最后是生态层面,打破单一架构生态垄断已成为行业共识,国产开源框架正通过兼容适配、自主优化,快速构建本土生态协同体系。
因此,全球算力产业正朝着打破单一架构、不同路径百花齐放的局面演进。
近日新华社报道提到:“在AI芯片领域,北京已形成自主可控的‘芯片矩阵’,昆仑芯、寒武纪、摩尔线程、清微智能……一系列国产明星产品性能领先。”
这其中既有GPU路线的摩尔线程,也有非GPU中ASIC路线的昆仑芯、寒武纪,以及非GPU中可重构计算的清微智能。四家企业分属不同技术路线的发展态势,恰恰印证了北京在AI芯片赛道多元布局、保障供应链安全的远见。
在这些显著行业趋势背后,我们还能捕捉到驱动行业发展的几大核心动向:
第一是GPU与非GPU两大技术路线正并行发展。GPU路线凭借成熟的生态兼容性和通用计算能力,在需要兼顾图形渲染、科学计算与AI训练的场景中持续发挥优势;非GPU路线,则随着大模型的快速演进,在AI推理领域率先展现出强劲增长潜力。
其中可重构架构凭借其通用计算能力,已在AI主流场景中占据重要地位。
第二,全球算力产业的重心不再唯硬件性能论,而是朝着软件、模型、场景适配等的全栈布局发展,通过协同创新充分释放算力资源,避免算力资源限制,并针对不同硬件架构对模型进行压缩、量化、适配。
这一趋势本质上旨在实现算力效能最大化。
第三是中国厂商的话语权正在提升。在算力领域长期由欧美厂商主导的市场格局下,中国企业在非GPU赛道展现出不容小觑的竞争力。
综上,全球算力产业的下一程必然走向路径分化。
全球知名市研机构Gartner预计,到2027年,针对AI推理应用的算力需求将导致AI加速器(通常指非GPU的AI专用芯片)的出货量超越GPU。
与此同时,在全球算力产业中,非GPU路线正快速成长为与GPU分庭抗礼的核心力量,算力市场双轨并行的格局初具雏形。
IDC发布的报告显示,今年上半年,中国非GPU芯片市场在加速计算领域增长显著。2025年上半年,中国非GPU服务器市场占比约为30%,预计到2028年市场占有率将接近50%。
AI在千行百业的加速渗透极大推动了这一趋势。
英伟达创始人、CEO黄仁勋曾在采访中透露,中国的AI应用发展速度极快,其社会接纳新技术的节奏非常迅速。这让他深感担忧,因为归根结底,这场工业革命的胜负将取决于AI应用层面的发展,取决于谁能成为技术普及的引领者。
相比于GPU,非GPU技术路线在成本、能效比、场景适配性上更契合当下AI主流应用场景。
其硬件采购与运维成本更低,更适配中小企业及大规模分布式部署需求;能通过定制化架构实现低功耗与高精度的平衡,达成更优能效比;适配自动驾驶、工业物联网等边缘端场景的算力需求;同时具备更强的实时性、稳定性与灵活性,匹配差异化AI任务。
尤其在智算中心、大模型部署、云计算、泛机器人、智能驾驶等主流AI应用场景中,非GPU路线具备适配特定负载的高能效比、更低的全生命周期成本、更强的国产供应链自主可控性,且能通过从0到1的定制化架构实现大模型推理高吞吐与低延迟,兼容多业务负载。
对于规模达千亿乃至万亿级的AI市场而言,非GPU方案必然占据一席之地。
不过,客观而言,非GPU发展尚未如GPU成熟,大部分非GPU芯片生态成熟度不足,缺乏完善的软件工具链、丰富的开源框架支持。再加上其发展处于早期,对企业的早期研发投入能力也是不小考验。
这也从侧面印证,GPU与非GPU两条技术路径各有优劣,并非简单的替代关系。
要探究当前国内非GPU赛道的发展格局,可以聚焦几家核心企业作为切入点。
北京AI产业具有代表性,2024年其AI核心产业规模已近3500亿元,占全国近一半,助攻这一产业发展的底层芯片玩家更为关键。
因此新华社报道提到的昆仑芯、寒武纪、摩尔线程、清微智能,这四家北京芯片代表企业,正是国内AI产业蓬勃发展的生动缩影,透过它们的发展轨迹,更能清晰窥见国内AI芯片产业格局的深刻变革。
▲北京四家芯片代表企业2025年上半年出货量位居国内前列
这四家企业中,摩尔线程为GPU阵营,其余三家均为非GPU阵营,其中寒武纪、昆仑芯主攻ASIC路线,清微智能以可重构架构实现通用计算为核心发力方向。
值得注意的是,这并不是当下非GPU赛道的全部路线,但这几家受到北京市认可的企业极具代表性,既展现出国产非GPU的布局脉络,也凸显了政府层面的有力支持。
鉴于GPU的技术优势已在业界广泛认知,我们主要拆解另外两条非GPU路线。
ASIC架构是一种为特定用途定制设计的集成电路,谷歌TPU即是ASIC芯片。ASIC最核心的优势在于性能、功耗,加上支持深度定制的特性,使其在AI应用浪潮中大展拳脚。
寒武纪的ASIC芯片采用自研架构,构建了覆盖云端、边缘端和终端的完整产品线。以其首款采用Chiplet技术的芯片思元370为例,该芯片最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。
昆仑芯基于其自研XPU架构,昆仑芯R200可提供高达256 TOPS(INT8)和128 TFLOPS FP16的算力,性能可达主流GPU的1.5倍。在实际部署中,其单机4卡R200方案可实现4800 tokens/s的推理吞吐量,满足千亿参数大模型的实时交互需求。
这些实例足以印证,AI领域中非GPU架构对GPU的规模化替代进程已全面开启。
不过ASIC的不足之处在于,因需定制化,其从需求定义到量产交付的每个环节都需投入大量时间与资源;不仅如此,ASIC架构一旦固化便难以调整,面对算法快速迭代的场景,往往需要重新流片,进一步拉高研发风险与周期成本。
相比之下,兼容GPU、ASIC路线优势的可重构计算路线发展势头更猛,核心在于它踩中了AI产业从算力集中到场景细分转型的行业趋势,能解决GPU通用但低效、ASIC高效但硬件固化的痛点,且通过底层架构创新实现了性能与性价比的平衡。相比行业同类型产品,可重构芯片实现成本整体降低50%、能效比提升3倍。截至今年12月,清微智能的可重构芯片累计出货量已超3000万颗,2025年其算力卡订单累计超3万张,在全国十余座千卡规模智算中心实现规模化落地。
▲清微智能AI算力芯片TX81
此外,可重构数据流技术路线还与AI计算需求天然适配。在实现芯片高效互联这一核心环节上,可重构数据流派自研的TSM-LINK算力网格技术,支持多芯片点对点直连,可实现数据的高效传输,从根源上规避传统交换机架构存在的带宽瓶颈与通信延迟问题。而GPU架构在适配晶圆级芯片集成时,只能依赖外部交换机完成互联,性能损耗与延迟问题难以避免。
在芯片设计层面,可重构数据流架构从底层架构设计阶段就具备三维扩展的天然优势,能够与晶圆级芯片技术、3.5D堆叠等先进立体封装技术深度结合,形成清晰且可持续的升级迭代路径。据悉,清微明年推出的下一代芯片将带来大幅度性能跃升,有望实现对国际主流前沿AI芯片的弯道超车。
▲GPU与非GPU技术路线基本性能对比
因此从本质上看,可重构计算路线并非对GPU、ASIC的简单替代,而是通过找到平衡点,取两者所长,契合了AI规模化落地的核心需求。
总体而言,当前AI算力领域格局已较为清晰:GPU凭借成熟生态与极致并行计算能力,在通用大模型训练、图形渲染等核心场景仍占据不可撼动的统治地位,但正面临功耗攀升、成本高的结构性挑战;而非GPU路线则凭借更高能效比、更低全生命周期成本及自主可控优势,在AI推理、专用算力需求等主流AI应用领域快速崛起,共同推动算力体系向多元化、异构融合方向演进。
以大模型、生成式AI为代表的新一轮AI浪潮催生了前所未有的AI算力需求,同时国产大模型企业强势突围,带动了国内AI算力需求的持续增长,中国AI算力产业迎来新的机遇与挑战。
当下,国产非GPU企业异军突起,正与国内大模型厂商形成合力,为国内AI算力产业注入新活力。目前来看,非GPU技术路线尽管相比GPU尚不成熟,但因其天然优势与AI应用落地相契合,正迸发出强大生命力。
本文由主机测评网于2026-02-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224442.html