当前位置：首页 > 科技资讯 > 正文

国产AI芯片双线突围：GPU派与非GPU派齐头并进

主机测评网
科技资讯
2026-03-07
692

自美国对AI芯片实施禁令以来，国内对于自主AI芯片的研发关注度持续升温，特别是在高性能大芯片领域。事实证明，外部封锁并未能阻碍中国芯片产业的崛起。目前，国内AI芯片赛道已形成两大技术路线：GPU派和非GPU派，各自展现出强劲的发展势头。

近几个月来，两大派别的AI芯片技术突破与产业化进程均呈现出惊人的速度，一场国产AI芯片的爆发已势不可挡。

GPU派：上市潮起，生态渐成

国产GPU领域近期热闹非凡，资本市场捷报频传。继12月11日北京摩尔线程成功登陆科创板后，上海沐曦于12月17日紧随其后挂牌上市，成为国产GPU第二股。摩尔线程上市首日涨幅高达425.46%，而沐曦更是录得692.95%的单日涨幅，市场热情可见一斑。此外，上海GPU公司壁仞科技也传出好消息，其港股IPO已通过备案，即将成为“港股国产GPU第一股”。

当前，国内GPU企业根据创始团队背景可划分为四大流派，业界也常以“中国英伟达”“中国AMD”来形象地称呼它们：

NVIDIA系：以摩尔线程、天数智芯为代表，创始团队多出身于英伟达，策略上优先兼容CUDA生态以快速切入市场，随后通过自研架构实现技术迭代；

AMD系：壁仞、沐曦等企业创始团队具备AMD基因，借鉴AMD差异化竞争思路，在架构和生态上寻求突破；

国家队：如景嘉微，创始团队来自国防科技大学，从军用图形显控起步，稳扎稳打进入信创市场，并逐步向AI计算领域拓展；海光、龙芯、兆芯等则致力于GPU与CPU的协同设计；

拆分系：商汤科技于2024年底拆分独立出曦望Sunrise公司，已完成近10亿元融资，专注于围绕自身AI产品开发定制化芯片。

国产AI芯片双线突围：GPU派与非GPU派齐头并进国产AI芯片 GPU 非GPU架构自主创新第1张

国产GPU不完全盘点，制表丨EEWorld

资本市场关注估值是否存在泡沫，而芯片从业者则更关心研发投入是否足以支撑技术突破。GPU研发难度极高，没有持续且充足的投入难以实现突破。

摩尔线程堪称“英伟达系”的典型代表。创始人张建中曾任英伟达全球副总裁兼中国区总经理，联合团队中亦有多位英伟达前高管。技术路线上，摩尔线程选择了“全功能GPU”这一激进方向，基于自研MUSA统一架构，致力于在同一张显卡上融合AI训练与推理、图形渲染、视频处理等多重能力。然而，高速发展伴随着持续的投入与亏损。2022年至2024年，公司净亏损分别为18.4亿元、16.73亿元和14.92亿元；扣非后净亏损分别为14.12亿元、16.9亿元和15亿元。同期研发投入保持高位，分别为11.16亿元、13.34亿元和13.59亿元，三年累计研发费用约38亿元。

沐曦科技则带有鲜明的“AMD基因”。创始人陈维良曾任AMD全球GPGPU设计总负责人，两位联合创始人兼首席技术官也出身AMD首席科学家。沐曦以自研GPU IP为核心，构建了MXMACA软件栈，其架构高度兼容英伟达CUDA生态，旨在降低用户迁移成本。财务方面，2022年至2024年，沐曦净亏损分别为7.77亿元、8.71亿元和14亿元；扣非后净亏损分别为7.84亿元、8.9亿元和10.44亿元。研发投入同样持续增长，分别为6.478亿元、6.99亿元和9亿元，累计约22亿元。

壁仞科技由前商汤科技总裁张文于2019年创立，是国产GPU中最早实现Chiplet技术商用落地的企业之一。公司采取渐进式发展路径，首先聚焦云端通用智能计算，逐步在AI训练与推理等关键场景中追赶并超越现有解决方案，最终实现国产高端通用智能计算芯片的突破。研发成果方面，截至2025年9月30日，壁仞科技在全球累计公开专利1200余项，位居中国通用GPU公司首位；授权专利达550余项，稳居国内行业前列。

GPU之路道阻且长。除了芯片架构本身，国产GPU公司不仅要应对CUDA生态的垄断，还需围绕Chiplet、HBM、IP、兼容性以及Scale-Up/Scale-Out/Scale-Inside等层面构建自己的生态系统。从现有国产GPU公司的策略来看，普遍采取“先兼容再赶超”的路径，逐步积累技术实力。

非GPU派：势头迅猛，创新多元

非GPU AI芯片领域同样热闹非凡，各家企业依据自身技术积累选择不同的创新路线。

华为在AI芯片领域的深耕早已有目共睹。今年9月18日，华为罕见地公布了昇腾未来三年发展路线图。根据规划，2026年至2028年，华为将分阶段推出四款昇腾系列芯片：2026年Q1推出昇腾950PR（采用自研HBM），2026年Q4推出昇腾950DT，2027年Q4推出昇腾960，2028年Q4推出昇腾970。

自2019年以来，华为已发布910B、910C等多款产品，其中昇腾910C算力高达800TFLOPS。以昇腾910为基础，华为今年5月推出了昇腾384超节点，将384张昇腾NPU与192张鲲鹏CPU连接。即将于2026年发布的昇腾950PR/DT将微架构升级为SIMD/SIMT，算力达到1PFLOPS（FP8）/ 2PFLOPS（FP4），英伟达最新Blackwell B300在同等标准下的算力约为3840TFLOPS。

一家北京的AI芯片公司——清微智能正成为市场新秀，并积极筹备IPO。12月2日，清微智能宣布完成超20亿元C轮融资，目标是打造国内“非GPU”新型架构芯片领域首个上市标杆企业。该公司核心团队来自清华大学以及海思、英伟达、苹果、AMD等知名企业，2025年算力卡订单累计超2万张，可重构芯片总出货量超3000万颗，已形成从技术到市场的强力闭环。

清微智能采用可重构计算（CGRA）路线，国际上同路线的还有SambaNova、Groq。可重构芯片被誉为芯片界的“变形金刚”，能根据AI计算任务动态、实时重组硬件资源，在芯片内部构建直达目标的“最优计算通路”。该架构在GPU的通用性与ASIC的极致高效之间找到了平衡，为中国应对复杂多元的智能计算需求提供了独创解决方案，整体成本降低50%，能效比提升3倍。

12月15日，据腾讯科技独家消息，昆仑芯即将完成股份制改造，并加快推动上市进程。在此次股改前，昆仑芯已决定转战港股市场。大股东百度随后发布公告称，正在就建议分拆及上市事宜进行评估，并强调若推进分拆与上市，须履行相关监管审批程序，不保证最终落实。

今年11月的百度世界大会上，昆仑芯多款新品亮相，包括计划于2026年上市的M100芯片、2027年上市的M300芯片。腾讯科技报道还提到，昆仑芯2025年营收远超2024年的20亿元，一位接近昆仑芯的知情人士透露“体量排在国产前三应该不是问题”。

燧原科技曾被称为“国产GPU四小龙”（其他三只为摩尔线程、沐曦、壁仞），但燧原的AI加速卡架构复杂，单纯称为GPU并不确切。今年11月，燧原科技再次向上海证监局办理辅导备案登记，辅导机构变更为中信证券，继续坚定推进科创板上市进程。

在世界人工智能大会上，燧原发布了最新一代训推一体产品“燧原L600”及云燧OGX系列。这款历时两年半研发的产品面向训练及推理场景，国内首创原生FP8低精度算力，拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽，性能卓越。

TPU也是国产AI芯片的一条重要路线。TPU（Tensor Processing Unit）是专为张量运算设计的ASIC芯片，由谷歌于2016年推出。TPU内置大量矩阵运算单元，能并行处理海量矩阵运算，大幅提高计算效率。与GPU相比，TPU更专用，但在AI训练场景下表现优异。简单对比：TPU与同期CPU和GPU相比，可提供15～30倍的性能提升，以及30～80倍的效率（性能/瓦特）提升。

中昊芯英是国内唯一全自研、已量产TPU芯片的公司。其产品性能极高，以历时近五年全自研的国内首枚已量产TPU AI芯片“刹那”为例，在处理大规模AI模型运算时，与海外知名GPU相比，计算性能可超越近1.5倍，相同任务量能耗降低30%，综合价格、算力和能耗，“刹那”的单位算力成本仅为后者的42%。

国产AI芯片双线突围：GPU派与非GPU派齐头并进国产AI芯片 GPU 非GPU架构自主创新第2张