当前位置：首页 > 科技资讯 > 正文

国产AI芯片双线突围：GPU派上市潮起，非GPU架构创新迎来黄金时代

主机测评网
科技资讯
2026-02-11
428

自美国对AI芯片实施出口限制以来，国产自主AI芯片的研发被提升至前所未有的战略高度，特别是在大芯片领域。事实证明，技术封锁无法遏制中国半导体产业的创新步伐。当前，国内AI芯片赛道已清晰分化为两大阵营：GPU路线与非GPU路线。

近几个月，两大技术路线的AI芯片迭代速度显著加快，全面爆发已呈不可阻挡之势。

GPU派：IPO浪潮汹涌

国产GPU领域近期热闹非凡。继12月11日北京摩尔线程登陆科创板之后，上海沐曦于12月17日紧随其后挂牌上市，成为国产GPU第二股。上市首日，摩尔线程股价飙升425.46%，沐曦更录得692.95%的惊人涨幅，市场情绪达到沸点。与此同时，上海GPU企业壁仞科技近期传出已通过港股IPO聆讯备案，有望摘得“港股国产GPU第一股”桂冠。

目前，国内GPU创业公司依创始团队背景可分为四股势力，业界也常以“中国英伟达”“中国AMD”来指代：

英伟达系：代表企业有摩尔线程、天数智芯，创始人与核心成员多出身英伟达，策略上优先兼容CUDA生态以快速切入市场，而后通过自研架构逐步迭代；

AMD系：代表企业有壁仞、沐曦，掌舵者及技术骨干多来自AMD，秉承差异化竞争思路，打法与AMD一脉相承；

国家队：如景嘉微，创始团队及核心人员来自国防科技大学，以军用图形显控为起点稳扎稳打，后切入信创市场并向AI计算拓展；海光、龙芯、兆芯等则致力于GPU与CPU的异构融合；

拆分系：商汤科技于2024年底拆分独立曦望Sunrise公司，近期完成近10亿元融资，主要围绕自身AI产品进行专用芯片开发。

国产AI芯片双线突围：GPU派上市潮起，非GPU架构创新迎来黄金时代国产AI芯片 GPU 非GPU架构可重构计算第1张

国产GPU不完全盘点，制表丨EEWorld

资本市场高度关注企业估值是否存在“泡沫”，而产业界则更忧虑研发投入是否足以支撑技术攻坚。GPU研发壁垒极高，缺乏长期高强度的投入难以取得实质性突破。

摩尔线程作为“英伟达系”的标杆企业，其创始人张建中曾担任英伟达全球副总裁兼中国区总经理，联合创始人团队亦包含多位英伟达前高管。技术路线上，摩尔线程选择了较为激进的“全功能GPU”方向，基于自主MUSA统一架构，旨在单卡上同时实现AI训练与推理、图形渲染、视频处理等多场景融合。然而，快速发展背后是持续的投入与亏损。2022年至2024年间，公司净亏损分别为18.4亿元、16.73亿元和14.92亿元；扣非后净亏损分别为14.12亿元、16.9亿元和15亿元。同期研发投入保持高位，分别为11.16亿元、13.34亿元和13.59亿元，三年累计研发费用约38亿元。

沐曦科技则带有鲜明的“AMD基因”。创始人陈维良曾任AMD全球GPGPU设计总负责人，两位联合创始人兼首席技术官也曾是AMD首席科学家。沐曦以自研GPU IP为基石，构建了MXMACA软件栈，其架构高度兼容英伟达CUDA生态，旨在降低用户迁移成本。财务方面，沐曦在2022年至2024年间的净亏损分别为7.77亿元、8.71亿元和14亿元；扣非后净亏损分别为7.84亿元、8.9亿元和10.44亿元。研发投入持续增长，分别为6.478亿元、6.99亿元和9亿元，累计达22亿元。

壁仞科技由前商汤科技总裁张文于2019年创立，在国产GPU企业中较早实现Chiplet技术商用落地。公司采取渐进式发展路径，首先聚焦云端通用智能计算领域，逐步在AI训练与推理等关键场景中赶超现有方案，最终实现国产高端通用智能计算芯片的突破。研发成果方面，截至2025年9月30日，壁仞科技在全球累计公开专利1200余项，位居中国通用GPU公司首位；授权专利达550余项，稳居国内行业前列。

GPU发展道阻且长。除了芯片架构本身，GPU公司不仅需要直面CUDA生态的垄断挑战，还需在Chiplet、HBM、IP兼容性、Scale-Up/Scale-Out/Scale-Inside等方面构建自主生态。从国产GPU厂商的实践来看，普遍采取“先兼容、后赶超”的策略。

非GPU派：多元创新势头强劲

非GPU AI芯片领域同样百花齐放，各家企业依据自身理解选择了不同的技术路线。

华为在AI芯片领域的深耕已无需赘言。今年9月18日，华为罕见公开昇腾三年发展路线图。根据规划，2026年至2028年期间，华为将分阶段推出四款昇腾系列芯片，具体包括：2026Q1推出昇腾950PR，采用华为自研HBM；2026Q4推出昇腾950DT；2027Q4推出昇腾960芯片；2028Q4推出昇腾970。

2019年以来，华为已发布910B、910C等多款产品，其中昇腾910C算力高达800TFLOPS。以昇腾910为基础，华为今年5月推出了昇腾384超节点，将384张昇腾NPU与192张鲲鹏CPU高速互联。2026年即将发布的昇腾950PR/DT微架构将升级为SIMD/SIMT，算力达到1PFLOPS（FP8）/2PFLOPS（FP4），英伟达最新Blackwell B300同等标准下的算力约为3840TFLOPS。

一家北京的AI芯片公司正快速崛起，并已启动IPO筹备。12月2日，清微智能宣布完成超20亿元C轮融资。该公司目标直指打造国内“非GPU”新型架构芯片领域首个上市标杆。据悉，其核心团队来自清华大学以及海思、英伟达、苹果、AMD等知名企业，2025年算力卡订单累计超2万张，可重构芯片总出货量超3000万颗，形成从技术到市场的强力闭环。

清微智能采用可重构计算（CGRA）路线，该赛道国际玩家还包括SambaNova、Groq。可重构芯片被誉为芯片界“变形金刚”，能够根据AI计算任务动态、实时地重组硬件资源，在芯片内部构建直达目标的“最优计算通路”。该架构在GPU的通用性与ASIC的极致高效之间找到了平衡点，为中国复杂多元的智能计算需求提供了独创解决方案，整体成本降低50%，能效比提升3倍。

12月15日，据腾讯科技独家消息，昆仑芯即将完成股份制改造，并加速推动上市进程。在此次股改前，昆仑芯与多家券商沟通后已决定转战港股市场。作为其大股东，百度随后发布公告称，正在就建议中的分拆及上市事宜进行评估。百度同时指出，若推进分拆与上市，须履行相关监管审批程序，且不保证相关计划最终必定落实。

今年11月的百度世界大会上，昆仑芯多款新品亮相，其中包括计划于2026年上市的M100芯片、计划于2027年上市的M300芯片。腾讯科技报道还提到，昆仑芯2025年营收远超2024年的20亿元，一位接近昆仑芯的知情人士透露“体量排在国产前三应该不是问题”。

燧原科技曾与摩尔线程、沐曦、壁仞并称“国产GPU四小龙”，不过燧原的AI加速卡架构复杂，单纯以GPU概括并不确切。今年11月，燧原科技再次向上海证监局办理辅导备案登记，辅导机构变更为中信证券，此举标志着燧原科技继续坚定推进科创板上市进程。

今年的世界人工智能大会上，燧原发布最新一代训推一体产品“燧原L600”及云燧OGX系列。这款历时两年半研发的燧原L600，面向训练及推理场景，国内首创原生FP8低精度算力，拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽，性能卓越。

TPU亦是国产AI芯片的重要路径。TPU全称Tensor Processing Unit，是专为张量运算设计的ASIC芯片，由谷歌于2016年推出首款产品。在深度学习领域，张量（多维数组）无处不在，TPU正是为高效处理这些张量运算而生。TPU内置大量矩阵运算单元，能够并行处理海量矩阵运算，大幅提升计算效率。相较于GPU或GPGPU，TPU专用性更强，但在AI训练任务上绰绰有余。简单对比：TPU与同期CPU、GPU相比，可提供15～30倍的性能提升，以及30～80倍的能效比（性能/瓦特）提升。

中昊芯英是国内唯一全自研、已量产TPU芯片的公司。其产品性能极高，以中昊芯英历时近五年全自研的国内首枚已量产TPU AI芯片“刹那”为例，在处理大规模AI模型运算时，与海外知名GPU芯片相比，计算性能可超越近1.5倍，完成相同计算任务量时能耗降低30%，综合价格、算力与能耗，“刹那”的单位算力成本仅为后者的42%。

国产AI芯片双线突围：GPU派上市潮起，非GPU架构创新迎来黄金时代国产AI芯片 GPU 非GPU架构可重构计算第2张