自美国对AI芯片实施出口限制以来,国产自主AI芯片的研发被提升至前所未有的战略高度,特别是在大芯片领域。事实证明,技术封锁无法遏制中国半导体产业的创新步伐。当前,国内AI芯片赛道已清晰分化为两大阵营:GPU路线与非GPU路线。
近几个月,两大技术路线的AI芯片迭代速度显著加快,全面爆发已呈不可阻挡之势。
国产GPU领域近期热闹非凡。继12月11日北京摩尔线程登陆科创板之后,上海沐曦于12月17日紧随其后挂牌上市,成为国产GPU第二股。上市首日,摩尔线程股价飙升425.46%,沐曦更录得692.95%的惊人涨幅,市场情绪达到沸点。与此同时,上海GPU企业壁仞科技近期传出已通过港股IPO聆讯备案,有望摘得“港股国产GPU第一股”桂冠。
目前,国内GPU创业公司依创始团队背景可分为四股势力,业界也常以“中国英伟达”“中国AMD”来指代:
英伟达系:代表企业有摩尔线程、天数智芯,创始人与核心成员多出身英伟达,策略上优先兼容CUDA生态以快速切入市场,而后通过自研架构逐步迭代;
AMD系:代表企业有壁仞、沐曦,掌舵者及技术骨干多来自AMD,秉承差异化竞争思路,打法与AMD一脉相承;
国家队:如景嘉微,创始团队及核心人员来自国防科技大学,以军用图形显控为起点稳扎稳打,后切入信创市场并向AI计算拓展;海光、龙芯、兆芯等则致力于GPU与CPU的异构融合;
拆分系:商汤科技于2024年底拆分独立曦望Sunrise公司,近期完成近10亿元融资,主要围绕自身AI产品进行专用芯片开发。
国产GPU不完全盘点,制表丨EEWorld
资本市场高度关注企业估值是否存在“泡沫”,而产业界则更忧虑研发投入是否足以支撑技术攻坚。GPU研发壁垒极高,缺乏长期高强度的投入难以取得实质性突破。
摩尔线程作为“英伟达系”的标杆企业,其创始人张建中曾担任英伟达全球副总裁兼中国区总经理,联合创始人团队亦包含多位英伟达前高管。技术路线上,摩尔线程选择了较为激进的“全功能GPU”方向,基于自主MUSA统一架构,旨在单卡上同时实现AI训练与推理、图形渲染、视频处理等多场景融合。然而,快速发展背后是持续的投入与亏损。2022年至2024年间,公司净亏损分别为18.4亿元、16.73亿元和14.92亿元;扣非后净亏损分别为14.12亿元、16.9亿元和15亿元。同期研发投入保持高位,分别为11.16亿元、13.34亿元和13.59亿元,三年累计研发费用约38亿元。
沐曦科技则带有鲜明的“AMD基因”。创始人陈维良曾任AMD全球GPGPU设计总负责人,两位联合创始人兼首席技术官也曾是AMD首席科学家。沐曦以自研GPU IP为基石,构建了MXMACA软件栈,其架构高度兼容英伟达CUDA生态,旨在降低用户迁移成本。财务方面,沐曦在2022年至2024年间的净亏损分别为7.77亿元、8.71亿元和14亿元;扣非后净亏损分别为7.84亿元、8.9亿元和10.44亿元。研发投入持续增长,分别为6.478亿元、6.99亿元和9亿元,累计达22亿元。
壁仞科技由前商汤科技总裁张文于2019年创立,在国产GPU企业中较早实现Chiplet技术商用落地。公司采取渐进式发展路径,首先聚焦云端通用智能计算领域,逐步在AI训练与推理等关键场景中赶超现有方案,最终实现国产高端通用智能计算芯片的突破。研发成果方面,截至2025年9月30日,壁仞科技在全球累计公开专利1200余项,位居中国通用GPU公司首位;授权专利达550余项,稳居国内行业前列。
GPU发展道阻且长。除了芯片架构本身,GPU公司不仅需要直面CUDA生态的垄断挑战,还需在Chiplet、HBM、IP兼容性、Scale-Up/Scale-Out/Scale-Inside等方面构建自主生态。从国产GPU厂商的实践来看,普遍采取“先兼容、后赶超”的策略。
非GPU AI芯片领域同样百花齐放,各家企业依据自身理解选择了不同的技术路线。
华为在AI芯片领域的深耕已无需赘言。今年9月18日,华为罕见公开昇腾三年发展路线图。根据规划,2026年至2028年期间,华为将分阶段推出四款昇腾系列芯片,具体包括:2026Q1推出昇腾950PR,采用华为自研HBM;2026Q4推出昇腾950DT;2027Q4推出昇腾960芯片;2028Q4推出昇腾970。
2019年以来,华为已发布910B、910C等多款产品,其中昇腾910C算力高达800TFLOPS。以昇腾910为基础,华为今年5月推出了昇腾384超节点,将384张昇腾NPU与192张鲲鹏CPU高速互联。2026年即将发布的昇腾950PR/DT微架构将升级为SIMD/SIMT,算力达到1PFLOPS(FP8)/2PFLOPS(FP4),英伟达最新Blackwell B300同等标准下的算力约为3840TFLOPS。
一家北京的AI芯片公司正快速崛起,并已启动IPO筹备。12月2日,清微智能宣布完成超20亿元C轮融资。该公司目标直指打造国内“非GPU”新型架构芯片领域首个上市标杆。据悉,其核心团队来自清华大学以及海思、英伟达、苹果、AMD等知名企业,2025年算力卡订单累计超2万张,可重构芯片总出货量超3000万颗,形成从技术到市场的强力闭环。
清微智能采用可重构计算(CGRA)路线,该赛道国际玩家还包括SambaNova、Groq。可重构芯片被誉为芯片界“变形金刚”,能够根据AI计算任务动态、实时地重组硬件资源,在芯片内部构建直达目标的“最优计算通路”。该架构在GPU的通用性与ASIC的极致高效之间找到了平衡点,为中国复杂多元的智能计算需求提供了独创解决方案,整体成本降低50%,能效比提升3倍。
12月15日,据腾讯科技独家消息,昆仑芯即将完成股份制改造,并加速推动上市进程。在此次股改前,昆仑芯与多家券商沟通后已决定转战港股市场。作为其大股东,百度随后发布公告称,正在就建议中的分拆及上市事宜进行评估。百度同时指出,若推进分拆与上市,须履行相关监管审批程序,且不保证相关计划最终必定落实。
今年11月的百度世界大会上,昆仑芯多款新品亮相,其中包括计划于2026年上市的M100芯片、计划于2027年上市的M300芯片。腾讯科技报道还提到,昆仑芯2025年营收远超2024年的20亿元,一位接近昆仑芯的知情人士透露“体量排在国产前三应该不是问题”。
燧原科技曾与摩尔线程、沐曦、壁仞并称“国产GPU四小龙”,不过燧原的AI加速卡架构复杂,单纯以GPU概括并不确切。今年11月,燧原科技再次向上海证监局办理辅导备案登记,辅导机构变更为中信证券,此举标志着燧原科技继续坚定推进科创板上市进程。
今年的世界人工智能大会上,燧原发布最新一代训推一体产品“燧原L600”及云燧OGX系列。这款历时两年半研发的燧原L600,面向训练及推理场景,国内首创原生FP8低精度算力,拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽,性能卓越。
TPU亦是国产AI芯片的重要路径。TPU全称Tensor Processing Unit,是专为张量运算设计的ASIC芯片,由谷歌于2016年推出首款产品。在深度学习领域,张量(多维数组)无处不在,TPU正是为高效处理这些张量运算而生。TPU内置大量矩阵运算单元,能够并行处理海量矩阵运算,大幅提升计算效率。相较于GPU或GPGPU,TPU专用性更强,但在AI训练任务上绰绰有余。简单对比:TPU与同期CPU、GPU相比,可提供15~30倍的性能提升,以及30~80倍的能效比(性能/瓦特)提升。
中昊芯英是国内唯一全自研、已量产TPU芯片的公司。其产品性能极高,以中昊芯英历时近五年全自研的国内首枚已量产TPU AI芯片“刹那”为例,在处理大规模AI模型运算时,与海外知名GPU芯片相比,计算性能可超越近1.5倍,完成相同计算任务量时能耗降低30%,综合价格、算力与能耗,“刹那”的单位算力成本仅为后者的42%。
国产非GPU AI芯片不完全盘点,制表丨EEWorld
当前,国产AI芯片正沿着两条迥异但并行不悖的路径演进:一条是在GPU主战场与巨头正面竞逐,从兼容生态起步,逐步构建自主硬件体系与软件栈;另一条则是另辟蹊径,在可重构计算、TPU、ASIC、专用加速器等新兴架构上大胆探索,以差异化优势开辟新赛道。
可以说,国内已在多种形态的AI芯片上全面布局,国产算力日益强大。与此同时,产业链上下游的制造能力建设也在同步加强。
如今的英伟达可谓四面楚歌,谁都渴望取而代之。尽管特供版GPU重新恢复供应,但国内市场似乎已不再买账,这或许正是国产AI芯片加速崛起的绝佳时机。
本文由主机测评网于2026-02-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224752.html