自美国对AI芯片实施禁令以来,国内对于自主AI芯片的研发关注度持续升温,特别是在高性能大芯片领域。事实证明,外部封锁并未能阻碍中国芯片产业的崛起。目前,国内AI芯片赛道已形成两大技术路线:GPU派和非GPU派,各自展现出强劲的发展势头。
近几个月来,两大派别的AI芯片技术突破与产业化进程均呈现出惊人的速度,一场国产AI芯片的爆发已势不可挡。
国产GPU领域近期热闹非凡,资本市场捷报频传。继12月11日北京摩尔线程成功登陆科创板后,上海沐曦于12月17日紧随其后挂牌上市,成为国产GPU第二股。摩尔线程上市首日涨幅高达425.46%,而沐曦更是录得692.95%的单日涨幅,市场热情可见一斑。此外,上海GPU公司壁仞科技也传出好消息,其港股IPO已通过备案,即将成为“港股国产GPU第一股”。
当前,国内GPU企业根据创始团队背景可划分为四大流派,业界也常以“中国英伟达”“中国AMD”来形象地称呼它们:
NVIDIA系:以摩尔线程、天数智芯为代表,创始团队多出身于英伟达,策略上优先兼容CUDA生态以快速切入市场,随后通过自研架构实现技术迭代;
AMD系:壁仞、沐曦等企业创始团队具备AMD基因,借鉴AMD差异化竞争思路,在架构和生态上寻求突破;
国家队:如景嘉微,创始团队来自国防科技大学,从军用图形显控起步,稳扎稳打进入信创市场,并逐步向AI计算领域拓展;海光、龙芯、兆芯等则致力于GPU与CPU的协同设计;
拆分系:商汤科技于2024年底拆分独立出曦望Sunrise公司,已完成近10亿元融资,专注于围绕自身AI产品开发定制化芯片。
国产GPU不完全盘点,制表丨EEWorld
资本市场关注估值是否存在泡沫,而芯片从业者则更关心研发投入是否足以支撑技术突破。GPU研发难度极高,没有持续且充足的投入难以实现突破。
摩尔线程堪称“英伟达系”的典型代表。创始人张建中曾任英伟达全球副总裁兼中国区总经理,联合团队中亦有多位英伟达前高管。技术路线上,摩尔线程选择了“全功能GPU”这一激进方向,基于自研MUSA统一架构,致力于在同一张显卡上融合AI训练与推理、图形渲染、视频处理等多重能力。然而,高速发展伴随着持续的投入与亏损。2022年至2024年,公司净亏损分别为18.4亿元、16.73亿元和14.92亿元;扣非后净亏损分别为14.12亿元、16.9亿元和15亿元。同期研发投入保持高位,分别为11.16亿元、13.34亿元和13.59亿元,三年累计研发费用约38亿元。
沐曦科技则带有鲜明的“AMD基因”。创始人陈维良曾任AMD全球GPGPU设计总负责人,两位联合创始人兼首席技术官也出身AMD首席科学家。沐曦以自研GPU IP为核心,构建了MXMACA软件栈,其架构高度兼容英伟达CUDA生态,旨在降低用户迁移成本。财务方面,2022年至2024年,沐曦净亏损分别为7.77亿元、8.71亿元和14亿元;扣非后净亏损分别为7.84亿元、8.9亿元和10.44亿元。研发投入同样持续增长,分别为6.478亿元、6.99亿元和9亿元,累计约22亿元。
壁仞科技由前商汤科技总裁张文于2019年创立,是国产GPU中最早实现Chiplet技术商用落地的企业之一。公司采取渐进式发展路径,首先聚焦云端通用智能计算,逐步在AI训练与推理等关键场景中追赶并超越现有解决方案,最终实现国产高端通用智能计算芯片的突破。研发成果方面,截至2025年9月30日,壁仞科技在全球累计公开专利1200余项,位居中国通用GPU公司首位;授权专利达550余项,稳居国内行业前列。
GPU之路道阻且长。除了芯片架构本身,国产GPU公司不仅要应对CUDA生态的垄断,还需围绕Chiplet、HBM、IP、兼容性以及Scale-Up/Scale-Out/Scale-Inside等层面构建自己的生态系统。从现有国产GPU公司的策略来看,普遍采取“先兼容再赶超”的路径,逐步积累技术实力。
非GPU AI芯片领域同样热闹非凡,各家企业依据自身技术积累选择不同的创新路线。
华为在AI芯片领域的深耕早已有目共睹。今年9月18日,华为罕见地公布了昇腾未来三年发展路线图。根据规划,2026年至2028年,华为将分阶段推出四款昇腾系列芯片:2026年Q1推出昇腾950PR(采用自研HBM),2026年Q4推出昇腾950DT,2027年Q4推出昇腾960,2028年Q4推出昇腾970。
自2019年以来,华为已发布910B、910C等多款产品,其中昇腾910C算力高达800TFLOPS。以昇腾910为基础,华为今年5月推出了昇腾384超节点,将384张昇腾NPU与192张鲲鹏CPU连接。即将于2026年发布的昇腾950PR/DT将微架构升级为SIMD/SIMT,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),英伟达最新Blackwell B300在同等标准下的算力约为3840TFLOPS。
一家北京的AI芯片公司——清微智能正成为市场新秀,并积极筹备IPO。12月2日,清微智能宣布完成超20亿元C轮融资,目标是打造国内“非GPU”新型架构芯片领域首个上市标杆企业。该公司核心团队来自清华大学以及海思、英伟达、苹果、AMD等知名企业,2025年算力卡订单累计超2万张,可重构芯片总出货量超3000万颗,已形成从技术到市场的强力闭环。
清微智能采用可重构计算(CGRA)路线,国际上同路线的还有SambaNova、Groq。可重构芯片被誉为芯片界的“变形金刚”,能根据AI计算任务动态、实时重组硬件资源,在芯片内部构建直达目标的“最优计算通路”。该架构在GPU的通用性与ASIC的极致高效之间找到了平衡,为中国应对复杂多元的智能计算需求提供了独创解决方案,整体成本降低50%,能效比提升3倍。
12月15日,据腾讯科技独家消息,昆仑芯即将完成股份制改造,并加快推动上市进程。在此次股改前,昆仑芯已决定转战港股市场。大股东百度随后发布公告称,正在就建议分拆及上市事宜进行评估,并强调若推进分拆与上市,须履行相关监管审批程序,不保证最终落实。
今年11月的百度世界大会上,昆仑芯多款新品亮相,包括计划于2026年上市的M100芯片、2027年上市的M300芯片。腾讯科技报道还提到,昆仑芯2025年营收远超2024年的20亿元,一位接近昆仑芯的知情人士透露“体量排在国产前三应该不是问题”。
燧原科技曾被称为“国产GPU四小龙”(其他三只为摩尔线程、沐曦、壁仞),但燧原的AI加速卡架构复杂,单纯称为GPU并不确切。今年11月,燧原科技再次向上海证监局办理辅导备案登记,辅导机构变更为中信证券,继续坚定推进科创板上市进程。
在世界人工智能大会上,燧原发布了最新一代训推一体产品“燧原L600”及云燧OGX系列。这款历时两年半研发的产品面向训练及推理场景,国内首创原生FP8低精度算力,拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽,性能卓越。
TPU也是国产AI芯片的一条重要路线。TPU(Tensor Processing Unit)是专为张量运算设计的ASIC芯片,由谷歌于2016年推出。TPU内置大量矩阵运算单元,能并行处理海量矩阵运算,大幅提高计算效率。与GPU相比,TPU更专用,但在AI训练场景下表现优异。简单对比:TPU与同期CPU和GPU相比,可提供15~30倍的性能提升,以及30~80倍的效率(性能/瓦特)提升。
中昊芯英是国内唯一全自研、已量产TPU芯片的公司。其产品性能极高,以历时近五年全自研的国内首枚已量产TPU AI芯片“刹那”为例,在处理大规模AI模型运算时,与海外知名GPU相比,计算性能可超越近1.5倍,相同任务量能耗降低30%,综合价格、算力和能耗,“刹那”的单位算力成本仅为后者的42%。
国产非GPU AI芯片不完全盘点,制表丨EEWorld
当前,国产AI芯片正沿着两条不同的路线加速演进:一条是直面挑战,在GPU战场上与巨头竞逐,从兼容到创新,逐步构建自主硬件体系与软件生态;另一条则是开拓创新之路,在可重构计算、TPU、ASIC、专用加速器等新兴架构上大胆探索,以差异化优势开辟全新赛道。
可以说,国内已在各种形态的AI芯片上全面布局,芯片算力日益强大。与此同时,国内也在加强制造能力的建设,为产业链自主可控提供支撑。
如今的英伟达四面楚歌,谁都渴望取而代之。尽管特供版GPU可以重新供应,但国内市场似乎不再买账,这或许正是国产AI芯片快速崛起的契机。
本文由主机测评网于2026-03-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260329342.html