8月27日,上海人工智能芯片及图形处理器领域的核心企业沐曦股份,正式对外公布了其针对科创板首次公开募股首轮审核问询函的详细回复内容。
这份回复文件提供了大量详尽的数据与洞察,不仅揭示了国产人工智能计算芯片最新的市场规模、行业竞争态势及各厂商市场占有率,还深入剖析了当前国产图形处理器在商业化推进过程中面临的四大核心难点。文件更将其与国际及国内主要竞争对手在产品布局、技术路径及财务表现上进行了清晰的横向对比。
在回复中,沐曦坦诚地披露了自身产品在计算能力、互联通信、软件生态以及商业化进程方面与行业领先者的差距,并承认在开拓互联网企业客户方面,其进度相较于部分国内同行业公司有所滞后。
沐曦明确列出了其在国内人工智能计算加速市场的主要竞争方阵,包括国际巨头英伟达与AMD,国内已上市公司寒武纪和海光信息,以及未上市的国内强劲选手如华为海思、昆仑芯、天数智芯、壁仞科技、燧原科技、摩尔线程等。
根据弗若斯特沙利文的预测,中国人工智能计算加速芯片市场的规模将在本年度达到约2398亿元,并预计到2029年将攀升至1.34万亿元。
另据国际数据公司统计,在2024年中国数据中心加速芯片市场,图形处理器出货量超过10000张的公司包括英伟达、沐曦股份、天数智芯。
伯恩斯坦研究预测,到2027年,中国本土人工智能芯片供应商的市场份额有望提升至55%。
文件信息显示,沐曦股份成立于2020年9月,其最近一次通过外部股权融资所对应的投后估值已达210.71亿元。在申报科创板前的12个月内,共有82名新增股东通过突击入股方式进入,经股权穿透后合计股东人数达到180名。
目前,沐曦拥有三条主要产品线:专注于人工智能训练及通用计算的曦云C系列,是其当前销售主力;专攻人工智能推理的曦思N系列;以及主要应用于图形渲染、尚处于研发阶段的曦彩G系列。
该公司目前仍处于持续投入期,2024年度净亏损超过14亿元,但预计最早可在2026年实现扭亏为盈。
截至今年8月15日,沐曦持有的在手订单金额(不含税)达11.40亿元。其直接客户涵盖了新华三、瑞芯智能、算丰、汇天网络等企业。
此外,沐曦还公布了其下一代芯片产品的最新研发进展与未来规划。
其曦云C500系列产品的综合性能瞄准英伟达A100作为对标目标,而后续规划的C600及C700系列将采用国内先进的芯片制造工艺。
曦云C600系列将支持FP8数据精度,预计于今年年底进入风险试产阶段。曦云C700系列则将进一步支持FP4精度,该产品于今年4月正式立项,性能定位直接对标英伟达H100。
本次首次公开募股,沐曦计划募集资金39亿元,各募投项目测算的内部收益率情况如下图所示:
其中,曦云C600系列研发项目的总投资额为13.70亿元,拟使用募集资金投入8.41亿元;曦云C700系列研发项目总投资20.40亿元,拟使用募集资金16.18亿元;新一代AI推理GPU研发及产业化项目旨在研发基于先进封装技术的云端大模型推理芯片Nx,总投资5.78亿元,拟使用募集资金4.53亿元。
根据伯恩斯坦研究的数据,以销售金额为统计口径,2024年中国人工智能计算加速器市场中,英伟达的市场占有率约为66%,华为海思约占23%,AMD约占5%,而寒武纪、摩尔线程、沐曦股份各自约占1%。
英伟达凭借其在硬件架构设计、单卡运算能力、芯片互连拓扑、软件生态系统以及大规模计算集群建设等方面建立的显著领先优势,持续引领市场。AMD也紧随其后,不断进行产品迭代与性能优化。
在国内人工智能训练市场,沐曦股份面临的主要竞争者包括英伟达、AMD、华为海思、寒武纪、海光信息、昆仑芯、平头哥、天数智芯、摩尔线程、壁仞科技等。
当前市场主流的计算架构以及各类图形处理器产品的基本情况如下表所示:
采用通用型架构的图形处理器是目前人工智能芯片的主流计算架构。
国际数据公司的数据显示,在2024年中国加速服务器市场中,搭载GPU的服务器占据主导地位,市场份额约为70%。
弗若斯特沙利文的数据表明,2024年,采用GPU架构的人工智能芯片在中国AI芯片市场中占据约69.9%的份额,其他架构的AI芯片(主要包括ASIC及FPGA)约占30.1%。预计到2029年,GPU的市场份额将进一步上升至77.3%。
据此测算,2024年中国AI芯片市场中,GPU相关的市场规模约为1000亿元,而以ASIC/DSA为代表的其他AI芯片市场规模约为425亿元。
沐曦股份、海光信息、天数智芯、壁仞科技、摩尔线程等国内企业紧跟国际龙头的技术发展路线,选择GPU架构积极参与市场竞争,逐步提升国产GPU在整体市场中的渗透率。
其他采用专用型架构(ASIC/DSA)芯片的竞争格局,相对于GPU架构而言更为分散。不同厂商从不同的细分应用领域切入市场,形成差异化竞争态势。主要参与者包括华为海思、寒武纪,以及一些拥有特定应用需求的科技巨头所孵化或投资的相关生态链企业,例如昆仑芯、平头哥、燧原科技等。
根据弗若斯特沙利文的数据,中国人工智能智算GPU市场规模从2020年的142.86亿元迅速增长至2024年的996.72亿元,年均复合增长率高达62.5%。预计到2029年,这一市场规模将攀升至10,333.40亿元。
根据国际数据公司的统计,在2024年中国数据中心加速芯片市场,图形处理器出货量(不含ASIC芯片公司)超过10000张的企业包括英伟达、沐曦股份、天数智芯。
此外,海光信息、壁仞科技等公司也在人工智能计算GPU市场有所布局。
受限于半导体制造工艺水平,国内计算芯片行业的主流算力性能目前大致处于英伟达A100产品的阶段,仅有少数厂商通过采用先进封装技术(例如双芯粒封装)等方式,能够实现接近英伟达H100产品的算力水平,这代表了国内厂商当前的最先进水平。
以行业内通常用于衡量GPU芯片在AI训练场景下算力性能的指标FP16/BF16为例,沐曦的曦云C500/C550芯片处于英伟达A100的算力区间,领先于国内大部分厂商;而曦云C588芯片在C550的基础上实现了算力的显著跃升,大幅缩小了与英伟达H100的差距,在国内处于先进水平。
根据国际数据公司的分析,在训练型AI服务器中,GPU的价值占比可达73%,而在推理型AI服务器中,GPU的价值占比约为25%。预计未来五年内,国内训练算力和推理算力的年复合增长率将分别达到50%和190%。
图形渲染GPU市场的主要参与者包括海外巨头英伟达、AMD,国内供应商则主要有景嘉微、摩尔线程、格兰菲智能科技股份有限公司、瀚博半导体(上海)股份有限公司等。
沐曦正在研发的图形渲染产品主要为应用于云端渲染场景的高性能图形GPU。
近年来,受美国对高性能计算芯片出口管制以及国内政策推动等多重因素影响,英伟达在中国市场的份额呈现出明显的下降趋势。
从2021年至2024年,英伟达总收入中来源于中国市场的比例已从26.42%下降至13.11%。
英伟达H20系列产品是在2023年10月美国工业和安全局出台限制对华出口芯片规格参数的政策后,专为中国市场设计推出的特供版GPU产品,其关键性能参数如下表所示:
H20系列产品曾在今年4月15日被美国政府对华禁售,后已重新获得出口许可证,将恢复向中国市场的销售。此外,英伟达还计划推出面向中国市场的新型GPU产品。
根据回复文件的阐述,这些变化预计不会对沐曦股份的业绩表现和市场拓展产生重大不利影响,主要原因可归结为以下四点:
沐曦的主要客户群体与境外龙头企业的客户存在较大差异,不构成直接竞争关系;
沐曦的产品性能在客观上已具备替代英伟达H20的能力;
国内市场对高性能算力芯片存在巨大的需求缺口;
基于对供应链稳定性、产品安全性的迫切需求而催生的国产替代趋势下,以沐曦为代表的高性能GPU供应商将迎来宝贵的黄金发展机遇。
伯恩斯坦研究的调研结果显示,2024年H20在中国市场的主要客户为互联网厂商,字节跳动、腾讯、阿里巴巴、百度四家的H20采购量合计占据了87%的份额。
沐曦当前的主力产品是应用于AI训练(训推一体)场景的曦云C系列GPU。该系列产品的下游客户主要以国家人工智能公共算力平台、运营商智算平台、商业化智算中心以及教科研、金融等行业客户为主,与英伟达H20的主要目标销售市场并不重合,未形成直接竞争。
沐曦通过综合对比多个维度的性能参数,认为其自有GPU产品在客观上已具备替代英伟达H20的能力。
1、单卡算力、显存容量超越H20
曦云C500系列、曦云C600系列产品的单卡算力已超过H20。曦云C600系列产品配备了支持FP8精度的计算单元,可支持多精度混合计算,同时搭载了大容量显存,容量超过了H20的96GB版本。此外,基于其自研的MetaXLink高速互连技术,芯片间的互连带宽达到了与英伟达采用4纳米制程工艺产品相当的性能水平。
2、境外GPU龙头无法满足中国AI芯片的巨大需求缺口
根据英伟达2026财年第一季度财报(截至2025年4月),英伟达为H20的库存计提了约45亿美元的减值准备,折合数量约为30-40万张GPU板卡。
根据国际数据公司的数据,2024年中国加速芯片市场出货量超过270万张。即便剔除H20库存消耗的部分,中国市场依然存在着巨大的需求缺口。
3、美国政府政策不确定性下,国产替代已成行业共识
伯恩斯坦研究预测,面对英伟达对华销售产品规格升级空间存在不确定性的情况,国内算力需求方将进一步提升对中国本土AI芯片供应商的采购份额。预计到2027年,中国本土AI芯片供应商的市场份额将提升至55%。
人工智能和集成电路是中美科技竞争的重要领域。从长期来看,为保障算力供应的稳定可靠,互联网厂商采取同时采购境外龙头产品与国产供应链产品的“双轨制”策略已成为大势所趋。
当前,国产GPU在商业化拓展过程中主要面临4个方面的难点。
(1)与国际巨头相比,产品性价比尚存差距。国内企业在技术积累、人才密度、经营规模及资金实力等各方面与国际巨头存在明显差距,加之受到先进制程工艺的限制,短期内难以突破由国际巨头高性价比产品构筑的全球市场壁垒。
(2)商业客户严苛的服务水平要求及高准入门槛拉长了产品导入周期。以国内互联网企业为代表的商业客户对GPU产品的综合性能及运行稳定性要求极高,其采购仍以市场上可售的国际品牌产品为主,国产GPU占比相对较低,且多数集中在推理场景。在需要更大规模集群测试投入的训练场景,国产GPU的产品导入进程较为缓慢,导致商业化进程相对迟缓。
(3)国产GPU软件生态相对薄弱,客户迁移成本较高。虽然国产GPU依托通用型架构优势,具备了兼容CUDA生态的理论基础和路径可行性,但软件生态的适配、迭代和培育建设是一项长期且复杂的系统性工程。预计在短时间内,国产GPU相比国际产品生态薄弱的局面难以发生根本性改变。
(4)客户对能否保障供应链持续稳定存有顾虑。国产GPU的供应链稳定性,也是影响互联网企业等部分客户采购决策的重要考量因素之一。
包括沐曦、寒武纪在内的国内AI芯片公司,其营业收入普遍呈现出下半年占比较高、尤其是在第四季度集中的特点,季节性影响较为明显。
沐曦股份与境外龙头企业的差距主要体现在以下几个方面:
(1)单卡算力:已接近英伟达的主流产品,但受限于工艺制程和研发周期,包括沐曦在内的绝大多数国内厂商与英伟达的最新旗舰产品相比,仍存在一到两代的技术代差。
(2)集群通信:沐曦自主研发的MetaXLink高速互连技术,其互连带宽性能达到了与英伟达采用4纳米制程工艺的旗舰产品(H200)相当的水平,是国内厂商中率先将与英伟达NVLink技术的差距缩小到一代以内的GPU供应商。
(3)软件生态:全球范围内,英伟达CUDA的开发者数量已达数百万之众。而截至2025年7月31日,沐曦MXMACA软件栈的注册用户超过15000人,在软件生态体系的建设方面仍有巨大的发展空间。
(4)产品布局与商业化规模:沐曦在经营规模上取得了快速成长,但目前仍处于发展初期阶段,整体产品种类数量、业绩规模、市场份额、客户数量仍然偏小,与境外龙头企业相比仍存在明显差距。
在境内市场,与国内头部企业华为海思相比,沐曦在销售规模、销售网络覆盖、市场品牌知名度、客户结构多元化、人才团队规模等方面还存在一定差距。
沐曦坦承,目前在互联网企业客户的开拓及产品导入方面,其进度相比部分国内同行有所滞后。
互联网企业的采购决策高度市场化,出于对产品性价比和生态成熟度的考量,其首选仍然是国际品牌产品。在部分推理场景下,他们可能会使用国产算力芯片,但通常优先选择其自有产品或其所投资的生态链企业的产品。
沐曦一方面暂时缺乏互联网企业股东背景及相应的业务支持,另一方面,前述部分友商的产品多采用ASIC架构,该架构通过针对特定任务进行硬件定制化设计可实现较高的能效比,因此在模型和算子相对固化的推理场景下更具优势。
沐曦预计最早于2026年实现扭亏为盈。其针对盈利预测的敏感性分析如下所示:
2022年、2023年、2024年,沐曦的净利润分别为-7.77亿元、-8.71亿元、-14.09亿元。
亏损额持续扩大的主要原因是什么?
影响其损益的各科目金额及占营业收入比例如下表所示:
由上表可见,导致沐曦持续亏损的主要因素包括:1)营业收入与毛利虽快速增长,但总体收入规模仍相对较小;2)研发费用金额巨大且持续增长,当前的销售毛利规模尚不足以覆盖高额的研发支出;3)确认了较大金额的股份支付费用、资产减值损失以及信用减值损失。
2022年、2023年、2024年,沐曦的研发费用分别为6.48亿元、6.99亿元、9.01亿元,呈现显著的增长态势。
若将其净利润扣除股份支付、资产减值损失、信用减值损失等非现金或非经常性项目的影响,情况如下表所示。2024年调整后亏损额为7.51亿元,较2023年度的7.75亿元呈现收窄趋势。
国产AI芯片厂商整体起步相对较晚,过去几年大多处于技术突破和产品落地的初期阶段,正处于大规模量产的前期,规模经济效益尚未充分显现。企业需要投入大量资源用于技术研发、市场拓展和生态建设等,导致运营成本居高不下。
在市场份额尚未充分打开、产品市场认可度仍需提升的阶段,这些持续的高额投入难以迅速转化为可观的营业收入,成本支出远超收入规模,导致过去几年行业内企业普遍处于亏损状态。
2022年、2023年、 2024年以及2025年第一季度,沐曦训推一体的曦云C系列产品(含GPU板卡和服务器)实现的收入分别为0元、0.15亿元、7.22亿元、3.14亿元,占各期主营业务收入的比例分别为30.09%、97.28%、97.87%。该系列产品合计已形成营收10.51亿元,占报告期主营业务收入合计额的94.31%,是其绝对的营收主力。
同期,沐曦来源于核心技术的收入占营业收入的比例分别为100.00%、96.94%、86.53%、99.02%,占比较高。
曦云C500系列产品综合性能对标英伟达A100,在部分应用场景下的核心性能指标已与国际主流产品比肩,相比英伟达在中国市场可销售的产品H20,其在大模型训练场景下更具性能优势。该产品拥有丰富的标量、矢量和张量计算单元,支持FP64、FP32、TF32、FP16、BF16、INT8等多种混合精度计算。
沐曦的收入来源于训推一体系列GPU板卡、训推一体GPU服务器、智算推理GPU板卡以及IP授权,其主要产品形态正从智算推理系列向训推一体系列转变。
其训推一体系列产品的收入占比大幅上升,从2023年的30.09%上升至2025年第一季度的97.87%;而智算推理系列产品的收入占比则大幅下降,从2022年的100.00%下降至2025年第一季度的1.25%。
根据公司发展战略,沐曦核心产品的交付形态将以GPU板卡为主,IP授权并非其重点发展方向。
沐曦当前的收入主要来源于AI芯片产品,而同行业可比公司的主营业务产品可能还包括图形渲染芯片、CPU芯片等。
沐曦目前在售的主要AI芯片产品型号包括曦云C500、曦云C550、曦思N260、曦思N100,其中曦云C500、曦云C550为核心主力产品。其主流在售产品型号数量与同行业可比公司相比,并无显著差异。
寒武纪在其招股说明书中披露,其云端智能芯片的迭代周期通常在2年左右,边缘智能芯片的迭代周期通常为2-3年。英伟达、AMD的产品迭代周期也大致需要2年。
报告期内,沐曦用3年时间实现了两款芯片的一次性流片成功并实现量产。其核心产品曦云C500于2023年6月完成首批芯片回片,2024年2月正式量产,从量产至今尚不足两年。其下一代基于国产供应链的曦云C600系列已于2025年7月完成回片。
此前,沐曦于2021年上半年先后完成了曦思N100系列和曦云C500系列的研发立项,其智算推理GPU芯片曦思N100系列于2023年4月正式量产。
短期来看,曦云C500系列市场需求良好并持续稳定出货,预计未来1-2年内仍将是沐曦重要的收入来源。
在曦云C500系列实现量产后,沐曦其他的在研产品主要包括基于国产供应链的训推一体系列曦云C600、曦云C700,专为生成式AI推理市场设计的Nx系列,以及用于图形渲染的曦彩G系列产品等。
曦云C600系列、曦云C700系列均采用国内先进的工艺制程,构建了从芯片设计、制造到封装测试的完整国产供应链闭环,确保核心技术自主可控。
目前已有多家互联网厂商、金融机构、服务器原始设备制造商表达了对曦云C600产品的测试和适配意愿。
(1)曦云C600系列:基于国产先进工艺开发的通用GPU芯片,构建了国产供应链闭环。该产品于2024年2月立项,2025年7月完成回片并成功点亮,产品良率及各项测试指标良好,目前正在进行功能测试,预计2025年底进入风险量产阶段。
曦云C600系列通过采用先进封装等方式实现计算性能的升级,使用了最新一代的HBM3e显存并大幅提升了显存容量和带宽,增加了对FP8数据格式的支持,尤其是FP8张量及张量转置指令,能显著提高大模型训练的计算效率,更契合当前头部大模型厂商的训练需求。
不过,受限于所采用的工艺制程,曦云C600系列的卡间互连带宽相比前代略有下降,同时功耗有所提升。
(2)曦云C700系列:基于国产先进工艺开发的下一代通用GPU芯片,于2025年4月立项,目前正处于软硬件购置和产品设计开发阶段。芯片的核心设计、功能验证工作已大部分完成,正在进行更深入的性能调优。
曦云C700系列将进一步扩展对FP4等更低精度计算格式的支持,其定位是未来沐曦基于国产供应链的旗舰级产品,性能目标直接对标国际主流产品英伟达H100。
(3)曦思Nx系列:下一代基于先进封装技术的云端大模型推理芯片,专为生成式AI推理市场设计。计划采用公司最新的第三代指令集和先进封装工艺,通过提供超高显存带宽和大容量显存来提高token吞吐量,同时保持低功耗和高能效,旨在大幅降低AI推理成本。相关产品可广泛应用于国内商业化智算中心,或用于AI PC等端侧低延迟、独立用户推理场景,支持从百亿到万亿参数规模的各种模型推理。
(4)曦彩G100系列:面向图形处理场景设计,内置性能强大的图形处理器,主要应用于云端及边缘端图形处理。目前,曦彩G100 GPU IP的设计和验证工作已完成。
随着产品迭代进入“量产一代、在研一代、规划一代”的稳定周期,基于国产供应链的曦云C系列产品预计将实现稳定的迭代更新,并成为沐曦未来稳定的收入来源。
2023年、2024年、2025年第一季度,沐曦的综合毛利率分别为62.88%、 53.43%、55.26%,低于同期寒武纪和海光信息的综合毛利率平均值。
其直销和经销模式下的毛利率情况,与寒武纪、海光信息、龙芯中科、景嘉微、摩尔线程等对比如下:
沐曦在不同产品类型下,主要细分产品型号的销量、收入、单价及毛利率情况如下:
报告期各期,沐曦各细分产品毛利率的总体情况如下:
各型号产品销售单价(不含税)、毛利率的变动情况如下:
报告期内,沐曦经营活动产生的现金流量净额持续为负,主要原因是其销售规模尚处于逐步提升的过程中,原材料采购、存货备货和研发投入所需的资金量较大。此外,为应对潜在的供应链稳定性风险,沐曦对部分关键原材料进行了战略性储备。
各报告期末,沐曦的营运资金分别为6.30亿元、9.33亿元、25.04亿元、92.11亿元,流动比率分别为6.60、3.74、3.72、12.23。最近一期期末,其营运资金和流动比率大幅增加,显示出较好的短期偿债能力。
截至2025年3月末,沐曦的货币资金余额为56.95亿元,其中受限货币资金为198.06万元,主要为银行承兑汇票、保函的保证金;交易性金融资产余额为15.97亿元,系公司已购买但未到期的结构性存款。因此,报告期末其可自由支配的资金合计约为72.90亿元。
经测算,预计沐曦2025年、2026年的营运资金需求分别为19.46亿元、36.23亿元,合计55.69亿元。其当前可支配资金足以覆盖未来两年的营运资金需求。
2022年末至2024年末,沐曦产品的平均产销率分别为21.67%、39.00%、39.82%,低于行业平均水平。这主要是由于沐曦处于前期业务快速拓展阶段,销售正逐步起量,公司采取了较高比例的提前备货策略。
至2025年3月末,随着市场需求持续释放,沐曦的产销率已提升至132.02%。
2023年、2024年、2025年第一季度,沐曦训推一体GPU曦云C500板卡的平均销售单价分别为5.69万元/张、4.78万元/张、3.70万元/张。
2025年第一季度,曦云C500板卡平均销售单价为3.70万元/张,较2024年度下降了22.69%。这主要受某大客户订单影响,该客户根据其下游智算集群建设的需求进行了大批量采购,沐曦为此给予了相应的价格优惠。
若不考虑该特定客户订单的影响,2025年第一季度曦云C500板卡的平均销售单价为4.45万元/张,相较2024年度的下降幅度较小。
2024年和2025年第一季度,曦云C550板卡的平均销售单价分别为4.55万元/张和5.99万元/张,2025年一季度平均单价上升了31.57%。
报告期内,沐曦产品销售单价的下降主要受大客户优惠措施、与部分客户的阶段性合同安排等短期因素影响。2025年第二季度,其产品在手订单的平均销售价格已有所回升。沐曦2025年第二季度主要产品的销售情况如下:
2025年第二季度,其训推一体GPU板卡的平均销售单价为4.75万元/张,相较第一季度的3.89万元/张有大幅上升,与2024年4.69万元/张的平均售价相比保持稳定且略有提升。
截至2025年8月15日,沐曦在手订单金额(不含税)总计11.40亿元。其中,预计在2025年确认收入且金额在1000万元以上的在手订单销售价格情况如下:
截至报告期末,沐曦收入确认金额在1000万元以上,且最终终端应用于智算集群的GPU板卡/服务器销售情况如下:
除上述在报告期内已确认收入的智算集群外,沐曦在2025年第二季度已交付并确认收入的主要集群还包括:汇天网络科技有限公司的“项目F(二期)”(128台GPU服务器)、上海算丰信息有限公司的“项目E(二期)”集群(160台GPU服务器)等。
经统计,使用沐曦报告期内销售产品搭建且集群规模在128卡及以上的主要终端项目情况,具体如下表所示:
截至本回复文件出具之日,除部分项目尚未完全建设完毕等情形外,沐曦报告期内销售的产品已在上述主要终端项目中实际投入使用,且运行状态良好。
2025年1-3月,沐曦实现收入合计24,939.26万元,其中已投入使用的产品对应收入为12,250.99万元。已投入使用比例较低的主要原因在于“项目C(一期)”(4096卡)尚未完成全部建设,该项目预计将于2025年9月投入运营。
报告期内,沐曦的客户集中度相对较高,前五大客户贡献的主营业务收入占当期主营业务收入总额的比例分别为100.00%、91.58%、71.09%、88.35%。但近两年,其客户集中度水平低于同期摩尔线程、海光信息、寒武纪等公司。
同期,沐曦通过经销模式实现的收入占主营业务收入的比例分别为0%、 43.81%、 37.42%、55.71%。这一比例高于海光信息、寒武纪、龙芯中科,与摩尔线程较为接近。
经销收入占比较高的主要原因有两方面:一是公司处于业务快速拓展期,通过经销模式可以更快地打开市场;二是下游应用领域广泛,经销模式有助于更高效地触达多样化的终端业务需求。
2023年、2024年、2025年第一季度,由沐曦存量客户贡献的收入金额占各期主营业务收入的比例分别为0%、15.99%、95.10%,客户复购率呈现出持续提升的态势。
若从主要终端客户的角度,按项目口径(对应直接客户的单笔或多笔采购订单)统计客户的复购情况,则更具参考价值,具体情况如下:
2023年和2024年,随着沐曦曦思N100系列、曦云C500系列产品陆续正式量产,其新增客户的数量、销售金额及占比均出现大幅增长。
2025年第一季度,新增客户收入占比有所下降,主要原因一是老客户持续复购带来稳定收入;二是沐曦通过经销商模式进一步扩大了终端客户的覆盖范围。
其前5大新增客户的主营业务收入情况如下:
沐曦持续拓展新客户,截至2025年8月12日,累计已有230余家客户正在或已经完成对其GPU板卡的测试。其中,2024年12月末正在测试的客户为26家,至2025年6月末已增长至43家,呈现稳步增长态势。
该公司对应收账款坏账准备的计提比例总体高于同行业可比公司的平均计提比例,显示出较为谨慎的会计政策。
截至2025年7月末,报告期内沐曦多笔金额较大的逾期应收账款已完成收回,期后回款比例已得到明显提升。
报告期内,沐曦向前五大供应商的采购金额占当期采购总额的比例分别为95.67%、95.01%、91.30%、93.87%,供应商集中度较高。前五大供应商的采购占比相对稳定,不存在对单一供应商采购比例超过50%的情况。
受行业惯例、采购周期以及国际形势等因素影响,为保障未来产品的稳定供应,沐曦向晶圆、HBM内存等重要原材料供应商进行提前订货,并预付了较高比例的货款,导致其预付款项规模较大。
报告期内,沐曦现金流量表中“购买商品、接受劳务支付的现金”与采购总额、预付款项变动、应付账款变动等项目的匹配关系如下:
其预付款项的规模、占比与同行业可比公司的对比情况如下:
沐曦核心原材料如晶圆、HBM的采购周期(从下单到交付)平均约为6个月左右,公司采取了较高的提前备货比例。
面对人工智能芯片市场需求的激增,报告期内,其存货规模随之快速增长。
同行业可比公司也普遍采取了增加存货储备的策略。2024年末,寒武纪存货余额同比增加493.11%,海光信息存货余额同比增加396.05%,摩尔线程存货余额同比增加119.43%。
龙芯中科的主营产品为CPU,景嘉微的主要产品为图形GPU,与沐曦的AI芯片产品类型存在差异,其存货余额变化受AI算力需求激增的驱动相对较小。
在同行业可比公司中,寒武纪的存货跌价准备计提比例明显高于其他公司。若剔除寒武纪,2022年末、2023年末、2024年末,其余四家可比公司的存货跌价准备计提比例平均值分别为5.88%、7.73%、10.01%。
沐曦全系列产品采用统一的GPU计算架构。迄今,公司已自主研发了两个大代际、五个小代际的流处理器架构。公司计划通过持续发展先进封装、高速互连通信等关键技术,扎根国内市场需求,与境外龙头企业形成错位竞争。
回复文件显示,沐曦在境内市场的具体竞争优势主要体现在以下四个方面:
① 产品性能与生态优势
根据多家行业权威的国家实验室、计算中心及研究所的测试验证结果,沐曦的GPU产品在通用性、单卡性能、集群性能及稳定性、生态兼容性与应用迁移效率等方面具备较强的核心竞争力,综合技术实力处于行业领先地位。
单卡性能:处于国内第一梯队。
集群性能:其自研的MetaXLink高速互连技术具备国内稀缺的高带宽卡间互连能力,可实现从2卡到64卡的多种灵活互连拓扑。在智算集群的线性扩展度、运行稳定性、计算资源利用率等方面,沐曦产品均表现出色。
软件生态:公司自主构建的MXMACA软件栈提供了一套统一、完整且高效的全栈式开发工具链,覆盖应用开发、功能调试和性能调优等核心环节。该软件栈高度兼容GPU行业国际主流的CUDA生态,能够开放地集成全球开发者丰富的开源成果,具有较高的易用性和迁移效率,在通用性和灵活性上形成了独特的竞争力。
沐曦坚持推动MXMACA软件栈的开源共享,致力于打造中国版的GPU开放编程接口标准,以推动解决跨不同GPU平台的应用兼容性难题。公司是国内少数提供核心软件生态和源代码开源、提供版本SDK公开下载渠道、并提供英文开发文档资料的GPU企业。
该软件栈已支持超过6000个基于CUDA的应用,以及多种主流开源技术栈,包括AI训练框架(如PyTorch、PaddlePaddle)、AI推理框架(如vLLM、SGLang)、高性能算子库(如BLAS、DNN)和超过1000个开源AI模型。
② 市场拓展与商业化优势
随着智算推理曦思N系列和训推一体曦云C系列GPU产品相继量产,沐曦的业绩实现了快速爆发,近三年营业收入的年均复合增长率高达4074.52%。2024年,公司营收达到7.43亿元,其业绩规模和市场份额在国内同行业公司中位居前列。
沐曦的主要客户普遍在后续的建设项目中对其产品进行了复购,并进一步扩大了采购规模。
沐曦是国内少数真正实现多个千卡级集群大规模商业化部署应用的GPU供应商,其集群在计算线性度、资源利用率、运行稳定性和异构混合训练能力方面表现行业领先。公司正在研发并积极推进万卡级集群的落地,已成功支持包括1280亿参数混合专家模型在内的大模型完成全量预训练。
截至报告期末,沐曦GPU产品的累计销量已超过25000颗,产品相继部署应用于10余个大型智算集群。其算力网络已覆盖国家人工智能公共算力平台、运营商智算平台和商业化智算中心,区域横跨北京、上海、杭州、长沙、中国香港等地,并正逐步向更多区域延伸。下游应用领域广泛覆盖教科研、金融、交通、能源、医疗健康、大文娱等多个行业。
在参与国家人工智能公共算力平台等标杆客户组织的多次产品性能测试比选中,沐曦能够根据客户不断变化的技术标准要求和考察重点,快速迭代并优化其产品的软硬件技术组合方案。
③ 技术自主可控与供应链优势
沐曦实现了GPU核心环节的全流程自主研发,并率先成功导入了国产供应链,是国内少数几家全面系统掌握GPU架构设计、GPU IP研发、先进制程GPU芯片及其基础系统软件设计、量产等全流程核心技术的企业之一。
沐曦是国内少数坚持“从零开始”自主研发核心GPU IP的芯片设计公司,已形成了全面覆盖计算(AI训练、推理、通用计算)和图形渲染场景的核心GPU IP矩阵。公司打造了由超过600条(XCORE1.0计算GPU)、800条(XCORE2.0 渲染GPU)指令组成的、自主安全可控的MXMACA指令集体系。
在制造工艺方面,沐曦较早启动了国产供应链的战略布局,与国内领先的晶圆厂、封测厂、EDA/IP工具厂商开展深度技术合作与联合攻关。公司提前规划、设计并成功导入了基于国产供应链的产品线,率先实现了生产落地,能够确保后续产品高质量及可持续的稳定供应与交付。
其首款基于国产供应链的产品曦云C600已完成回片点亮并正式发布,初期性能测试结果及市场反馈良好。沐曦预计该产品未来将在信创市场实现规模化应用,同时也已受到多家头部互联网企业的高度关注。
④ 持续技术创新与前瞻布局优势
沐曦成为国内首批将FP8、FP4等低精度数值格式和相关创新指令集引入后续迭代产品架构的企业,能有效支持以深度求索、阶跃星辰、月之暗面等为代表的头部大模型厂商对于最新训练与推理任务的极致性能需求。
报告期内,基于其自主创新的DragonFly互连拓扑技术,沐曦已成功打造出64卡光互连超节点产品及3D-Mesh 64卡超节点产品等先进解决方案。
沐曦还实现了业内领先的单机柜128卡超高密度部署方案。实测数据显示,其在千卡规模集群上执行1280亿参数混合专家大模型训练任务时,无故障连续运行时间超过14天(训练任务按计划结束),能够稳定支持千亿参数级别大模型的训练、微调及高效推理。
此外,沐曦是全球少数几家掌握了复杂多级缓存结构设计技术的GPU企业之一,其产品的显存容量、显存带宽等关键性能参数在国内同行业企业中均位居前列。公司也是全球较早开始研发超高带宽显存(UBM)控制器接口技术的企业,该技术将有望大幅提升未来GPU产品的数据带宽和容量上限。
国内GPU产业起步相对较晚,尽管沐曦等企业已取得显著的技术突破,但在硬件绝对性能和软件生态系统建设方面,与英伟达等国际巨头相比仍存在一定差距,目前整体上仍处于市场跟随与追赶阶段。
当前,国际贸易环境的新变化使得国内市场对高性能GPU的需求缺口持续扩大,亟需有竞争力的国产GPU产品来填补。各家国产AI芯片公司正在国内市场积极布局,发力争夺市场份额。
国产AI芯片厂商一方面需要与国际巨头凭借历史优势构筑的竞争壁垒相抗衡,另一方面还需在国内同行的激烈竞争中脱颖而出。这要求企业投入巨额资金用于持续提升技术水平、打造具有竞争力的高性能产品、拓展销售渠道网络以及构建自身的软硬件生态体系。
本文由主机测评网于2025-12-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251212998.html