当前位置:首页 > 科技资讯 > 正文

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者

在国产大模型持续火热、生成式AI成为不可逆转的发展潮流,以及众所周知的地缘政治因素共同作用下,2025年成为了国产AI芯片的辉煌之年。

就在本月,摩尔线程与沐曦股份相继在科创板挂牌上市,上市后市值迅速飙升6至7倍,甚至一度将A股市场的投资热情推向了新的高潮。

与此同时,同为“国产GPU四小龙”的燧原科技早在2024年便启动了科创板上市流程,而另一成员壁仞科技近期也向港交所递交了IPO申请,计划于2026年1月2日在港股正式上市。

此外,天数智芯、昆仑芯等众多国产AI芯片企业,也已纷纷踏上IPO的征程……

对此,巴克莱银行亚太区执行主管Matt Toms不禁感叹:“如果到2026年或2027年,中国能够制造出低成本且具有竞争力的芯片,就像当年的DeepSeek一样,我丝毫不会感到意外,而这必将对英伟达及其供应链产生颠覆性的冲击。”

值此新年旧岁交替之际,我们有必要重新审视以国产GPU四小龙为代表的中国AI芯片所面临的关键时刻。

01 师从巨头,挑战巨头

来自咨询公司Challenger, Gray&Christmas的数据显示,2025年美国因人工智能导致的裁员人数已接近5.5万人

时至今日,生成式AI成为时代主流,已经毫无争议。

中国市场是生成式AI与大模型的前沿阵地,也是全球大模型最活跃、竞争最激烈的市场之一,这里对万卡集群、十万卡集群的需求与日俱增,对AI算力的渴求愈发强烈,尤其是在当前国际竞争格局下,国产GPU的算力替代需求变得空前迫切。

正是在这样的背景下,“国产GPU四小龙”应运而生。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第1张

说起来,国产GPU四小龙不仅代表着中国AI芯片的顶级战力,在全球AI芯片领域也占据着举足轻重的地位。

就像Anthropic创始成员来自OpenAI一样,这四小龙的核心创始成员大都出自两所GPU“黄埔军校”——英伟达、AMD,其中不少人曾担任这两家全球芯片巨头的关键角色。

首先来看四小龙中关注度最高的,也是在上市后不久就马不停蹄地举办了首届开发者大会的摩尔线程。

摩尔线程创始人张建中出生于江苏南京,大学就读于南京理工大学计算机系,后又在原冶金部自动化研究院获得硕士学位。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第2张

相较于四小龙中其他几位创业者,张建中的求学经历并不算出彩,但这并未妨碍他在职场中一路高歌猛进。

1992年,离开冶金部自动化研究院后,张建中先后在惠普戴尔担任过产品总经理客户部总经理,之后于2005年加入英伟达,并在那里一待就是十五年。

在这十五年里,张建中出任全球副总裁、中国区总经理,直接负责英伟达在中国的业务拓展和生态体系建设,不仅推动中国成为英伟达全球最重要的市场之一,也让张建中在陪伴英伟达的过程中,见证了GPU从游戏领域的图形处理器,逐步演变为人工智能时代所有相关产业底层核心的历程。

于是,在人工智能浪潮席卷而来、国产AI芯片蓄势待发之际,这位“打工皇帝”结束了在全球科技巨头二十余年的职业生涯,毅然创立了摩尔线程。

创立摩尔线程时,张建中将英伟达生态总监周苑GPU架构师张钰勃等一批前同事悉数招致麾下,这使得摩尔线程天生具备“英伟达基因”,在后来的技术研发中展现出超群的战斗力。

从成立第二年起,摩尔线程的GPU研发以一年一代的速度进入国内市场,与此同时,对标CUDA,摩尔线程构建起自有的MUSA生态,由此赢得了“中国版英伟达”的称号。

沐曦股份创始人,是同样出身于国际芯片巨头AMD的陈维良

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第3张

陈维良是微电子专业科班出身,本科毕业于电子科技大学微电子专业,后进入清华大学微电子系攻读硕士,毕业后回到上海,从工程师做起。

创业前,陈维良曾先后任职于泰鼎多媒体、远弘科技、亚鼎视频科技,彼时已涉足GPU研发并担任研发设计经理,不过这些经历相对短暂。真正让他深入GPU领域并具备国际视野的,是2007年加入的AMD。

陈维良2007年加入AMD,彼时AMD刚完成对ATI的并购,虽背负债务危机,但也因此获得了宝贵的GPU技术,成为当时唯一同时拥有CPU和GPU能力的公司。

陈维良在AMD服役长达13年,期间负责GPU设计与产品研发,累计完成15款GPU产品的流片和量产,职位也升至高级总监。

2020年,陈维良离职创立沐曦股份,与他一同加入的还有AMD资深科学家彭莉和杨建,他们共同组成了沐曦的核心创始团队。

此后,更多AMD前员工如周俊、王定等也陆续加入,成为沐曦研发的中坚力量,陈维良由此打造的“中国版AMD”,走上了一条与摩尔线程有所区别的发展道路。

燧原科技的创始人,是同样曾在AMD任职的清华系创业者赵立东

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第4张

赵立东本科毕业于清华大学电子工程系,后赴美国犹他州立大学获电子与计算机硕士学位。

作为科班出身的电子工程专家,他于2007年加入AMD,随后参与AMD中国研发中心的组建,历任计算事业部高级总监、产品工程部高级总监,主要负责CPU/GPU/APU的产品规划及相关核心IP研发

值得一提的是,当年AMD收购ATI后致力于将GPU与CPU集成于同一芯片(APU),赵立东正是这一产品规划的核心参与者之一。

赵立东曾希望将AMD完整的产品线引入中国,并为此亲赴美国总部推进,但计划最终未达预期。

此后六年,燧原科技完成了三代四颗芯片的研发,成为国内GPU领域又一支劲旅。

壁仞科技创始人张文,在四小龙中显得颇为独特。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第5张

张文是四小龙中唯一非技术出身的创始人,他本科就读于合肥工业大学电机专业,后赴美国创业并实现财务自由,随后跨界深造,先后获得哥伦比亚大学工商管理硕士哈佛大学法学博士学位。

张文的从业经历同样丰富:哈佛毕业后,他在华尔街担任过高级律师,也做过市场资深投资人。

2011年回国后,他应张汝京之邀出任映瑞光电科技公司CEO,由此踏入半导体领域。

张文另一段广为人知的经历是2018年加入商汤科技任总裁,参与国内总部及全球研发中心的落地。

在积累了半导体与人工智能双重经验后,张文于2019年创办壁仞科技。

彼时张文虽不擅长具体技术研发,却在资金募集和人才招募上展现出过人才能,他从英伟达、AMD、华为、阿里、紫光等国内外顶尖团队招揽了大量技术人才,迅速组建起壁仞的研发队伍。

或许因为创始人的非技术背景,壁仞的产品迭代速度相较其他三小龙略显迟缓。

壁仞科技首款重磅GPU产品是2022年8月发布的BR100系列,当时公司已完成B轮融资,累计融资47亿元,C轮融资也已启动。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第6张

然而,尽管张文擅长资本运作,壁仞科技与燧原科技一样,经历了坎坷的上市之路。在2024年冲击科创板未果后,如今转战港交所,志在成为“港交所GPU第一股”。

02 借鉴技术,突破技术

国产GPU四小龙的创始人背景各不相同,这也导致了各团队技术路线的微妙差异。

不过,由于四小龙成立前,全球半导体领域已有成熟的GPU生态和英伟达、AMD、英特尔等“带头大哥”,而四小龙的核心技术团队多来自这些巨头,因此在自主研发过程中,不可避免地会借鉴和学习巨头们的成功经验。

拥有浓厚英伟达基因的摩尔线程,选择的是英伟达全功能GPU的路径,其产品覆盖现代图形渲染、智能多媒体编解码、AI计算加速科学计算等多个领域。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第7张

过去五年中,摩尔线程发布了桌面级显卡MTT S50、数据中心卡MTT S2000,甚至建成了国产GPU千卡集群——KUAE千卡智算中心。

实际上,对于摩尔线程而言,计算架构的迭代才是重中之重。公司步入正轨后,摩尔线程以每年一代的速度更新计算架构——2021年的苏堤,2022年的春晓,2023年的曲院,2024年的平湖,以及2025年的花港

每一代新架构发布时,都会伴随相应的桌面级GPU和数据中心GPU产品更新。

与此同时,摩尔线程也构建起兼容英伟达CUDA的MUSA生态,通过开源策略和MUSIFY工具支持CUDA代码的无缝迁移。

这一方面便于基于英伟达CUDA生态的应用平滑切换至国产GPU,类似于早年国产软件兼容Oracle的策略;另一方面也是其打造平台型生态不可或缺的基础设施

沐曦股份作为典型的AMD系创业团队,走的是通用GPU(GPGPU)路线,虽然业务覆盖AI计算、通用计算、图形渲染,但目前产品主要聚焦于更为火热的AI训练与推理场景

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第8张

沐曦已面世的产品分为两大系列:

一是面向云端智算推理的曦思系列芯片,曦思N100于2022年1月完成设计并流片,2023年正式量产;

二是面向训推一体的曦云芯片,曦云C500于2022年12月流片,2024年2月量产,随后陆续部署于多个国家级人工智能公共算力平台、运营商智算中心和商业化智算中心。

作为GPU新势力,沐曦同样高度重视开源生态,并自主研发了MXMACA软件栈。

在近日更新的3.3.0.X版本中,沐曦官方着重强调了对英伟达CUDA、TensorFlow、PyTorch、JAX等主流架构的兼容,旨在通过开源力量提升自家产品的认知度和普及率。

壁仞科技的技术路线与沐曦相似,同为通用GPU(GPGPU),但壁仞更强调“高端”定位。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第9张

壁仞于2022年8月发布了首款通用GPU芯片BR100系列(BR100和BR104)。据官方数据:

这颗采用7nm制程、chiplet设计、2.5D CoWoS封装的BR100,算力达1000TFLOPS(FP16),FP8算力达2000TFLOPS,单芯片峰值算力达到PFLOPS级别,性能已超越英伟达A100。

正因如此,壁仞的GPU芯片主要面向云数据中心、运营商、智算中心等高端场景,支撑大模型训练、AI推理、高性能科学计算等通用计算负载。

高性能通用GPU成为壁仞的鲜明标签,使其扛起了国产GPU云端大算力的旗帜。

四小龙中成立最早,也是另一支AMD系创业团队的燧原科技,技术路线又有所不同,燧原科技更强调自有生态和云端AI加速

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第10张

燧原的技术路线更为专注,核心产品即为AI训练加速卡,聚焦大模型训练,自研了GCU-CARA架构和GCU-LARE互联技术(类似NVLink),几乎将所有资源都押注在大模型训练这一最需要大规模算力的领域。

燧原早在2019年底就推出了面向AI训练的邃思1.0芯片,以及搭载该芯片的AI加速卡云燧T10。

此后,燧原每年都有新品问世:2020年底推出首款AI推理加速卡云燧i10,2021年发布邃思2.0、云燧T20/T21/i20及云燧集群。

到今年,燧原又发布了面向高性能推理场景的燧原S60,以及训推一体AI芯片燧原L600,成为燧原第四代系列产品。

就在中国全力补齐GPU短板之际,受众所周知的地缘政治因素影响,英伟达被迫调整中国市场策略,国产芯片由此迎来了前所未有的历史窗口期。

03 拥抱资本,成为资本

几乎所有的产品,都在被生成式AI和大模型重新定义,这在2025年已成为显而易见的趋势。

作为大模型底座的算力,在2025年更是备受追捧和估值飙升。

从全球范围看,英伟达在今年7月市值突破4万亿美元,成为全球首家市值破4万亿美元的公司;

从国内来看,即便尚未盈利的寒武纪,股价也在今年8月突破千元大关,成为继茅台之后A股第二只千元股,寒武纪市值在短短一个月内暴涨1500亿元,突破4000亿元。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第11张

同样受到资本热捧的还有国产GPU四小龙。从过往融资经历来看,四小龙已成为明星标的,每一家背后都站着众多顶级投资机构。

与此同时,四小龙也正在从融资者转变为投资者。

目前,四小龙中已有两家抢在年底前于科创板上市,其中,摩尔线程上市首日股价上涨4倍,五日内涨幅达6倍沐曦股份上市首日更是暴涨7倍,甚至带动了整个A股的投资热潮。

国产GPU四小龙2025年关键时刻:从英伟达AMD走出的挑战者 GPU四小龙 AI芯片 科创板上市 英伟达 第12张

继摩尔线程、沐曦股份之后,壁仞科技也已通过港交所聆讯,即将冲刺“港交所GPU第一股”,预计将于2026年1月2日(港交所节后首个交易日)正式上市。

回望2025年,人工智能正悄然重塑一切,影响着技术演进的方向、人才的流动、资金的走向,乃至每个人的工作与生活节奏。

在众多产业中,如果说有一个最能代表人工智能的兴衰起伏,那么,作为人工智能基石的GPU,在2025年无疑是最耀眼、最具时代象征的符号