中国算力芯片领域正经历一场静默而深刻的变革。
在2025年华为全连接大会上,华为推出了多款关键芯片新品,涵盖昇腾950系列、960以及970等AI芯片,并展示了未来三年的昇腾AI芯片发展蓝图。
其中,950系列采用了两个不同后缀——PR(Prefill & Recommendation,预填充与推荐)和DT(Decoder & Training,推理解码与训练)。
传统AI芯片在处理大模型推理时面临资源争用难题,而互联网平台企业的推荐算法推理模型所需内存容量同样巨大。如何在算力、内存容量和内存带宽之间实现平衡,是提升投入产出比的核心。
华为的“P/D分离”设计尝试通过为不同应用场景配置差异化的算力、内存容量和带宽来达成这一目标。
这种设计正是应对中国AI市场现实挑战的体现:能够运行DeepSeek满血版几乎成为国内衡量AI计算系统的试金石。然而,要承载671B的参数,仅采用不同版本Memory的成本差异就可能高达数万美元。
可以说,中国AI产业的市场化需求,正倒逼国产芯片实现产品创新。
从产品视角看,发布会上的这一最大亮点,也是一个强烈的行业信号:
1)以DeepSeek为代表的应用与基础模型产业方,在持续且深度地推动中国AI芯片进步;更进一步,受益于中国庞大的数据中心基础设施规模与未来需求,“华为-海光-其他”的生态格局基本形成;
2)时代亟需一个具备技术背景、对市场应用娴熟于心、同时懂得平衡取舍的产品经理人才梯队;
3)AI产业的繁荣与领先,是AI芯片突破与创新的前提。
从近期华为主动释放的信号及行业信息看,华为的产能约束已基本缓解。
数据中心的三大基石是计算、通信(网络互连)和存储,这是分析算力系统必须牢记的前提。在AI算力系统中,影响计算性能的也可划分为三部分:设计算力值、计算核间高速互联以及存储带宽。
在《软银投资20亿,英特尔成为全球高端制造业最大变数》中,笔者曾提到算力大小与工艺制程强相关,而这种高端工艺制程主要体现在Fab的高端产能与先进封装。
为华为提供类CoWoS封装的企业,今年已出现产能盈余并向外释放,说明在7nm节点附近,华为的需求已基本满足。
再来看高速互联。
WAIC期间,超节点成为AI基建的重头戏。其中,华为的CloudMatrix384成为亮点,其特征是点对点、全互联、超高带宽网络,通过UB协议连接所有NPU和CPU。
CloudMatrix384通过Ultra-High-Performance Networking实现了CPU、NPU、内存、网卡及其他资源的完全点对点解耦与池化,其点对点硬件架构包含用于超节点内扩展的超高带宽统一总线(UB)、用于超节点间通信的RDMA,以及用于与数据中心网络集成的虚拟专有云(VPC)。这再次证明,通信技术本就是华为的核心优势。
再来看内存带宽。
华为在通信领域积淀深厚,高速互联技术可谓其“老本行”。
再来看内存带宽。
本次发布会上,华为发布了950、960、970系列产品,其中最引人注目的950系列推出两个版本,从应用上看这标志着PD分离在硬件层面的解偶,而从结果看,内存带宽也跟上了步伐。
计算、高速互联与存储带宽这些硬件均实现重大突破,产能问题解决后,华为需攻克的下一个堡垒是产品生态。
2022年,当业内开始关注CUDA生态对英伟达的意义时,构建生态似乎成为老生常谈。
生态的本质是生意。
Intel构建了X86生态,英伟达构建了CUDA生态,乃至苹果、小米、腾讯都有各自生态。其共同点在于,依附于生态中的每家企业、机构、开发者都能找到生态位、实现商业变现并获利。
总不能指望,当一家企业举起生态大旗,众多企业便不求回报地投入资源。无利不起早,才是商业世界的常态。
具备生意(潜力)是生态建立的基础。
传统华为可能正面临(并进行)模式转变,从封闭到开放,从肥水不流外人田到利益共享。Intel和英伟达作为带头大哥走过的路,华为也需践行。
这条路上华为并不孤独,因为还有海光。
地缘政治风险中,孕育了自主可控机遇。作为技术国产化成功典范,海光凭借X86架构优势,其CPU在信创和国产化市场中所向披靡。随着资本积累日益丰盈,其技术实力与产品涉足领域也与日俱增。除CPU外,AI算力芯片、RAID Controller、高速网络芯片日渐成熟,在数据中心重要芯片上,海光正一步步攻城略地。
2025年5月下旬,海光宣布将合并曙光。更早前,这两家兄弟公司已在生态层面协同,重新定位旗下企业,通过让渡市场措施,实现与国内服务器厂商及其他产业链企业合作,构建系统层面生态。
可以说,“华为-海光-其他”的格局基本形成。
基于此观察,可进一步推演:
华为将在不久后做出选择,到底是IDM还是Fabless模式。当然,无论做何选择,它可能仍保持对产能的强力控制;
合并后的海光下一步,将是入股高端产能,在当前中国,这大概率意味着Fab是SMIC或华虹。从商业实操看,华虹可能性更大。至于OSAT,通富微电本就与海光关系千丝万缕。
上文提到,本次发布的950系列受关注核心在于其PR和DT两个不同型号,这正是业界探索已久的“P/D分离”。
这又是一个类似于DeepSeek发布时的解码游戏。
为解释此概念,需回顾大模型演进历程和中国AI算力面临的实际挑战。
大模型参数量从十亿级别起跳,百亿千亿成常态,直至万亿规模。这些参数需极大存储空间,且计算时需极高速访问存储器,这就要求极高带宽。这催生了HBM这种兼具大容量和高带宽的新型存储器。
计算时,算力大小也决定计算效率,因此AI芯片的目标设计算力也尽量做大。
然而,少有产品经理在设计中深入思考算力与存储带宽的最佳配比。毕竟,除英伟达和Broadcom为大平台订制AI芯片外,能用起来已属不易。
但现实问题是,HBM成本极高,单GB容量的HBM是DDR的近10倍或更高。对中国AI芯片公司,不仅成本压力大,且获取足够产能、甚至稳定供应都是挑战。
一个优秀的产品经理、架构师,之所以合格、优秀,在于会优化、取舍,做好Trade-Off。优化与取舍的前提,是对应用场景有深刻理解与洞察。
在AI应用场景中,对资源需求最高的,除模型训练过程外,一是耳熟能详的大语言模型,一是每家互联网公司的主要利润来源——推荐算法。
在大模型推理中,常用以下两项指标评估性能:
TTFT(Time-To-First-Token):首token生成时间,即从用户输入完毕到大模型回复第一个字所花时间,主要衡量Prefill阶段性能,这是一种计算密集型任务,对并行能力要求高,但对内存带宽相对可低;
TPOT(Time-Per-Output-Token):生成每个token的时间,即用户直接感受到的回复速度,主要衡量Decode阶段性能,此阶段对内存容量和带宽要求更高。
当Prefill和Decode在同一块AI芯片上运行时,由于两阶段计算特性差异,会导致TTFT和TPOT间资源争抢。若优先处理Prefill以降低TTFT,Decode性能可能下降。若选择提升TPOT,则会增加Prefill请求等待时间,导致TTFT上升。
这次华为的两个型号,采用不同内存容量和带宽,应采取了PD分离思路,正是为打破此矛盾。
可运行DeepSeek满血版,几乎成为国内衡量AI计算系统的试金石。
然而,要放下671B参数,仅采取不同版本HBM的成本差异就可达数万美元。而在互联网平台企业,其推荐算法推理模型所需内存容量也巨大。若能在算力、内存容量和带宽间取得优化、取舍与平衡,投入产出比就会提高。
时代呼唤专业的AI芯片产品经理。
事实上,国内芯片企业中,真正具备产品经理能力的人才非常稀缺。在芯片主要由外企垄断时代,一家芯片企业的ProductMarketing或Product Line Manager是产品线核心管理岗位,一般由总部极少数人担任,随着中国市场需求与美国出现一定不同,才有中国大陆人逐步跻身此岗位。
而在中文语境下,“市场经理”常被理解为负责市场传播或市场推广的角色。在当今国内AI芯片企业,目前仍是研发岗定义产品。
从DeepSeek满血版提出的要求,到FP8数据精度国产化需求,直至这次P/D分离,隐隐可见模型应用提出需求进而驱动产品定义趋势在中国已然发生。那么理所应当地,一个具备技术背景、对市场应用娴熟于心、同时具有平衡取舍之道的产品经理,将成为下一阶段定义和推动算力芯片与系统发展的主导力量。
此趋势,是AI芯片与AI系统专业化、精细化的开端,是产品运营上新台阶的标志。
此趋势,是“需求决定供给”这一经济学规律在AI中国市场中的再次体现。
正因如此,我们必须旗帜鲜明地说:不能为发展AI芯片,而拖累放缓AI产业进步。
AI产业的繁荣与领先,是AI芯片突破与创新的前提。
AGI和可控核聚变是人类文明当前面对的两座生产力高峰。在当前地缘格局下,大国竞争围绕这两座高峰展开。而企业间竞争,都在力图确保自己留在牌桌上,不被时代甩后。
正如战争一样,不能仅凭热血和口号,但使用落后武器装备去攻占战略高地,我们应利用一切可获优势资源确保战争胜利。
在通讯行业、电力行业、大基建行业,正是由于我们市场规模大、终端产业繁荣,一步步倒逼上游技术突破与产品创新,最终在全行业上下游实现各环节突破。
在AI产业竞争中,首先要确保在竞争中留在牌桌上、甚至成为最领先的佼佼者。正如一次次案例说明、也如经济学规律揭示,只要AI产业我们处于世界领先水平,其所引领趋势、提供的丰富场景和明确需求、以及最重要的资本与人才、行业know-how积累,最终都会推动我们的AI芯片、算力系统取得突破,这只是时间问题。
不过,网络上有句流传很广的话:成年人不做选择,我都要。
作为一个超大规模经济体的中国,在行业丰富度、产业协同度和资本积累程度上,当前基本具备“都要”的实力。也就是说,在市场化经营下,既有着使用世界顶级算力设施冲顶的基础与必要性,也有着扶持AI国产算力所需的资源与意愿。
努力奋斗的目的,正是为争取更多选择空间,于个人、于国家,皆如是。
经过各领域国人同胞们多年不懈奋斗与多方面积累,我们身处产业变革与飞速发展时代,这是理性者的福音,是魄力者的机遇,更是每一个普通奋斗者可能的逆袭之路。
(本文作者姚金鑫(J叔)为芯片创业者,CCF高性能计算专委会执行委员)
本文由主机测评网于2026-01-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114309.html