当前位置:首页 > 科技资讯 > 正文

高通发布AI200及AI250数据中心芯片,加速AI推理市场布局

高通发布AI200及AI250数据中心芯片,加速AI推理市场布局 AI推理芯片  数据中心 高通 人工智能 第1张

在10月27日晚间,高通公司正式发布了AI200和AI250两款针对数据中心的人工智能芯片,同时推出了相应的加速卡和机架级解决方案。据悉,这两款芯片计划分别于2026年和2027年投入商用。

这是高通继2019年推出Cloud AI 100和2023年发布Cloud AI 100 Ultra之后,再次推出的数据中心AI推理新产品。

消息公布当天,高通股价大幅上涨,盘中一度飙升22%至205美元,这是自2024年6月下旬以来的最高股价。最终收盘价为每股188美元,涨幅为11.09%。包括摩根大通、美银证券、TD Cowen在内的多家投行更新了对高通的评级,并维持买入建议,最高目标价看至200美元。

同日,高通还宣布将与沙特阿拉伯的人工智能企业“HUMAIN”合作,共同推进AI200和AI250的落地应用。

随着人工智能应用需求的急剧增长,市场对AI推理芯片的需求也随之上升。今年,英伟达、谷歌、华为等公司均已公布了AI推理芯片新品。面向AI推理的广阔市场,各家厂商不仅比拼技术能力,更在加速市场布局。

对高通而言,此次发力AI推理不仅是进入热门领域,也是推进其数据中心业务布局的重要一步。近年来,高通多次公开表示对数据中心市场的兴趣,除了AI推理芯片,还在数据中心CPU等方向进行了产品布局。

在宣布AI200及AI250发布的新闻稿中,高通写道:公司致力于制定按年推进的数据中心路线图,专注于提供行业领先的AI推理性能、能源效率及总拥有成本(TCO)。

跻身2025数据中心推理芯片竞速赛道

“AI推理”指的是经过训练的模型在部署后,对新输入数据进行逻辑推导与预测。与之相对的是“AI训练”,即模型通过分析庞大数据集学习模式与关系。

在实际应用中,AI训练与推理芯片之间没有严格界限,但相比训练场景要求芯片具备强大的并行计算能力,推理场景更强调芯片的能效、时延、成本等综合性能。本次发布的高通新品同样注重在总拥有成本(TCO)和性能之间取得平衡。

据官方信息,AI200及AI250基于高通NPU技术。其中,基于AI200的机架级AI推理解决方案支持每张卡768GB的LPDDR内存,以提高内存容量并降低成本;而AI250解决方案将首次使用基于近内存计算的创新内存架构,有效提升内存带宽并降低功耗。

此外,两种机架解决方案均采用直接液冷散热方案,使用PCIe进行纵向扩展,以太网进行横向扩展,并采用机密计算以确保AI工作负载的安全,单机架功耗为160kW。

高通发布AI200及AI250数据中心芯片,加速AI推理市场布局 AI推理芯片  数据中心 高通 人工智能 第2张

高通此时发布新品,旨在抓住AI推理市场爆发的关键时间窗口。

今年以来,AI推理市场动态频繁。例如9月份,AI推理初创公司Groq宣布完成7.5亿美元新融资,并计划建设“全球最大推理数据中心”。

同样在9月,OpenAI与甲骨文合作的消息广为流传,据称OpenAI将在5年内从甲骨文采购超过3000亿美元的推理算力——这是有史以来披露的最大云计算合同。消息一出,甲骨文股价一度大幅上涨,单日最大涨幅超过36%。

根据巴克莱银行研究机构的预测,到2026年,AI推理计算需求将占通用人工智能总计算需求的70%以上,推理计算需求甚至可能超过训练计算需求,达到后者的4.5倍;而现有芯片资源可能难以满足这一需求,需要增加当前预测4倍的芯片资本支出,总额可能接近3000亿美元。

面对巨大的需求缺口,包括高通在内的许多厂商正在积极准备。

今年4月,谷歌在Google Cloud Next 25大会上发布了TPU芯片“Ironwood”,号称是首个专门为大规模AI推理设计的TPU加速器。

9月,英伟达发布了针对AI视频生成和软件开发等大规模上下文处理任务的“RubinCPX” GPU。该GPU基于Rubin架构,能够在计算密集型的上下文推理阶段实现突破性性能,计划于2026年底上市。

同样在9月华为全联接大会上,昇腾多系列新品亮相,其中“950PR”将于2026年第一季度推出,着力提升推理Prefill性能。

换句话说,从2026年开始,高通将与英伟达、谷歌、华为等企业在AI推理赛场上同台竞技。以巴克莱预测的3000亿美元资本支出计算,即使占据1%的市场份额,对高通来说也是显著的营收增长。

“重返”数据中心市场,发掘业绩新引擎

高通并未透露AI200和AI250所采用的制程及基本架构方案,但考虑到AI100是ASIC而非GPU,新款产品可能也采用了ASIC基础架构。ASIC(专用集成电路)是为特定任务设计的全定制芯片,相比GPU在能效方面表现更优。

尽管在6年内推出了多款AI推理芯片,高通AI推理业务贡献的营收几乎可以忽略不计。

7月底公布的截至6月30日的2025第三财季业绩报告显示,高通QCT半导体业务该季营收为89.93亿美元,主要来自手机芯片、汽车芯片和物联网业务;QTL技术授权板块营收为13.18亿美元。

过去多年,高通曾多次尝试开发数据中心产品,但成效有限。2018年,高通服务器芯片负责人Anand Chandrasekher宣布离职,并传出整个服务器部门裁员50%的消息,被市场解读为高通已放弃这一业务。

直到2024年,高通CEO Cristiano Amon在Computex 2024展会上接受采访时确认,高通将重返数据中心市场,并从2025年开始推进产品动作。

2025年5月,高通表示计划采用英伟达技术定制生产数据中心CPU,用以搭配和连接英伟达GPU使用,助力英伟达GPU实现更快速的通信。

6月,高通宣布其间接全资子公司Aqua Acquisition Sub LLC将以24亿美元收购半导体IP企业Alphawave,后者的优势在于拥有高端接口IP,能够增强高通在数据中心市场的竞争力。此收购预计在2026年第一季度完成。

此外,高通近日宣布与沙特阿拉伯的HUMAIN合作,HUMAIN正在开发阿拉伯语多模态大语言模型(ALLaM),并计划将其与高通的边缘设备生态深度集成,形成从芯片到应用的完整技术闭环。

在与沙特阿拉伯公司HUMAIN的合作中,高通将为该项目提供“全球人工智能推理服务”,使之成为世界上首个完全优化的边缘到云混合人工智能项目,使沙特阿拉伯成为全球人工智能中心。

高通发布AI200及AI250数据中心芯片,加速AI推理市场布局 AI推理芯片  数据中心 高通 人工智能 第3张

左-HUMAIN CEO Tareq Amin;右-高通CEO Cristiano Amon

尽管布局节奏紧凑,数据中心板块为高通贡献营收仍需时间。

7月底的2025第三财季业绩说明会上,高通总裁兼CEO Cristiano Amon表示,公司正积极拓展AI芯片布局,已经与一家超大规模云端服务供应商展开深入洽谈,最快将于2028会计年度开始贡献数据中心相关营收。

除了AI,高通也在极力推进产品在智慧驾驶、物联网等多元化场景的落地。

考虑到苹果与高通的基带购买协议将于2026年末到期,而苹果是高通营收占比约20%的单一大客户,“能否在苹果‘撤出’后培育新的营收支柱?”将是市场亟待高通解答的命题。