行业预测显示,到2030年,AI推理任务将统领AI计算市场,占据约80%的份额,而那些专注于极致推理效率的专用芯片,将迎来更具爆发力的增长周期。
随着大模型产业重心从大规模预训练转向实际应用落地,业界普遍认为,2026年全球对于AI推理的需求量将正式超越训练场景。
在最近的行业动态中,全球算力巨头英伟达投入200亿美元(约合1400亿元人民币)巨资,成功获取了AI推理领军企业Groq的核心技术授权,并将其顶尖技术团队收编,以此补全其在推理算力领域的战略拼图。
在近期的深度采访中,曦望董事长徐冰向《科创板日报》记者表示,至2030年,AI推理在整体AI计算市场的占比预计将达到80%。他判断,聚焦于极致推理性能的AI芯片未来将呈现更强的爆发潜力,并对现有的算力格局产生深远冲击。
此外,多位AI芯片产业链资深人士也指出,未来推理请求的规模与并发数量将呈指数级增长,对算力的需求将迎来爆发式跳跃。
“当前我们正处于以智能体(Agent)为核心的AI新应用爆发前夜,未来推理端的请求量与高并发需求将推动算力需求呈指数级攀升。”一位业内专家告诉《科创板日报》记者,“伴随推理范式的演进,AI智能体的加速普及将带动算力消耗量达到同等规模大模型的10倍以上,推动算力需求实现量级跃迁。”
目前,全球算力领航者英伟达正稳步推进从训练向推理市场的战略转型。其对Groq的技术授权收购,不仅是其史上规模最大的动作之一,也彰显了其对推理市场的重视。
作为专注极致推理的初创企业,Groq由谷歌TPU原班核心成员创立,其打造的LPU(语言处理单元)架构曾宣称推理效能是英伟达H100 GPU的10倍,而运营成本仅为其十分之一。
与此同时,诸如Etched.ai等美国企业也纷纷投身极致推理芯片赛道。这些公司的核心理念在于:随着大模型架构逐渐趋同,放弃通用训练GPU而转向研发更高效的专用推理芯片已成为必然趋势。
在国内市场,国产力量也在该领域积极布局。
近日,从商汤科技独立运营的AI芯片新势力——曦望(Sunrise),发布了专为大模型推理优化的GPGPU芯片“启望 S3”。在DeepSeek V3/R1满血版等主流模型测试中,S3的单位Token推理成本较前代产品大幅降低了90%。曦望的远期目标是将百万Token的推理成本压缩至1分钱,并联合商汤、第四范式等伙伴共同发起了“百万Token一分钱”计划。
曦望联席CEO王勇指出,AI训练芯片赛道已进入巨头博弈的收敛期。
“目前市场格局已非常清晰,具备预训练能力的头部厂商寥寥无几。然而推理赛道依然百花齐放,无论是AI智能体、具身智能还是世界模型,都离不开高效推理芯片的支持。如果能提供极致性价比的算力,就能在下一代AI生态中占据战略高地。”
从竞争格局看,不同于英伟达在训练端的垄断地位,推理端由于对成本与能效的严苛要求,呈现出技术路线多元化的特征,这为国产AI芯片厂商提供了弯道超车的历史机遇。
谈及国产芯片的市场前景,曦望联席CEO王湛充满信心。他认为,虽然英伟达市值已达4万亿美金,但中国市场未来也有望孕育出多家市值达千亿甚至万亿人民币规模的GPU领军企业。
“与美国市场不同,中国AI产业具备鲜明的地域化特征。国内各GPU厂商在各自的区域市场展现出较强的渗透力。互联网巨头在自研的同时也在大量采购国产算力。即便中国企业的总市值难以比肩英伟达,但在数万亿人民币的市场中,增长空间依然极其广阔。”
针对当前AI产业链估值过高的担忧,王湛分享了不同看法。他对比了当年的互联网泡沫:“当年的泡沫源于缺乏实际用户基础,而如今AI应用的月活用户已轻松破亿,其渗透速度与行业影响深度远超当年的互联网潮。”
眼下,百度、腾讯及阿里等巨头正计划在春节期间通过红包活动力推AI应用。花旗银行分析认为,春节社交高峰是互联网产品引流的黄金期,这将显著加速中国AI应用的普及进程。
王湛同样看好这一契机:“从红包促销到机器人登上春晚舞台,春节过后,国内AI的渗透率和使用率将迎来质的飞跃,这代表着整个产业价值的重估。”
在目前的产业结构中,底层芯片分走了大部分蛋糕。徐冰表示,AI芯片目前占据了行业70%甚至90%的价值,而在未来的AGI(通用人工智能)时代,这一核心地位依然稳固。
“想象一下,当机器人数量超过人类,它们需要7×24小时不间断地进行多模态推理。这种无上限的需求将促使我们构建一个普惠的推理算力网络,让高效的算力服务于每一个终端、每一家企业以及每一位消费者。”
本文由主机测评网于2026-04-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260434532.html