当前位置:首页 > 科技资讯 > 正文

端侧AI崛起:重塑智能时代版图

端侧AI崛起:重塑智能时代版图 端侧AI 算力 NPU 智能设备 第1张

2025年,随着谷歌启动“捕日计划”和OpenAI开启“星际之门”,全球AI产业似乎正朝着“云端算力至上”狂奔。然而,一场静默的变革正在终端设备上悄然发生。

5月,OpenAI以65亿美元收购苹果前首席设计官Jony Ive创立的AI硬件公司io,计划于2026年底推出首款无屏幕AI硬件产品;11月,马斯克预言未来5-6年内传统手机将消失,取而代之的是仅作为“AI推理边缘节点”的设备;12月,字节跳动试水豆包AI手机,引发广泛关注。

大模型的战火从云端算力的“正面战场”,蔓延至亿万个终端设备的“毛细血管”,一场关乎AI未来格局的端侧竞速也正式拉开帷幕。

01. 计算技术进化:算力霸主地位交接

计算技术的发展并非线性前进,而是由范式转换所驱动:

冯・诺依曼的“存储程序”理论为通用计算奠定了技术基础;ENIAC电子计算机的诞生开启了通用计算时代,以CPU为核心的计算解决了“计算有无”的问题;英伟达CUDA架构将GPU从图形渲染推向通用计算领域,提升了并行计算能力;AlexNet模型将ImageNet图像识别错误率降低,宣告深度学习时代开启;生成式AI的突破推动加速计算迈向新高度。

大模型对并行处理能力和海量数据吞吐有极致需求,对算力和带宽提出更高要求。云端AI芯片发展加速,云端训练与端侧部署形成协同生态:云端负责大模型训练、全局决策和知识管理,端侧承担主动感知、实施决策和用户交互等功能。

云端算力从CPU主导的通用计算转变为GPU为核心的智能计算。根据国际TOP500组织数据,2019年TOP500超级计算机中近90%算力依赖CPU,到2025年这一数字急剧下降至不足15%。六年时间完成Intel和英伟达算力霸主地位的交接。

02. 端侧成为人工智能发展新战场

AI的终极价值在于对现实世界的改造能力。云端模型部署的高延迟和高成本使其难以适配工业、消费等端侧场景,模型蒸馏技术应运而生。该技术将千亿级模型压缩至百亿或十亿级,大幅缩减模型尺寸和计算复杂度,使其能够部署在多种端边侧场景中。

弗若斯特沙利文预测,2029年全球端侧AI市场规模将增至1.2万亿元,复合年增长率高达39.6%。中国端侧AI市场预计2029年实现3077亿元,复合年增长率高达39.9%。政策支持与市场需求共振,推动国内端侧AI市场规模快速增长。

03. 大模型下沉:与端侧算力双向奔赴

云端大模型已出现“杀手级应用”,如ChatGPT的周活跃用户已达8亿。而端侧大模型的Killer App目前还在路上。核心在于端侧功耗和成本的限制以及模型量化、压缩能力的迭代。

云端CPU到GPU的霸权交替是否会延续到端侧?

端侧计算范式是否会延续云端以AI算力芯片为主导、CPU为辅助的新格局?随着大模型在端侧的广泛应用,AI化体验的用户诉求不可逆转,数据传输的物理上限不可破。因此,端侧计算架构的变革是技术演进与现实需求共同作用的必然结果。

端侧复制:模型与算力的共生进化

1.模型“瘦身”落地加速

MoE架构和模型压缩技术让大模型在保持性能的同时实现“瘦身”,为端侧部署扫清障碍。华为CBQ量化算法将模型压缩至原体积1/7,性能保留99%。

2.端侧算力需求激增

多模态大模型的广泛应用要求同时处理视觉和文本数据,算力需求大幅攀升。

3.端侧算力供给大幅跃迁

需求的增长刺激算力供给,端侧NPU算力首次超过100TOPS,预计将继续向高算力、高带宽、低功耗方向演进。

04. 当前:SOC+NPU协同发展

1.端侧SOC芯片:提供通用基础型解决方案

以ARM CPU为核心,集成轻量级NPU,主打“性价比+通用性”。主要应用在智能音箱、定制平板设备等场景。

2.端侧NPU:提供极致性能解决方案

NPU逐渐成为主流,独立NPU(dNPU)是追求极致AI性能的表现。

05. 未来:dNPU主导的新范式

1.端侧ARM+NPU镜像云端X86+GPGPU

端侧计算将逐渐从CPU计算为主向AI计算为主迁移。dNPU将取代GPGPU的位置,嵌入各种复杂的AI计算。

2.端侧算力分层

低算力场景:SOC集成iNPU是最优解决方案。
中算力场景:独立dNPU是最优方案。
高算力场景:追求极致表现和未来迭代需求时,dNPU方案是最优解。

06. 场景革命:重构生活与工作的智能体验

初级形态:联网节点,设备能联网但算力不足。
二级形态:交互入口,具备基本感知能力但重度依赖云端。
三级形态:推理节点,具备多模态感知和单场景决策能力。
四级形态:自主智能体,跃升为生活和工作助理。
终极形态:目前无法预估的未来。

结语:定义智能时代的终极形态

端侧AI的崛起是技术发展的必然。未来五年,所有终端都将经历大模型的洗礼与蜕变。端侧AI将从高端走向普及,开启“人人可用、万物智能”的时代。