2025年,随着谷歌启动“捕日计划”和OpenAI开启“星际之门”,全球AI产业似乎正朝着“云端算力至上”狂奔。然而,一场静默的变革正在终端设备上悄然发生。
5月,OpenAI以65亿美元收购苹果前首席设计官Jony Ive创立的AI硬件公司io,计划于2026年底推出首款无屏幕AI硬件产品;11月,马斯克预言未来5-6年内传统手机将消失,取而代之的是仅作为“AI推理边缘节点”的设备;12月,字节跳动试水豆包AI手机,引发广泛关注。
大模型的战火从云端算力的“正面战场”,蔓延至亿万个终端设备的“毛细血管”,一场关乎AI未来格局的端侧竞速也正式拉开帷幕。
计算技术的发展并非线性前进,而是由范式转换所驱动:
冯・诺依曼的“存储程序”理论为通用计算奠定了技术基础;ENIAC电子计算机的诞生开启了通用计算时代,以CPU为核心的计算解决了“计算有无”的问题;英伟达CUDA架构将GPU从图形渲染推向通用计算领域,提升了并行计算能力;AlexNet模型将ImageNet图像识别错误率降低,宣告深度学习时代开启;生成式AI的突破推动加速计算迈向新高度。
大模型对并行处理能力和海量数据吞吐有极致需求,对算力和带宽提出更高要求。云端AI芯片发展加速,云端训练与端侧部署形成协同生态:云端负责大模型训练、全局决策和知识管理,端侧承担主动感知、实施决策和用户交互等功能。
云端算力从CPU主导的通用计算转变为GPU为核心的智能计算。根据国际TOP500组织数据,2019年TOP500超级计算机中近90%算力依赖CPU,到2025年这一数字急剧下降至不足15%。六年时间完成Intel和英伟达算力霸主地位的交接。
AI的终极价值在于对现实世界的改造能力。云端模型部署的高延迟和高成本使其难以适配工业、消费等端侧场景,模型蒸馏技术应运而生。该技术将千亿级模型压缩至百亿或十亿级,大幅缩减模型尺寸和计算复杂度,使其能够部署在多种端边侧场景中。
弗若斯特沙利文预测,2029年全球端侧AI市场规模将增至1.2万亿元,复合年增长率高达39.6%。中国端侧AI市场预计2029年实现3077亿元,复合年增长率高达39.9%。政策支持与市场需求共振,推动国内端侧AI市场规模快速增长。
云端大模型已出现“杀手级应用”,如ChatGPT的周活跃用户已达8亿。而端侧大模型的Killer App目前还在路上。核心在于端侧功耗和成本的限制以及模型量化、压缩能力的迭代。
端侧计算范式是否会延续云端以AI算力芯片为主导、CPU为辅助的新格局?随着大模型在端侧的广泛应用,AI化体验的用户诉求不可逆转,数据传输的物理上限不可破。因此,端侧计算架构的变革是技术演进与现实需求共同作用的必然结果。
1.模型“瘦身”落地加速
MoE架构和模型压缩技术让大模型在保持性能的同时实现“瘦身”,为端侧部署扫清障碍。华为CBQ量化算法将模型压缩至原体积1/7,性能保留99%。
2.端侧算力需求激增
多模态大模型的广泛应用要求同时处理视觉和文本数据,算力需求大幅攀升。
3.端侧算力供给大幅跃迁
需求的增长刺激算力供给,端侧NPU算力首次超过100TOPS,预计将继续向高算力、高带宽、低功耗方向演进。
1.端侧SOC芯片:提供通用基础型解决方案
以ARM CPU为核心,集成轻量级NPU,主打“性价比+通用性”。主要应用在智能音箱、定制平板设备等场景。
2.端侧NPU:提供极致性能解决方案
NPU逐渐成为主流,独立NPU(dNPU)是追求极致AI性能的表现。
1.端侧ARM+NPU镜像云端X86+GPGPU
端侧计算将逐渐从CPU计算为主向AI计算为主迁移。dNPU将取代GPGPU的位置,嵌入各种复杂的AI计算。
2.端侧算力分层
低算力场景:SOC集成iNPU是最优解决方案。
中算力场景:独立dNPU是最优方案。
高算力场景:追求极致表现和未来迭代需求时,dNPU方案是最优解。
初级形态:联网节点,设备能联网但算力不足。
二级形态:交互入口,具备基本感知能力但重度依赖云端。
三级形态:推理节点,具备多模态感知和单场景决策能力。
四级形态:自主智能体,跃升为生活和工作助理。
终极形态:目前无法预估的未来。
端侧AI的崛起是技术发展的必然。未来五年,所有终端都将经历大模型的洗礼与蜕变。端侧AI将从高端走向普及,开启“人人可用、万物智能”的时代。
本文由主机测评网于2026-05-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545714.html