当前位置：首页 > 科技资讯 > 正文

AI新纪元：云端与端侧计算的双轨并行

参观完刚刚落幕的WAIC 2025（世界人工智能大会）的H1馆，你会发现今年中国算力领域的焦点莫过于“超节点”与端侧AI芯片。

这恰恰印证了一个事实：随着AI大模型的蓬勃发展，算力正呈现两极分化趋势。

一方面，大模型训练已成为刚需，云端算力亟待扩展。国产云端算力的持续向上求索，正是得益于“超节点”的支持。在WAIC上，华为及多家云端AI芯片公司展示了令人惊叹的计算“超节点”。

另一方面，AI在各行各业中的落地应用日益广泛，特别是Deepseek的火爆，使得生成式AI的计算需求大幅降低，推动了端边侧应用的兴起。WAIC上，多家公司展示了小巧玲珑的端侧AI芯片及其相关智能硬件。

未来，生成式AI计算将是云端与端边计算的完美结合。后摩智能CEO吴强预测，未来生成式AI推理计算中，约90%的数据处理将在端侧和边侧进行，仅10%的复杂推理任务需上云。

过去两年，云端市场的繁荣让英伟达市值飙升6倍，公司价值突破四万亿美金。而端边侧市场正逐渐开启蓝海时代，孕育着“下一个英伟达”的机会。端边侧市场潜力巨大，能容纳更多玩家。

后摩智能正是其中的佼佼者。吴强曾深耕于高能效比芯片及分布式计算领域，在英特尔、AMD及Facebook工作后，回国加入地平线。4年前，他开启芯片创业之旅，创办后摩智能。其战略清晰，以存算一体为核心技术，直击端边大模型计算的最后一公里。

那么，为何选择存算一体作为核心技术？这一技术将如何改变AI计算？

经典的冯诺依曼架构面临“内存墙”和“功耗墙”问题愈发严峻。随着大模型参数量激增，数据搬运耗能甚至超过计算本身。对此，行业人士戏称，“未来AI的尽头是能源”。而存算一体正是解决这一问题的关键。

AI新纪元：云端与端侧计算的双轨并行超节点端侧AI芯片存算一体后摩智能第1张

后摩智能创始人兼CEO吴强在WAIC 2025上发布后摩漫界M50

在AI处理器架构层面，M50采用了自研的“天璇架构”IPU，使浮点模型在存算一体架构中直接运行，提升应用效率。同时，为降低客户使用门槛，M50配备了新一代编译器工具链“后摩大道”，支持主流深度学习框架。

M50的产品性能卓越，实现160 TOPS@INT8、100 TFLOPS@bFP16的物理算力，搭配最大48GB内存与153.6GB/s的超高带宽，典型功耗仅10W。这一性能指标意味着平板/PC、智能语音设备、机器人等智能移动终端无需依赖云端即可高效运行大模型。

AI新纪元：云端与端侧计算的双轨并行超节点端侧AI芯片存算一体后摩智能第2张

后摩漫界M50

吴强表示，端边侧AI特点为分散且极致。因此，M50系列还采用原方案+AI模式，适配X86、ARM等主流处理器架构，满足多元化边端需求。

在产品明确后，后摩智能的商业化进程迅速推进。吴强透露，目前已有多个标杆性意向客户，包括联想的AI PC产品、讯飞听见的智能语音设备以及中国移动的5G+AI应用。

在长达两个小时的访谈中，吴强坦诚分享了后摩智能的创业历程、从科学家到创业者的转变经历以及对AI热潮下端侧芯片和存算一体技术机遇的看法。

从科学家到创业者：迎接大模型风口

36氪：后摩最初聚焦智能驾驶市场，现转向通用端边侧大模型应用。这一转型背后有何思考和策略？

吴强：从创业之初便确定用存算一体技术做更高效AI芯片。但应用场景一直在探索中改变。起初选择智能驾驶芯片是因特斯拉引领了软件定义汽车潮流。然而，2023年下半年发现这条路有些走不通。

一方面赛道竞争激烈；另一方面，第一代产品算力过大导致成本高。

我们尝试在二代产品中降低算力以提升性价比，但智驾芯片市场格局已渐形成。最终决定转型并关注到大模型计算契合存算一体技术路线。

36氪：贵司有几个意向客户如联想、讯飞听见和中国移动。未来会拓展哪些场景？

吴强：我们专注于通用端边大模型AI芯片。目前重点布局平板、电脑等消费终端、智能语音系统及运营商边缘计算等领域。

36氪：存算一体技术前沿且处于探索阶段。行业有何共识与非共识？

吴强：主流AI芯片公司开始谈论存算一体。国家和政府也重视此技术方向。但行业对产品化路径有不同理解。

36氪：存算一体技术化过程中面临哪些挑战？

吴强：需突破电路设计、解决工程问题并设计AI处理器架构及软件编译器。

本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260438965.html