当前位置:首页 > 科技资讯 > 正文

AI新纪元:云端与端侧计算的双轨并行

参观完刚刚落幕的WAIC 2025(世界人工智能大会)的H1馆,你会发现今年中国算力领域的焦点莫过于“超节点”与端侧AI芯片。

这恰恰印证了一个事实:随着AI大模型的蓬勃发展,算力正呈现两极分化趋势。

一方面,大模型训练已成为刚需,云端算力亟待扩展。国产云端算力的持续向上求索,正是得益于“超节点”的支持。在WAIC上,华为及多家云端AI芯片公司展示了令人惊叹的计算“超节点”。

另一方面,AI在各行各业中的落地应用日益广泛,特别是Deepseek的火爆,使得生成式AI的计算需求大幅降低,推动了端边侧应用的兴起。WAIC上,多家公司展示了小巧玲珑的端侧AI芯片及其相关智能硬件。

未来,生成式AI计算将是云端与端边计算的完美结合。后摩智能CEO吴强预测,未来生成式AI推理计算中,约90%的数据处理将在端侧和边侧进行,仅10%的复杂推理任务需上云。

过去两年,云端市场的繁荣让英伟达市值飙升6倍,公司价值突破四万亿美金。而端边侧市场正逐渐开启蓝海时代,孕育着“下一个英伟达”的机会。端边侧市场潜力巨大,能容纳更多玩家。

后摩智能正是其中的佼佼者。吴强曾深耕于高能效比芯片及分布式计算领域,在英特尔、AMD及Facebook工作后,回国加入地平线。4年前,他开启芯片创业之旅,创办后摩智能。其战略清晰,以存算一体为核心技术,直击端边大模型计算的最后一公里。

那么,为何选择存算一体作为核心技术?这一技术将如何改变AI计算?

经典的冯诺依曼架构面临“内存墙”和“功耗墙”问题愈发严峻。随着大模型参数量激增,数据搬运耗能甚至超过计算本身。对此,行业人士戏称,“未来AI的尽头是能源”。而存算一体正是解决这一问题的关键。

AI新纪元:云端与端侧计算的双轨并行 超节点 端侧AI芯片 存算一体 后摩智能 第1张

后摩智能创始人兼CEO吴强在WAIC 2025上发布后摩漫界M50

在AI处理器架构层面,M50采用了自研的“天璇架构”IPU,使浮点模型在存算一体架构中直接运行,提升应用效率。同时,为降低客户使用门槛,M50配备了新一代编译器工具链“后摩大道”,支持主流深度学习框架。

M50的产品性能卓越,实现160 TOPS@INT8、100 TFLOPS@bFP16的物理算力,搭配最大48GB内存与153.6GB/s的超高带宽,典型功耗仅10W。这一性能指标意味着平板/PC、智能语音设备、机器人等智能移动终端无需依赖云端即可高效运行大模型。

AI新纪元:云端与端侧计算的双轨并行 超节点 端侧AI芯片 存算一体 后摩智能 第2张

后摩漫界M50

吴强表示,端边侧AI特点为分散且极致。因此,M50系列还采用原方案+AI模式,适配X86、ARM等主流处理器架构,满足多元化边端需求。

在产品明确后,后摩智能的商业化进程迅速推进。吴强透露,目前已有多个标杆性意向客户,包括联想的AI PC产品、讯飞听见的智能语音设备以及中国移动的5G+AI应用。

在长达两个小时的访谈中,吴强坦诚分享了后摩智能的创业历程、从科学家到创业者的转变经历以及对AI热潮下端侧芯片和存算一体技术机遇的看法。

从科学家到创业者:迎接大模型风口

36氪:后摩最初聚焦智能驾驶市场,现转向通用端边侧大模型应用。这一转型背后有何思考和策略?

吴强:从创业之初便确定用存算一体技术做更高效AI芯片。但应用场景一直在探索中改变。起初选择智能驾驶芯片是因特斯拉引领了软件定义汽车潮流。然而,2023年下半年发现这条路有些走不通。

一方面赛道竞争激烈;另一方面,第一代产品算力过大导致成本高。

我们尝试在二代产品中降低算力以提升性价比,但智驾芯片市场格局已渐形成。最终决定转型并关注到大模型计算契合存算一体技术路线。

36氪:贵司有几个意向客户如联想、讯飞听见和中国移动。未来会拓展哪些场景?

吴强:我们专注于通用端边大模型AI芯片。目前重点布局平板、电脑等消费终端、智能语音系统及运营商边缘计算等领域。

存算一体:从冷板凳到百花齐放

36氪:存算一体技术前沿且处于探索阶段。行业有何共识与非共识?

吴强:主流AI芯片公司开始谈论存算一体。国家和政府也重视此技术方向。但行业对产品化路径有不同理解。

36氪:存算一体技术化过程中面临哪些挑战?

吴强:需突破电路设计、解决工程问题并设计AI处理器架构及软件编译器。