当前位置:首页 > 科技资讯 > 正文

无问芯穹:破解中国算力落地难题的生态实践

无问芯穹:破解中国算力落地难题的生态实践 算力运营 智算中心 异构计算 AI基础设施 第1张

在人工智能浪潮中,大模型训练的蓬勃发展使算力成为像石油一样稀缺的战略资源。

2023年至2024年间,智算中心一跃成为“新基建”的核心主题。据统计,截至2024年9月,我国算力总规模已达到246 EFLOPS,智能算力同比增长超过65%,各行业算力应用项目数量突破1.3万个。然而,与智算中心建设的热潮形成强烈反差的是,其实际运营状况令人担忧,平均机柜利用率仅为20%至30%,部分企业级中心甚至低至10%。

“量”的扩张并未伴随“质”的提升,面对中国算力应用滞后的挑战,半导体产业纵横专访了无问芯穹生态总监张帅,深入探索该公司应对这一困境的突破策略与实施路径。

 01算力资源充裕,但应用效率低下

评价智算中心算力使用情况,上架率和点亮率是两个重要指标。上架率衡量设备是否安装上架并通电可运行,而点亮率则关注设备是否真正执行计算任务并服务于业务。根据中国信通院报告,全国已投入运营的智算中心,整体算力利用率仅为32%。

4月16日,关于地方发展改革委开展算力摸底工作的信息开始流传。据悉,多地即将下发算力摸底通知,涉及已建、在建和拟建的算力中心项目,摸底数据将成为国家统筹算力资源布局的关键依据。报道称,相关部门此举旨在从高层进行统一规划,避免各地盲目重复建设。业内专家认为,监管的最新动向反映出行业面临的供需失衡、资源错配等结构性矛盾。下一步,算力基础设施建设将进入提质增效的新阶段。

深入观察国内算力市场,三个层面的问题格外突出:

第一,优质算力供给不足,众多企业难以获得符合业务需求的算力资源。大多数智算中心规模在1000P(1P算力代表每秒一千万亿次计算)左右,由分散的社会资本投资建设,这些资本缺乏行业认知,很难精准对接需求方。

第二,使用门槛较高。找不到、用不起算力,是当前创业公司普遍面临的难题。部分公司即使找到算力,面对复杂的硬件设施,也无法有效利用。

第三,国产芯片生态呈现割裂状态。国内AI基础设施特点是多模型和多芯片共存,存在大量异构算力,不同厂商的芯片架构和指令集互不兼容,导致算力资源无法高效流动。由于生态尚不成熟,一些国产芯片难以被企业采用。

因此,今年智算中心出现了一种新现象:人工智能企业遭遇“算力荒”,而智算中心却在依靠“卖卡”维持生存。在“多芯片”不等于“大算力”的现实下,无问芯穹切入算力赛道。

 02清华团队的“理想主义”探索

2023年5月,清华大学电子工程系教授汪玉作为发起人,与其博士生夏立雪、戴国浩等人联合创立了无问芯穹。这家公司的诞生,带有鲜明的清华基因——汪玉是IEEE会士、清华大学电子工程系主任,也是AI芯片公司深鉴科技的联合创始人之一,后者于2018年被赛灵思收购。夏立雪本科和博士均毕业于清华电子系,研究方向聚焦于AI芯片与算法协同优化。联合创始人颜深根曾担任商汤科技数据与计算平台部执行研究总监,主导搭建过万卡集群,现任清华大学副研究员。这种纯正的清华背景让无问芯穹初创阶段就赢得资本市场青睐。成立不到两年,公司已完成近10亿元融资,投资方包括红杉中国、百度、智谱AI、启明创投、君联资本等知名机构。在AI算力这一硬科技领域,这样的融资速度和规模实属罕见。

资本认可的不仅是无问芯穹的出身,更是其宏大抱负。

无问芯穹将自身定义为大模型时代的“算力运营商”。核心目标直指中国算力市场的痛点:在英伟达CUDA生态占据主导的背景下,国产芯片厂商各自为战,开发者每更换硬件都需要重新适配代码,这种生态割裂严重制约了国产算力的实际价值。

无论是国产卡还是英伟达卡,对用户而言,能高效完成任务的才是好算力。针对这一现状,无问芯穹构建了以“M×N”为特征的算力网络,将全局的异构、异域、异属算力汇聚成一张“智能感知、实时发现、随需获取”的云端算力网,不仅实现连接,还能高效调度、迁移和精准匹配。在技术实现上,无问芯穹采取双策略:一是通过统一中间层屏蔽硬件差异,让开发者无需关注底层芯片;二是针对大模型训练、推理等场景优化国产芯片性能,将使用体验差距压缩到可接受范围。

这一技术理念在第二十届研电赛中得到验证。作为命题企业,无问芯穹设置了“端侧/云侧协同应用电子设计挑战赛”,吸引了25支高校团队参与。最终入围作品涵盖端侧AI加速器、机器人控制框架、智能检测等多个领域,展现了年轻开发者在技术深度和应用广度上的双重突破。“我们希望通过产学研用协同机制,缩短科研成果产业化的周期。”无问芯穹生态总监张帅表示。在比赛中,公司不仅提供真实产业命题,还将企业技术需求直接反馈给高校团队。“通过联合培养既懂算法又懂硬件的复合型人才,共同构建从底层芯片到上层应用的完整AI基础设施生态,加速人工智能技术在各行各业的规模化落地。”

 03三大“盒子”的战略野心

无问芯穹作为一家成立仅两年多的初创公司,正处于产品打磨和商业化早期阶段,以云端结合方式推进业务。在谈及无问芯穹如何通过技术与生态布局保持竞争力时,生态总监张帅强调了三个关键指标:“易用性、稳定性和性价比。”

2025世界人工智能大会上,无问芯穹推出了全规模AI效能跃升方案的三大核心产品,被形象地称为“三个盒子”。这些产品覆盖从万卡至十万卡全局算力网络的“无穹AI云”,到服务百卡至千卡级大型智算集群的“无界智算平台”,再到服务单卡至十卡级有限算力终端的“无垠终端智能”解决方案,旨在在单卡至十万卡的全规模软硬件场景中,充分释放每一份算力的潜能。

大盒子:无穹AI云

无穹AI云的底层是一张深度覆盖全国的广域算力网,基于无问芯穹“一网三异”调度架构,目前已成功覆盖“东数西算”国家战略关键节点,汇聚了来自26个省市、53个核心数据中心的庞大算力资源,整合超过15种主流芯片架构的异构算力池,总算力规模超25000P。依托强大的广域高性能专线内网互联,用户能够按需在不同地域、不同型号的算力资源之间实时切换与无缝迁移,充分体现了“易用性”与“稳定性”的设计理念。

中盒子:无界智算平台

“中盒子”面向百卡至千卡级大型智算集群,以“全链路解决方案”提升算力性价比。据悉,在与上海算法创新研究院的合作中,基于3000卡沐曦国产GPU集群,稳定支撑百亿参数大模型训练600小时不间断,创造了国产算力训练纪录。在服务云南移动时,高效利用2000张华为昇腾910B加速卡,实现千亿参数模型的分布式部署与大规模推理,为商业化服务注入核心竞争力。这些案例印证了其在复杂场景下的稳定性与性价比优势。

小盒子:无垠终端智能

“小盒子”针对单卡至十卡级的有限算力终端,让终端算力既好用又经济。与上海创智院共同打造的全球首款端侧本征模型无穹天权Infini-Megrez2.0,在实现云级21B参数智能水平的同时,将内存占用控制在7B规模、实际计算量控制在3B规模,突破了终端设备的资源限制,可完美适配当前各类终端设备,成功打破了终端“能效-空间-智能”的不可能三角,使终端设备无需依赖云端也能处理复杂任务,进一步拓展了算力服务边界。

 04结语

当无问芯穹服务的全球最大人工智能孵化场景——上海模速空间的算力调度大屏显示日均Token调用量突破100亿时,这一数字背后不仅是一家企业的成长,更是中国算力生态的艰难蜕变。无问芯穹的“三个盒子”正在尝试解答一个产业级命题:在芯片性能暂时落后的客观条件下,如何通过系统级创新释放国产算力的潜在价值?

面对“算力碎片化”与“成本高昂”的挑战,无问芯穹通过底层的算子、通信、调度、容错等方面的技术创新和实践,大幅提升算力资源实际利用率,显著提高单位算力的性价比和服务质量。据了解,异构环境下曾出现相同数量的国产芯片与国际主流芯片混合使用表现不如单独使用国际芯片的情况。随着技术逐渐成熟和上下游生态的协同努力,如今部分不同芯片混合的算力利用率最高可达97.6%,用户已几乎感受不到算力异构的体验差异。

在这个算力定义AI竞争力的时代,中国需要的不仅是更多智算中心,更是一套能让算力真正流动起来的生态体系。当开发者可以像使用水电一样便捷调用国产算力,当芯片厂商能基于真实场景需求迭代产品,中国AI产业才有望走出“有算力难用”的困境。

无问芯穹的实践,正为这场生态突围提供着宝贵的样本。