当前位置:首页 > 科技资讯 > 正文

商汤科技:AI国产化领航者,筑牢主权AI基石

商汤科技:AI国产化领航者,筑牢主权AI基石 商汤科技 AI国产化 主权AI 大装置 第1张

在过去的一年里,英伟达首席执行官黄仁勋频繁现身于多国政府举办的峰会论坛,与各国政要会晤时,他反复提及一个核心议题——“主权AI”。

主权AI的核心思想是,每个国家都应拥有自主的AI基础设施、数据和智能生产能力,以捍卫国家主权、文化和经济潜力。以国家为单位构建的主权AI必须实现独立自主,不能依赖外部力量。正如黄仁勋在2024年迪拜世界政府峰会上所言:“你不能让别人来替你完成这件事。”

在中国,AI的崛起与国产化进程始终紧密相连。从百模大战追赶ChatGPT,到DeepSeek、通义千问吸引全球目光聚焦中国AI创新,国产AI模型逐步登上国际舞台的同时,国内从业者从一开始就立足自主创新,从零开始构建国产化产业生态,将AI主权牢牢掌握在自己手中。

而商汤科技正是这条隐秘战线上的先锋力量。

这家成立于2014年的本土AI企业,在生成式AI大语言模型席卷全球之际,坚定投入并实现转型。成立十周年之际,公司已构建起“大装置-大模型-应用”三位一体的生成式AI业务生态,2024年该业务贡献了公司总营收的60%以上。今年上半年,这一比例进一步提升至77%。

攻克AI国产化的核心难关

经济学中有个基本原理:谁掌握了生产工具,谁就能决定生产过程,进而掌握主导权。

商汤比许多同行更早洞察到,AI的竞争不仅是模型或算法的较量,基础设施的竞争往往决定了AI由谁生产、发展主动权在谁手中。

2019年,在ChatGPT尚未诞生之际,商汤内部便提出了自建“大装置”的构想。

在内部规划中,大装置是一个超大规模的AI基础设施,旨在解决AI生产过程中的关键问题:算力层以自建的AI数据中心(AIDC)为核心,支撑模型训练与算力调度;平台层整合数据平台、AI框架、推理引擎等开发工具;模型层则涵盖模型相关的算法与软件技术。

商汤科技:AI国产化领航者,筑牢主权AI基石 商汤科技 AI国产化 主权AI 大装置 第2张

而基础设施需要巨额资金撬动。2020年7月,商汤递交上市招股书时,一项重要投资便是上海临港智算数据中心的建设,总投资额高达56亿元,相当于当年营收的1.6倍。

商汤董事长兼CEO徐立后来在公司十周年年会上回忆,大装置计划在内外均遭遇巨大争议。内部许多人困惑,作为AI公司为何要顶着亏损自建重资产基础设施?外界则认为数据中心是云计算的生意,与阿里云等大厂相比,专门针对AI的算力需求太小,缺乏市场。

但商汤依然决心啃下这块最硬的骨头。

2022年,临港智算中心一期工程投入运营,算力规模达14000 PFLOPS,超过最初立项规划的4倍。至2025年8月,商汤大装置GPU达5.4万块,运营总算力突破2.5万PetaFLOPS。

后来国内AI行业掀起“百模大战”、算力长期供不应求时,基础设施的重要性已不言自明,而国产化也已成为行业共识。

商汤科技董事长兼CEO徐立曾说,商汤大装置从立项起就被视为“打破业内共识,创造新共识”的典型案例。而在推进过程中,国产化始终同步进行。

商汤希望大装置成为国产芯片在真实场景中的“试验场”。因此,在算力中心建设中,公司不仅批量采购多款国产芯片,还与华为昇腾、寒武纪、沐曦、摩尔线程、壁仞等厂商建立长期合作,针对20多款国产芯片进行兼容适配。

以寒武纪为例。12月15日,商汤发布行业首个多影视剧集视频生成智能体Seko2.0当天,寒武纪宣布Day 0即完成对日日新Seko系列模型的适配。这得益于双方10月签署正式协议后的紧密合作。适配完成后,双方还将在模型核心能力优化、算力效率提升、大规模并行处理、灵活资源管理等方面深度协作。

商汤科技:AI国产化领航者,筑牢主权AI基石 商汤科技 AI国产化 主权AI 大装置 第3张

此外,商汤还在全国率先完成华为昇腾910C 384超节点的全面适配。

今年7月,商汤联合华为、海光、寒武纪、沐曦、摩尔线程、库帕思等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”,旨在帮助客户低成本获取高性能国产AI算力芯片。同时,针对国产芯片普遍存在的算力资源碎片化、多厂商调度复杂、跨域训练稳定性不足等难题,商汤还与上海人工智能实验室发布DeepLink异构混合调度方案,推动国产算力从“可用”迈向“好用”。

让全球拥抱“中国AI创新”

在商汤“三位一体”战略中,大装置是基础设施,大模型实现产品化,应用则落地千行百业。大装置从底层支撑模型和应用创新,而模型和应用的市场反馈又推动大装置优化。

今年上半年,一个名为LightX2V的开源项目及其视频生成模型,在国外AI设计社区ComfyUI上走红,累计下载超350万次。海外开发者们在Huggingface、GitHub、Reddit等论坛热烈讨论。有国外网友得知LightX2V即将上传时,激动发帖:“不睡了,坐等更新!”

商汤科技:AI国产化领航者,筑牢主权AI基石 商汤科技 AI国产化 主权AI 大装置 第4张

LightX2V是商汤与北京航空航天大学联合研发的实时视频生成推理框架。设计上追求低成本、强实时,采用DiT蒸馏加速、轻量化VAE、稀疏注意力等优化技术,实现四步出片。

相比Sora2、Runway、Pika等同类模型需几分钟甚至十几分钟生成15秒视频,LightX2V仅需5秒就能生成5秒视频。速度更快的同时,硬件要求更低,仅需8GB显存与16GB内存即可运行140亿参数模型生成480P/720P视频,且兼容多款国产芯片。

将LightX2V与商汤自研AI视频生成智能体Seko结合,可彻底释放内容制作者的“一人剧组”生产力。最新发布的Seko 2.0支持100集以内剧本连续创作,内置SekoIDX技术破解多剧集角色一致性难题,SekoTalk攻克多人对口型难题,实现自然音画同步。目前,Seko制作的真人短剧《婉心计》登顶抖音AI短剧榜第一。

除Seko与LightX2V外,商汤另一个开源多模态模型架构NEO也吸引了全球开发者关注。

业内此前多模态大模型大多沿用“视觉编码器+投影器+语言模型”的模块结构,虽实现图像输入兼容,但本质上仍以语言为中心。NEO架构通过在注意力机制、位置编码和语义映射三个维度的底层创新,使模型天生具备统一处理视觉与语言的能力。

NEO架构的创新带来极致效率表现。测试显示,NEO仅需业界同等性能模型十分之一的图像数据,即可开发出对标顶尖模型的视觉感知能力,在MMMU、MMB、MMStar、SEED-I、POPE等多项权威评测中斩获高分。

商汤用一个个实践案例证明,降低AI使用门槛,通过开源项目融入全球开发者生态,能让中国AI影响力渗透到更多国家和地区。

国产化并非构建封闭体系

在中国AI崛起之路上,国产化的本质不是打造封闭系统,而是吸引更多国产厂商参与共建生态。只有拥有国产化生态,中国AI才能真正在全球独立占有一席之地。

商汤的国产化路线并非单打独斗,而是长期坚持对外开放合作。

国产芯片厂一直是商汤重要的合作伙伴,华为昇腾、寒武纪、摩尔线程、沐曦等均在其中。

以沐曦为例,双方合作不仅停留在产品采购与技术支持层面,更在战略层面达成长期稳定协议。技术上,双方形成底层开放共建共享模式,开展深度适配、联合开发产品方案及软硬件协同工作。商业化上,通过技术深度适配,确保沐曦GPU在商汤大装置中高效运行,联合开发一体机、平台适配、模型适配等方案,满足不同行业客户需求。

前两年高端芯片一卡难求,国产化目标正是化解此类风险。商汤与多家国产AI芯片企业深度合作,共同攻克“卡脖子”技术,实现算力自主可控,推动中国AI算力产业发展,形成“技术互补、资源共享、场景互哺”的合作生态,也缓解了市场对供应链短缺的担忧。

除了芯片厂,商汤的合作同盟还在不断壮大,数据厂商、AI公司等新成员陆续加入。反过来,与国产同盟建立的生态也在创造更多可能。例如商汤与记忆张量公司合作,攻克GPU硬件架构适配难题,实现Prefill-Decoding分离技术在国产GPU上单卡并发效率提升20%、吞吐量增长75%,推理性价比大幅提升150%。

生态无法一蹴而就,国产化是一条需要长期耕耘的路,但路的尽头方向明确,商汤已经率先出发,接下来将有更多同行者加入。