当前位置:首页 > 科技资讯 > 正文

英伟达Aerial技术驱动AI-RAN与6G通信革命

云端是人工智能诞生的摇篮;设备是人工智能行动的舞台;边缘计算则将成为人工智能栖息的未来。

若在GTC DC大会上探寻英伟达最具魅力而非最实际的故事,答案或许因人而异,但一个技术品牌正崭新入围候选名单。正是为了它,英伟达近期投入10亿美元战略投资老牌电信企业诺基亚。这便是英伟达AI-RAN的核心技术品牌:

Aerial。

Aerial,如今是一个略带工业气息的词汇。但其词源可追溯至拉丁语aerius,意为“空气的、轻盈的、高耸的”,在古代也用以描述虚幻而优雅的美感。它令人联想到另一位硅谷领袖OpenAI的视频生成产品:

Sora。

Sora在日语中本义为“空”,既可指天空,也可喻指遥想远方时的一种心境。

英伟达与OpenAI不约而同将旗舰产品指向苍穹,这并非偶然,也不仅仅是硅谷审美趣味的趋同。它们或许在讲述相似的事物,但让我们暂且搁置此话题。

所谓AI-RAN,通俗而言即在通信基站中融入计算能力,使得未来海量的场景计算无需上传至云端,可直接在基站处理完毕后返回终端设备。

这种方式带来两大显而易见的好处:

一是显著节约传输成本,减轻云计算中心的压力。

微软CEO萨提亚·纳德拉日前与OpenAI CEO山姆·奥特曼对话时提及此类AGI困境:他表示公司仓库中尚有GPU储备,但缺乏足够的计算中心容纳,也短缺电力支持。而AI-RAN将算力分布式部署于全球各基站,便可成为上述挑战的解决方案之一。

二是大幅降低计算延迟。

体验过在线游戏的读者都知晓,50毫秒以内的延迟尚属“流畅”,但若将此类延迟复用于自动驾驶,高速公路上将遍布撞毁的残骸,这也是当前高精地图方案逐渐边缘化的重要原因。若将计算中心推进至用户周边,延迟可降低90%以上,从毫秒级缩减至微秒级,众多高实时性要求的场景便能顺畅运行。

根据现有公开资料,Aerial最早出现在英伟达的记载中是在2019年洛杉矶世界移动通信大会当时它仅是一套SDK工具集,旨在支持GPU加速与软件定义的5G无线接入网。

没错,2019年正是“何同学”制作5G视频获数千万播放量的梦幻之年。

因此从该视角看,Aerial堪称“5G原生”工具,正是通信带宽的快速增长让英伟达窥见未来世界的雏形,从而催生了Aerial。

过去五年间,5G虽令部分人失望,但Aerial始终默默演进。

在此期间,Aerial的定位从初期的SDK工具箱蜕变为服务“产学研”的综合平台。

2021年3月,英伟达在IEEE的5G分论坛发表论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍融合5G连接与移动边缘计算(MEC)的英伟达超融合平台,彼时其应用目标聚焦于工业4.0。

在此论文摘要中,英伟达明确表示:

Aerial是一个为研究人员提供下一代无线与人工智能研究的开放平台,旨在推动行业变革(As an open platform Aerial is positioned to beindustry transformationalby providing researchers with a platform for next generation wireless and AI research)。

一个月后,英伟达在2021 GTC大会上推出Aerial A100即NVIDIA AI-on-5G计算平台

Aerial A100 实质上是将NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100芯片结合的产品,后者很大程度上源自英伟达2020年收购的Mellanox的DPU产品线。尽管这是一款集成型卡,整合了“5T FOR 5G”解决方案、GPU与DPU,但它为AI-RAN提供了关键的计算平台,获得了谷歌云、富士通等企业的支持。

是的,其名称甚至未提及AI——所谓5T,指的是“时间触发传输技术”(Time-Triggered Transmission Technology for Telco)。顾名思义,这旨在解决精确时间戳与高时钟准确性问题,而这正是大规模边缘计算的基础。

有趣的是,当年媒体对2021 GTC的报道标题为:“英伟达推出首款CPU,强力推动ARM生态。”尽管服务器业务依然重要,但如今已少有人忆起CPU,更不再以ARM视角审视英伟达。

随后Aerial迎来发展小高潮,这从英伟达“技术博客”数量增长可见一斑:2022年后涉及Aerial的技术博客迅速增加。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第1张

2022年至2023年间,英伟达陆续推出DOCA GPUNetIO、Sionna库、Aerial Research Cloud等一系列加速AI-RAN的工具。

DOCA GPUNetIO允许GPU绕过CPU直连网络,降低延迟与成本、提升吞吐量;

Sionna库则是一个GPU加速的开源库,用于通信系统研究,官方称其可实现“自动微分框架”,“通过整个通信系统反向传播梯度”,非常适合“神经网络集成”;

Aerial Research Cloud是首个完全可编程的5G与6G网络研究沙盒。

但你仍可将英伟达对Aerial的所有举措,回归至2021年那篇论文的标题:

GPU Hosted AI-on-5G

2024年是英伟达Aerial生态扩张之年。

2月,知名的AI-RAN联盟成立,牵头方为英伟达与软银,其他创始成员包括爱立信、诺基亚、三星、T-Mobile、微软、AWS、Arm、DeepSig、美国东北大学。

AI-RAN联盟成为英伟达重构6G定义模式的关键一步,因其囊括了(除华为与中兴外)几乎所有重要通信相关企业。该组织目标正是推动AI与RAN融合,使6G成为真正的AI原生网络。

3月,英伟达还推出了包含Omniverse生态系统与Aerial CUDA的6G研究平台。

直至9月,英伟达在GTC Paris 2024上正式发布NVIDIA AI Aerial。

在官方描述中,它已演进为优化无线网络并提供全新生成式AI体验的一站式平台

英伟达官方通讯稿如此介绍AI Aerial

NVIDIA AI Aerial平台提供全套功能,包括高性能软件定义RAN以及训练、模拟与推理能力,使电信运营商能参与下一代无线网络从开发到部署的全流程。

NVIDIA AI Aerial平台功能涵盖:

NVIDIA Aerial CUDA加速RAN:包含使合作伙伴能在英伟达加速计算平台上开发与部署高性能虚拟化RAN工作负载的软件库。

NVIDIA Aerial AI无线电框架:包含基于PyTorch与TensorFlow的软件库,用于开发与训练能提升频谱效率并为5G与6G无线电信号处理增添新功能的模型。该框架还包含NVIDIA Sionna,此链路级模拟器可用于开发与训练基于神经网络的5G与6G无线电算法。

NVIDIA Aerial Omniverse数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT能以物理精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络。它包含软件定义RAN(Aerial-CUDA加速RAN)与用户设备模拟器,以及物理世界的真实地形与物体属性。

此处蕴含英伟达对下一代6G的诸多定义与想象:

高性能算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。

自此,英伟达加速推进AI-RAN生态建设,不仅与Vapor IO等边缘计算服务商在拉斯维加斯开辟试验田,还持续开源新工具,拓展头部合作伙伴。

这一系列生态举措,在2025年10月的GTC DC大会上达到阶段性高峰。

1

Aerial冲刺CUDA时刻

在10月GTC DC大会期间,英伟达终于向AI-RAN暗流涌动的湖面投下两颗巨石:

第一,开源Aerial软件。

开源后的软件可运行于包括NVIDIA DGX Spark在内的多种英伟达平台。

DGX Spark即是黄仁勋此前亲手交付给马斯克与李在镕的便携式“便当盒”,是目前全球最小的“AI超级计算机”,能在本地执行最高2000亿参数的AI模型推理与700亿参数的模型微调,完美契合AI-RAN场景多元的开发生态需求,极适合高校研究者与个人开发者参与。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第2张

第二,英伟达宣布以10亿美元入股诺基亚,达成战略合作。

入股后英伟达将持股2.9%,其AI-RAN生态产品将融入诺基亚的RAN产品组合,双方共同推动6G的AI-RAN落地。

第三,英伟达推出Aerial RAN Computer Pro(ARC-PRO)平台。

若说曾经的Aerial平台仍是研发性质的小型平台,此次ARC-PRO便是为顶级合作伙伴准备的产业级大道,它能直接与基站结合,既服务5G实现AI-RAN功能,又助力5G向6G平滑过渡。介绍稿标题也从AI-RAN正式切换为“6G AI”。英伟达对此6G AI平台的表述变得更为宏大,甚至在中国读者看来可能颇具侵略性:

“驱动美国重返电信领导地位”。

了解英伟达历史的读者至此或感似曾相识。Aerial的发展轨迹酷似CUDA,几乎是对技术商业美学的复刻。

黄仁勋力推CUDA,因他洞察GPU不限于游戏图像,更具通用计算潜力;推动Aerial,则因RAN不仅是通信,更可能是未来AI基础设施。

CUDA从高校生态起步,耗时十年培育,最终形成独特生态护城河;Aerial亦从研发型开发平台出发,逐步构建AI-RAN生态,历时五年,成为英伟达基站算力业务的护城河。

从单点工具→通用平台→生态护城河,这是英伟达与时间的经典叙事。

但细究之下,二者在商业细节上不尽相同。

差异非在节奏快慢,Aerial是含着金钥匙出生的孩子,节奏自然更快。最大区别在于英伟达对生态伙伴的态度。

以算法生态为例,CUDA以闭源为主,Aerial则以开源为主。

在合作方面,CUDA的开放主要积累开发者习惯与口碑,Aerial虽也拥抱大量中小开发者,但核心战略目标直指生态中的顶级玩家。

英伟达若要复刻CUDA时刻,首个“北极星指标”实为让自身标准与生态被“大玩家”接纳。若无通信行业错综复杂的利益生态支持,AI-RAN便无从谈起。在通用计算领域,GPU对CPU是从无到有的降维打击。但Aerial对RAN则是从无到有的合作升维。

由此观之,尽管贵为5万亿美元市值的硅谷新宠,在通信市场中,英伟达仍扮演“仰攻者”与“说服者”角色。

“10亿美元入股”便是最具说服力的方式之一。

诺基亚或许是当前Aerial所能觅得的最理想合作伙伴。

抛开华为外的欧美市场,诺基亚的5G基站份额已落后爱立信,且趋势上差距持续扩大。尤其在美国基站市场,诺基亚丢失Verizon订单后,一度传闻仅存的T-Mobile合作也岌岌可危。与英伟达的合作或助诺基亚在美国市场重稳脚跟。

2023年,诺基亚推出“2030年计划”。该计划与英伟达偏好高度契合,将AI置于所有战略之首,将“云连续体”列于次位。所谓云连续体,实为“云-边-端”无缝融合,背后最大商机正是“边缘云”市场。

而若依英伟达技术构想,今日的通信公司未来皆可成为新兴云计算企业。此点我们容后详述。

最后,诺基亚是股权分散的上市公司,大股东系芬兰政府旗下基金,不直接干预公司经营。因此,英伟达2.9%的持股既不会过度引发其他基站企业的抵触与忧虑,也能直接对诺基亚施加影响。

对英伟达而言,入股诺基亚具两大战略优势。

第一,6G AI部署速度将领先行业。若英伟达率先将集成Aerial的基站设备推向市场,并在Aerial基础上构建应用生态,便能率先形成增长飞轮。

此情类似安卓之于塞班、Windows Mobile等系统,先发优势将铸就操作系统的重要壁垒。

第二,则关乎传统RAN市场格局中至关重要的投票机制:3GPP。

3GPP是全球移动通信技术标准的核心制定组织,拥有上百家产业链关键企业。3GPP在中国算半个网红,因几年前曾爆发科技圈广为人知的“投票门”事件,即华为主推的Polar码与高通主推的LDPC码之争。投票过程被演绎传播,结果对某投票企业造成巨大公关创伤。

实际上,编码提案需71%投票率通过,故不存在严格意义的“关键少数”,而是以技术共识为主、投票为辅的决策形式。但3GPP“权力修罗场”的形象已深植互联网记忆。

英伟达虽有AI-RAN行业联盟,但3GPP才是规则制定者。不利的是,由于缺乏传统通信业务,英伟达在其中权重极低,存在感薄弱。故英伟达需一位具备生态协同能力的策动伙伴,而诺基亚正是在3GPP中与华为、爱立信、高通并驾齐驱的第一梯队投票者,对上下游其他投票权企业也有深厚影响力。

而今年与明年的3GPP讨论release 20与release 21恰是5G转向6G的关键节点。

其中2025年的release 20被视为5G-Advanced的终点站,也是迈向6G的起点。大概率明年召开的release 21则将是6G标准的第一站。英伟达需把握更多时间窗口,为自身AI-RAN生态争取更优站位。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第3张

2

谁的“6G”?

英伟达是当前RAN生态不可忽视的变量,高通亦是。

若将AI-RAN粗分为AI与RAN两个维度,再将两家半导体巨头对比:显然英伟达AI强、RAN弱;高通则RAN积累更深,AI相较英伟达处下风。

在6G时代,高通当然会是重要参与者。但这涉及话语权的重新争夺:

6G的本质究竟更倾向AI还是RAN?

最简方法或是算经济账。

我们暂无法提供精确数据,但有些近似数字可参考。DGX Spark 128G定价3999美元,折合人民币近3万元;计算中心的大芯片A100,大内存单卡价格超1.5万美元,折合10万人民币以上。

5G基站方面,此前有媒体通过中国移动总投资与总基站部署量,估算平均单站部署成本约40万人民币(含安装、土地等综合成本)。但近些年产业链成熟,5G基站成本速降,相应集采价已跌至16万人民币。

然5G基站类型含宏基站、微基站等不同规格,功率与覆盖范围差异大,故不可一概而论。但6G基站将比5G更密集,宏基站减少,微基站增多。不过早期技术普及阶段,整体价格可能偏高。

两点可确定:

第一,芯片算力将在基站业务中占据显著成本比例;

第二,此成本占比未来存在弹性:

若算力使用频率越高,场景对算力需求越大,则芯片在基站中成本占比也越高。换言之,相较于RAN业务规模,算力芯片业务收入想象空间极为宏大。

而黄仁勋从未放弃的,正是对算力“想象”的拓展。

此时我们不得不提英伟达另一杀手锏级技术品牌:

Omniverse。

此产品曾是元宇宙热潮时的宠儿,名称亦带元宇宙气息(Omni意“所有”,连起来即“全宇宙”)。2021年,黄仁勋以其数字分身进行发布会演讲,成为Metaverse时期一道独特风景。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第4张

如今,Meta时代已远,Omniverse却留存下来。

现今Omniverse成为英伟达与场景的重要连接器,众多落地相关业务皆集于此。若想知悉算力将如何改变未来场景,最简方式便是直窥Omniverse业务线。

比如此次2025 GTC DC披露的自动驾驶重头戏,背后便是Omniverse主导的团队。

英伟达宣布拟在2027年前部署超10万台自动驾驶车队,搭载NVIDIA DRIVE AGX Hyperion 10自动驾驶平台。这是除特斯拉外,目前最庞大的部署计划。

在L4阶段,AI-RAN似乎不那么关键,但L5几乎必须6G及以上AI-RAN网络支持。

因L5意味无方向盘的完全无人驾驶,需在所有路况、全时段稳定运行,而如此庞大规模的车流网络必需边缘算力支持,配合高精地图全局规划能力。

L5自动驾驶对AI-RAN堪称教科书级场景,因它满足AI-RAN背后三大强烈需求:

超高低时延要求、端侧难以承载的算力要求、类似“群体智能”的AI算力调度能力。

马斯克近期受访时有一“大胆”预言。

他表示,“未来将无操作系统,无APP,你的手机仅显示像素与发声,它预测你最想看与听的内容,然后实时生成,我们将尽可能把AI集成至此设备。

“不再有传统意义的手机,我们所谓的手机,实则是用于AI推理的边缘节点,配备一些无线电模块进行连接。”

而服务器端AI将与用户设备(曾被称为手机)上的AI通信,并生成用户所需的任何实时视频。

马斯克观点本质,是AI-RAN能力与大模型能力叠加,将取代所有终端算力。这是最激进的AI-RAN愿景之一,若此愿景实现,AI-RAN便是宇宙级大生意。但许多研究机构认同,6G时代“云电脑”、“云手机”将从小众走向主流。其中之“云”很可能便是AI-RAN能力加持的“边缘云”。人们不再需昂贵价格占有设备,仅需在有高算力需求时租用即可。

但回归现实,有两个场景相对近在眼前:

一是机器人与XR设备。

当前所有机器人皆面临“端侧”对话太智障,而“云端”对话迟缓且昂贵的体验困境。智能眼镜厂商则遭遇大算力芯片难入小眼镜、小设备撑不起长续航的挑战。未来AI-RAN或成潜在解决方案。

一是“元宇宙”级数字孪生场景。

无论是消费级游戏应用,还是工业、手术台、能源、国防等领域,皆可进行场景延伸。

今年3月,英伟达推出一数字孪生平台,正是Aerial Omniverse Digital Twin(AODT)。官方称,它能实现从单个基站到城市规模的完整6G系统物理级精准模拟。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第5张

读至此,你或已思及AI-RAN的终极图景。

一个由边缘计算节点构筑的超级计算机,一个地球在线的超级服务器,一个AI打破所有连接壁垒、又模糊一切边界的虚实同构世界。

当然,地球在线尚遥远。但在此之前,你或许需最终知晓,AI-RAN或还将改变两件事:

一件是积极的。

云服务器厂商格局或生变,“边缘云”将从小众需求变为主流超大生意,而通信服务商或天然成为新兴云服务商。下一个AWS,未必出自亚马逊。

一件是严峻的。

若打开英伟达Aerial页面,你会看到一栏写着:主权AI基础设施。

诚然,算力本属脱敏信息,但当5G通信网络已难实现基站业务的跨国顺畅竞争。那么在AI-RAN时代,你或更难想象,欧美政客会采用他国基站设备。尽管华为或是全球唯一兼具AI芯片能力与基站能力的厂商。

英伟达Aerial技术驱动AI-RAN与6G通信革命 英伟达  Aerial AI-RAN 6G 第6张

这便是6G与其AI。

它诞生于复杂世界,故亦催生世界之复杂。