原创 郭海惟 2025-11-07 10:05 北京
AI-RAN是AI,还是RAN
Cloud is where AI is born;
Device is where AI acts;
Edge will be where AI lives。
如果要在GTC DC大会上,寻找一个英伟达身上最“性感”而非最“实感”的故事,不同人或许有不同的答案,但有一个技术品牌可能真的要新加入候选人名单了。正是为了它,英伟达刚刚花费了10亿美元入股了老牌电信厂商诺基亚。它就是英伟达AI-RAN的核心技术品牌:
Aerial。
Aerial,今天是一个带有点工业气息的词语。但词源来自拉丁语 aerius,意指“空气的、轻盈的、高耸的”,在古时也用来形容虚幻的、轻盈优雅的美。它让人联想起另一位硅谷“帮主”OpenAI的视频产品:
Sora。
Sora在日语中的本意是“空”,可以是天空,也可以是想象遥远地方时的一种心境。
无论英伟达还是OpenAI都把自己的旗舰产品指向天空,这不是一种偶然,也不仅是一种硅谷审美乐趣上的趋同。或许它们将讲述的是相似一个东西,但现在我们先暂时按下不表。
所谓AI-RAN,用大白话理解就是在通讯基站上加入算力,让未来海量的场景计算可以不用进入云,直接在基站计算完以后就能够返回给终端的场景设备。
这样的方式有两个最显而易见的好处:
一个是节省大量的传输成本,降低云算力中心的压力。
微软CEO萨提亚·纳德拉(Satya Nadella)在前两天与OpenAI CEO山姆·奥特曼(Sam Altman)对谈时就提到了这种AGI困境:他说他的仓库里还有GPU,但没有足够的算力中心容纳,也缺少足够的电力使用。那么其实AI-RAN把算力分布式地放在全球的各个基站里,就可以成为以上的解决方案之一。
第二个则是大幅降低算力的时延。
打过在线游戏的读者都知道,有50毫秒以内的时延都属于“流畅”,但如果把这个延迟复用到自动驾驶上,高速路上将到处都是被撞烂的废铁,这也是今天高精地图方案被边缘化的重要原因。但如果将算力中心推进到用户周围,那么延迟可以降低90%以上,从毫秒级变成微秒级,大量高时延要求的场景就会跑通了。
根据目前可考的公开资料,Aerial最早出现在英伟达的资料里是在2019年洛杉矶世界移动通信大会,那时它还只是一套SDK工具,目的是支持 GPU 加速与软件定义的 5G 无线接入网。
没错,2019年,正是“何同学”拍5G视频获得三千万播放量的梦幻之年。
所以从这个角度来说,Aerial大概也能算是一个“5G原生”的工具,正是通讯带宽的快速增长让英伟达看到了一个未来世界的影子,于是Aerial诞生了。
而在过去五年时间里,5G逐渐让不少人失望,但Aerial一直在默默发育。
在这期间,Aerial的定位脱离了最初的SDK工具箱的数据,而转变为一个为“产学研”服务的平台。
2021年3月,NVIDIA在IEEE的5G分论坛上发了一篇论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍5G连接和移动边缘计算(MEC)的NVIDIA超融合(hyper-converged )平台,那时他们的案例目标是工业4.0。
在这篇论文的摘要里,NVIDIA明确表示:
Aerial是一个为研究人员提供下一代无线和人工智能研究平台,从而实现行业转型开放平台(As an open platform Aerial is positioned to be industry transformational by providing researchers with a platform for next generation wireless and AI research)。
一个月后,NVIDIA 在 2021 GTC 大会上推出 Aerial A100,即NVIDIA AI-on-5G 计算平台。
Aerial A100 其实是将,NVIDIA Aerial软件开发套件与 NVIDIA BlueField-2 A100芯片结合起来的产品,后者很大程度脱胎自是英伟达2020年刚完成收购的Mellanox的DPU产品线。虽然是这是一个拼凑起来的产品,一张包括了“5T FOR 5G”解决方案、集成GPU和DPU的融合型卡,但它为AI-RAN提供了宝贵的计算平台,得到了包括谷歌云、富士通的支持。
是的,他们甚至没有在名字里放入AI——所谓5T,指的是“时间触发传输技术”(Time-Triggered Transmission Technology for Telco)。顾名思义,这其实就是要解决精确时间戳和高时钟准确性的问题,但这其实是大规模边缘计算的基础。
有趣的是,而那年媒体对 2021 GTC 的标题是:“NVIDIA推出首款 CPU,狂推ARM生态。” 虽然服务器业务依然重要,但今天已经不太有人想起CPU了,更不会用ARM的视角来看待NVIDIA了。
随后Aerial迎来了一个小的高峰,这从英伟达的“技术博客”可见一斑,在2022年以后有体积Aerial的技术博客数量快速增加。
2022年到2023年间,英伟达陆续陆续推出的DOCA GPUNetIO 、Sionna 库、Aerial Research Cloud等一系列加速AI-RAN的工具。
DOCA GPUNetIO让GPU绕过CPU实现直连网络,降低了时延和成本、提高了吞吐量;
Sionna 库则是一个 GPU 加速的开源库,用于通信系统研究,官方说它可以实现“自动微分框架”,“通过整个通信系统反向传播梯度”,非常适合“神经网络集成”;
Aerial Research Cloud是第一个完全可编程的 5G 和 6G 网络研究沙盒。
但你依然可以将英伟达对Aerial做的所有事情,都重新回到2021年的那个论文标题上:
GPU Hosted AI-on-5G
2024年是英伟达Aerial的生态大年。
2月,著名的 AI-RAN Alliance 成立,牵头单位是英伟达和软银,其他创始单位分别是爱立信、诺基亚、三星、T-mobile、微软、AWS、Arm、DeepSig、美国东北大学。
AI-RAN Alliance成为了英伟达希望重新改写6G定义模式的重要一步,因为它囊括了(除了华为和中兴以外)几乎最重要的通信相关的公司。其组织目标就是要让AI与RAN结合,从而让6G变成真正的AI原生网络。
3月,英伟达还推出了包含 Omniverse 生态系统和 Aerial CUDA 的6G 研究平台。
而直到 9月份, 英伟达在GTC Paris 2024才宣布正式推出 NVIDIA AI Aerial。
这是它在官方介绍中,它已经成为了一个优化无线网络和提供全新生成式 AI 体验的一站式平台。
英伟达官方的通讯稿里是这样介绍 AI Aerial 的。
NVIDIA AI Aerial 平台提供了全套功能,包括高性能软件定义的 RAN 以及训练、模拟和推理,以便电信运营商能够参与下一代无线网络从开发到部署的所有阶段。
NVIDIA AI Aerial 平台提供的功能包括:
NVIDIA Aerial CUDA 加速 RAN:包含使合作伙伴能够在 NVIDIA 加速计算平台上开发和部署高性能虚拟化 RAN 工作负载的软件库。
NVIDIA Aerial AI 无线电框架:包含基于 PyTorch 和 TensorFlow 的软件库,用于开发和训练能够提高频谱效率并为 5G 和 6G 无线电信号处理添加新功能的模型。该框架还包含 NVIDIA Sionna,该链路级模拟器可用于开发和训练基于神经网络的 5G 和 6G 无线电算法。
NVIDIA Aerial Omniverse 数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT 能够以物理学精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络都不例外。它包含软件定义的 RAN(Aerial-CUDA 加速 RAN)和用户设备模拟器,以及物理世界的现实地形和物体属性。
这里包含了英伟达对下一个6G的很多定义和想象:
高性能的算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。
也从此开始,英伟达开始加速推进整个AI-RAN的生态建设的扩容,不仅与Vapor IO 这类边缘计算服务商在拉斯维加斯开辟实验田,也不断开源新的工具,推进新的头部合作伙伴。
而这一系列生态动作,在2025年10月的GTC DC大会上达到了一个阶段性的峰值。
1
