深度财经头条 10月04日 09:41
超节点:AI算力新范式,重塑算力基础设施
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

人工智能的飞速发展催生了对海量算力的需求,而“超节点”正成为新一代算力解决方案。这一由英伟达提出的概念,将数千张GPU集成于一个逻辑单元,通过高速互联技术克服传统架构的带宽和时延瓶颈,大幅提升算力效率。阿里云的磐久128超节点AI服务器和华为的CloudMatrix 384超节点已投入使用,展现出在AI训练和推理方面的显著优势。随着中美AI竞争的加剧,中国厂商如浪潮信息、沐曦股份、百度智能云等也在加速布局超节点,通过集群建设、开源生态和工程化交付,实现AI基建的弯道超车。超节点技术在互联方式、散热和功耗管理方面不断创新,有望推动国产算力基础设施的加速落地,并带动相关光连接供应链的放量。

💡 **超节点定义与优势:** 超节点是一种将数千张GPU集成在一个逻辑单元内的技术架构,旨在解决AI模型参数爆炸式增长带来的算力需求。通过高速互联技术,它能有效弥补传统服务器间带宽不足和高时延的问题,从而优化算力效率,实现“算力法宝”的转变。

🚀 **行业应用与发展:** 阿里云的磐久128超节点AI服务器在推理性能上较传统架构提升50%;华为的CloudMatrix 384超节点已广泛应用于政企客户,并计划推出更大规模的产品。这些都表明超节点已成为AI训练与推理场景下的重要基础设施。

🇨🇳 **中国厂商的积极布局:** 面对中美AI竞争,中国厂商正通过集群建设、开源生态和工程化交付等方式,在AI基建方面实现“弯道超车”。浪潮信息、沐曦股份、百度智能云等纷纷推出自研的超节点产品,加速国产算力基础设施的落地。

🌡️ **技术创新与挑战:** 超节点在技术上不断突破,如华为超节点采用全光互联和正交架构,实现高带宽、低时延和高可靠性。然而,单机柜功耗的显著提升也带来了温控和电源系统的挑战,全液冷等技术成为应对之道。

📈 **投资前景广阔:** 随着超节点渗透率的持续提升,其在算力、带宽、内存等关键指标上的领先优势,将有力推动国产算力基础设施的加速发展,并带动光连接供应链的放量,具有重要的投资价值。


《科创板日报》10月4日讯 人工智能正以史无前例的速度重塑各行业,这场变革背后离不开海量算力的支持。当AI模型参数从亿级跃升至万亿级,“超节点”开始逐渐取代单机与传统集群,成为新一代的“算力法宝”。

超节点,即Superpod,是一种用于构建大规模算力集群的技术架构。此概念最早由英伟达提出,指将数千张GPU集成在一个逻辑单元内,形成类似“超级计算节点”的系统。与传统架构不同的是,超节点可以通过高速互联技术,弥补原先服务器间带宽不足以及高时延等问题,以期实现算力效率的优化。

在不久前举行的2025云栖大会上,阿里云发布了磐久128超节点AI服务器。据悉,该服务器集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,单柜支持128个AI计算芯片。同等算力下,相较于传统架构,该服务器推理性能可提升50%。

除推理场景外,超节点亦可用于AI训练。今年4月,华为推出CloudMatrix 384超节点,其通过构建超过万片的大集群来提供算力。对于万亿、十万亿参数的大模型训练任务,在云数据中心,可将432个超节点级联成最高16万卡的超大集群。

在9月召开的华为全连接大会上,华为表示CloudMatrix 384超节点已销售300余套,共服务20余家客户,主要需求来自政企。未来,华为还将推出Atlas 950 SuperPoD超节点,算力规模8192卡,预计于2026年四季度上市。新一代产品Atlas 960 SuperPoD算力规模将达到15488卡,预计2027年四季度上市。

华龙证券指出,中美AI竞争正从“单卡性能”走向“系统级效率”,中国正在用集群建设+开源生态+工程化交付的方式完成AI基建方面的弯道超车。事实上,当前还有更多国产硬件厂商正在加速布局超节点:

8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。

沐曦股份已发布多种超节点形态,包括光互连超节点、耀龙3D Mesh超节点、Shanghai Cube国产高密度液冷整机柜以及高密度液冷算力POD。

8月28日,百度智能云发布百舸AI计算平台5.0版本。在算力方面,昆仑芯超节点正式启用。

从技术方向看,超节点正在成为AI基础设施建设的新常态。民生证券认为,此前市场更多关注芯片算力,但伴随Scale up产业趋势崛起,超节点已经重新定义AI基础设施的范式

以华为超节点为例,其柜间采用全光互联,具有高可靠、高带宽、低时延等优势;另一方面,华为的Atlas 950通过正交架构,实现零线缆电互联,其独创的材料和工艺让光模块液冷可靠性提升1倍。相比英伟达将在明年下半年上市的NVL144,Atlas950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍,在各方面均呈领先。

该机构进一步指出,当超节点速率大幅提升,AIDC功率将迎来新挑战。由于包括华为CloudMatrix 384、英伟达GB200NVL72在内的超节点单机柜功耗普遍突破100KW,因此在算力密度指数级增加的情况下,超节点机柜的温控和电源系统将面临挑战。而当Atas950超节点采用全液冷模式时,其互联带宽速率和算力速率均有望迎来大幅提升。

从投资层面来看,国金证券表示,华为超节点等新平台在算力、带宽、内存等关键指标上全面领先,有望推动国产算力基础设施加速落地。看好超节点渗透率的持续提升,带动光连接供应链的放量。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

超节点 Supernode AI算力 人工智能 算力基础设施 GPU集群 Nvidia 阿里云 华为 国产算力 光互连
相关文章