cnBeta全文版 09月18日
华为昇腾芯片路线图公布,多款新品三年内问世
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

华为在2025全联接大会上首次披露了其昇腾芯片的未来演进规划。未来三年内,华为将推出多款昇腾芯片,包括昇腾950PR、950DT、960和970。备受关注的昇腾950PR将于2026年第一季度上市,该芯片集成了华为自研的HBM高带宽内存,并针对低精度数据格式进行了优化,大幅提升了向量算力和互联带宽。昇腾950PR将提供HiBL 1.0和HiZQ 2.0两种内存版本,分别侧重于提升推理Prefill性能和训练性能。HBM作为AI芯片的关键组成部分,能显著提高数据处理效率,对于大模型推理至关重要。

🚀 **昇腾芯片的未来规划与新品发布**:华为在2025全联接大会上首次公布了其昇腾芯片的详细演进路线图,并宣布未来三年内将密集推出多款高性能昇腾芯片。其中包括计划于2026年第一季度对外发布的昇腾950PR,以及昇腾950DT、960和970等一系列新品,显示了华为在AI算力领域的持续投入和快速迭代能力。

💡 **昇腾950PR的技术亮点与性能提升**:昇腾950PR芯片在架构上进行了多项关键升级,特别是在低精度数据格式支持方面,新增了FP8/MXFP8/HIF8(1 PFLOPS)和MXFP4(2 PFLOPS)的支持,重点提升了向量算力。同时,互联带宽提升了2.5倍,并集成了华为自研的HBM高带宽内存,显著增强了芯片的处理能力,尤其是在AI推理场景下。

🧠 **HBM高带宽内存的重要性与昇腾950PR的内存方案**:文章强调了HBM(高带宽内存)在先进AI芯片制造中的关键作用,并介绍了昇腾950PR配备的两种HBM版本:HiBL 1.0(128GB容量,1.6TB/s带宽)和HiZQ 2.0(144GB容量,4TB/s带宽)。HiBL 1.0版本将与950核心配合,侧重于提升推理Prefill阶段的性能,而HiZQ 2.0版本则专注于提升推理Decode阶段的性能以及整体训练性能,为不同AI应用场景提供了优化方案。

🔍 **大模型推理中的Prefill与Decode阶段解析**:文章进一步解释了大模型推理中Prefill和Decode两个阶段的特点。Prefill阶段处理完整输入数据并进行计算缓存,对算力要求高,适合在HBM上运行;而Decode阶段则更依赖高速内存传输和互联方案。这种区分有助于理解昇腾950PR和950DT在不同内存配置下,如何针对性地优化不同推理阶段的效率,从而更好地服务于日益复杂的大模型应用。

今日举办的华为全联接大会2025上,华为轮值董事长徐直军首次公布了昇腾芯片演进和目标。他表示,未来三年,华为已经规划了昇腾多款芯片,包括昇腾950PR、950DT以及昇腾960、970。其中昇腾950PR 2026年第一季度对外推出,该芯片采用了华为自研HBM。

根据现场公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。

规格方面,HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s。

其中,昇腾950PR芯片采用950核心+HiBL 1.0内存,可提升推理Prefill(预填充)性能,提升推荐业务性能。

昇腾950DT采用HiZQ 2.0内存,可提升推理Decode(解码)性能,提升训练性能,提升内存容量和带宽。

延伸阅读:

在大模型推理中,Prefill阶段负责接收完整输入数据(如文本或图像),并计算缓存。这一过程需要强大的算力支持,通常由高性能芯片完成。 该阶段强调算力而非内存带宽,因此更适合在HBM(高带宽内存)芯片上运行。相比之下,后续的Decode阶段更依赖高速内存传输和互联方案。

HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势,能协助快速处理数据密集型的AI任务。

美国国际战略研究中心(CSIS)AI专家艾伦(Gregory Allen)解释,HBM对于制造先进AI芯片至关重要,价值约占整体芯片的一半。

AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。

当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

华为 昇腾 Ascend AI芯片 HBM 大模型 推理 训练 全联接大会
相关文章