Cnbeta 08月28日
GB10 Grace Blackwell芯片发布延迟及细节
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

NVIDIA的GB10 Grace Blackwell芯片,被誉为其进军桌面CPU市场的关键产品,原定7月发布但推迟。近日官方披露了该芯片的详细规格,强调与联发科的合作,主要贡献CPU和互连设计。GB10采用台积电3nm工艺和2.5D封装,CPU部分集成20个Armv9.2架构核心,GPU基于Blackwell架构,配备6144个CUDA核心和第五代Tensor核心,支持光追和DLSS4。芯片采用NVLink总线架构,热设计功耗高达140W,支持最高2000亿参数的AI大模型。DGX Spark工作站可通过ConnectX-7互连,支持更大模型参数。

🔹 GB10 Grace Blackwell是NVIDIA进军桌面CPU市场的重要产品,原定7月发布但推迟,强调与联发科的CPU和互连设计合作。

🔹 技术规格上,GB10采用台积电3nm工艺和2.5D封装,CPU部分集成20个Armv9.2架构核心,每组10个核心共享16MB三级缓存。

🔹 GPU基于Blackwell架构,配备6144个CUDA核心和第五代Tensor核心,支持光追和DLSS4,FP32算力达31 TFLOPS,NVFP4算力1000 TOPS。

🔹 芯片采用NVLink总线架构,CPU与GPU之间实现高带宽低功耗连接,并配备16MB系统级缓存,提升多引擎数据共享效率。

🔹 内存为256-bit位宽的LPDDR5X统一内存,最高频率9400MHz,原始带宽约301GB/s,支持最高2000亿参数的AI大模型或700亿参数的微调模型。

号称Superchip超级芯片GB10 Grace Blackwell,可以说是NVIDIA今年最值得期待的产品,也被视为NVIDIA进军桌面CPU市场的第一步(笔记本移动端则是N1系列),但它没能在7月如期面世。

近日,NVIDIA官方终于公布了GB10芯片的诸多细节,特意强调这是与联发科成功合作的成果

其实在今年初,NVIDIA首次宣布代号Project DIGITS、后命名为DGX Spark的桌面迷你AI工作站的时候,就曾提及联发科的共同参与,主要贡献了CPU和互连部分的设计。

技术规格方面,GB10采用台积电3nm工艺制造、2.5D封装技术,其中CPU部分和内存成为S-dielet,GPU部分成为G-Dielet。

CPU部分集成20个Armv9.2架构核心,分为两组,每组10个,每个核心都有自己的独立二级缓存(容量没说),然后每一组共享16MB三级缓存。

GPU部分基于Blackwell架构,CUDA核心数量没说但应该是6144个,也就是相当于RTX 5070,还有第五代Tensor核心、24MB二级缓存,支持光追、DLSS4,FP32格式算力31 TFLOPS,NVFP4格式算力1000 TOPS。

CPU、GPU之间是高带宽低功耗的C2C通道,基于NVLink总线架构。

还有16MB系统级缓存,可以作为CPU的四级缓存,进一步提高在CPU、GPU等不同引擎之间共享数据的效率。

内存是256-bit位宽的LPDDR5X统一内存,最高频率9400MHz,原始带宽约301GB/s。

整体热设计功耗高达140W,而操作系统是定制的DGX Base OS,能否运行其他发行版Linux甚至Windows on Arm尚未可知。

NVIDIA宣称,搭配128GB内存,GB10可以运行最高2000亿参数的AI大模型,或者最高700亿参数的微调模型。

两台DGX Spark可以通过ConnectX-7总线互连,大模型参数最高可达4050亿。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GB10 Grace Blackwell NVIDIA 桌面CPU 台积电3nm NVLink AI大模型
相关文章