跳票数月后,NVIDIA的迷你AI超算DGX Spark终于上市,定价3999美元。该设备搭载了GB10 Grace与Blackwell SuperChip,CPU部分为20核ARM架构,GPU集成第五代Tensor核心和第四代RT光追核心,FP4性能达1PFLOPS,规格堪比RTX 5070。DGX Spark配备128GB LPDDR5X统一内存,理论上可运行高达2000亿参数的大模型。然而,初步的性能测试显示,其在运行Llama-3.1-8b等模型时,输出速度远低于RTX 5090,甚至与价格更低的苹果M4 Pro相当,引发了对其内存带宽限制和实际性能与价格匹配度的讨论。
🚀 NVIDIA DGX Spark迷你AI超算正式上市,定价3999美元。该设备集成了GB10 Grace CPU和Blackwell GPU,拥有强大的计算能力,理论上可支持运行高达2000亿参数的大型AI模型,为AI研究和开发提供了新的便携式解决方案。
💡 DGX Spark的硬件规格十分豪华,CPU采用20核ARM架构,GPU支持第五代Tensor核心和第四代RT光追核心,FP4性能达到1PFLOPS,整体规格相当于RTX 5070。同时,配备128GB LPDDR5X统一内存,理论带宽高达301GB/s,旨在满足高性能AI计算的需求。
📉 然而,初步的性能测试结果显示,DGX Spark在运行Llama-3.1-8b等模型时,其输出速度(tokens/sec)远低于预期,甚至不及RTX 5090的五分之一,且与价格远低于它的苹果M4 Pro性能相当。这引发了对其性能表现与其高端规格和价格是否匹配的质疑。
🔍 分析认为,DGX Spark的性能瓶颈可能在于内存带宽不足,这限制了其处理大型模型时的效率。尽管能够运行大模型,但实际性能与高端独立显卡相比差距明显,这使得其在性价比方面面临挑战,未能达到市场预期。
跳票了几个月之后,NVIDIA的迷你AI超算DGX Spark总算正式上市了,3999美元的价格差不多是3万元起步了。DGX Spark的规格非常豪华,处理器是GB10 Grace+Blackwell SuperChip,CPU部分是20核ARM架构,10 Cortex-X925 + 10 Cortex-A725组成,GPU是Blackwell架构,FP4性能达到了1PFLOPS,整合第五代Tensor核心及第四代RT光追核心,整体规格相当于RTX 5070。
内存是256-bit位宽的LPDDR5X统一内存,最高频率9400MHz,原始带宽约301GB/s,搭配128GB内存,它可以运行最高2000亿参数的AI大模型,或者最高700亿参数的微调模型。
2000亿参数对AI大模型来说不低了,如果能在这样的迷你机上跑那无疑非常有吸引力,所以DGX Spark上市后,已经有人测试了它的性能,网友Peter Gostev ??还制作了详细的图表,对比了RTX Pro 6000、RTX 5080、RTX 5090及苹果M1 Max、M4 Pro的性能。

简单来说,DGX Spark跑了几个Deepseek R1、Llama-3、Gemma-3等模型,其中Llama-3.1-8b输出也就每秒36tokens,R1是20tokens。
这是什么水平呢?RTX 5090对应的性能分别是200、114,至少3-5倍性能领先,但价格只有一半。
苹果M4 Pro跑对应大模型也有34、18tokens性能,跟DGX Spark差不多,但价格只有1400美元。
总之,在这个性能测试中,DGX Spark虽然能跑大模型了,但性能表现似乎有点不对劲,估计内存带宽还是太受限了,比高端游戏GPU还差很多,跟价格1/3水平的苹果M4 Pro芯片的Mac Mini差不多,完全对不住它的豪华规格和价格。
