爱范儿 10月14日 12:32
英伟达DGX Spark:个人AI超算时代来临
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达DGX Spark个人AI超级计算机正式交付,标志着AI计算新时代的开启。这款桌面级“性能怪兽”搭载了集成的Grace Blackwell GB10超级芯片,提供高达1 Petaflop的AI计算性能,并利用NVLink-C2C技术实现CPU与GPU的128GB统一内存共享,能够流畅运行2000亿参数的大模型。Blackwell GPU支持FP4/FP8格式,大幅提升推理速度和能效。DGX Spark还内置高速网络接口,支持两台设备组建集群处理4000亿参数模型。预装的NVIDIA AI软件栈及DGXOS,为开发者提供了开箱即用的便捷。尽管价格有所上涨,但其强大的本地AI处理能力和CUDA生态支持,使其成为专业人士的有力选择。

🚀 **AI超算触手可及**:英伟达DGX Spark将数据中心级别的AI计算能力带到用户桌面,搭载Grace Blackwell GB10超级芯片,提供高达1 Petaflop的AI性能,让个人开发者也能体验到前所未有的计算动力,为本地运行大型AI模型提供了可能。

💡 **统一内存与高效互联**:DGX Spark的核心优势在于其CPU与GPU通过NVIDIA NVLink-C2C技术无缝连接,共享128GB统一内存池。这提供了远超传统PCIe的带宽和极低的延迟,使得2000亿参数的大型语言模型能够直接装载和流畅运行,极大简化了模型处理流程。

⚡ **极致性能与能效比**:Blackwell GPU集成了第五代张量核心,并支持FP4/FP8等超低精度计算格式,相比上一代性能提升显著,推理速度呈指数级增长,同时能效表现也十分出色,为AI计算带来了“涡轮增压”效果。

🌐 **可扩展集群与软件生态**:DGX Spark内置200 Gb/s网络接口,支持两台设备轻松组成小型集群,处理高达4000亿参数的模型。更重要的是,它预装了完整的NVIDIA AI软件栈和DGXOS,开发者可立即投入使用,无需耗费大量时间进行兼容性配置,大大节省了开发周期。

💰 **高性价比的专业选择**:尽管价格较初始传闻有所上涨,但DGX Spark以约4000美元的价格,为那些需要在本地处理敏感数据、追求极致性能或完全掌控AI工作流的专业人士提供了极具竞争力的解决方案,其价值体现在强大的本地大模型处理能力和CUDA生态的全面支持上。


今天星舰第十一飞圆满收官,没想到黄仁勋也闪现到了现场。

原来,黄仁勋亲自飞到了德州的星际基地(Starbase),在冲天的星舰旁边,就是为了把一台刚出炉的新「核弹」交到了马斯克手上。

这就是大家从年初等到现在的——NVIDIA DGX Spark 个人 AI 超级计算机

而这一幕,让所有老科技迷瞬间 DNA 动了,梦回 2016 年。当时,马斯克还是 OpenAI 的联合创始人,没和奥特曼闹掰,老黄亲自把全球第一台 DGX-1 超级计算机送到了他们初创公司的办公室。

黄仁勋当时开玩笑地说:

如果这是唯一一个出货的产品,那这个项目造价就高达 20 亿美元了。

那台「20 亿美金的大家伙」后来开启了整个大模型时代。

第二年 Google 就公布了一种新的神经网络训练架构 Transformer。

这次的新突破再被 Sutskever 抓住,引领 OpenAI 建造出来第一个 GPT 模型,一切都建立于英伟达的超级计算机上。

9 年过去了,马斯克成了全球首富常客,黄仁勋掌一度管着全球市值第一的公司。

而英伟达交付这次交付的 DGX,不再是一个庞然大物,而是一台能放在你桌边的「性能怪兽」。又一次在用最酷的方式宣告:一个属于每个人的 AI 超算时代,从这里开始了。

剧透一下,APPSO 的 DGX Spark 也在路上了,后续给大家带来更多体验细节,敬请期待。

说实话,这台 DGX Spark 能顺利交到老马手上,真挺不容易的。

从今年 1 月在 CES 上以「Project Digits」之名惊艳亮相,英伟达接连错过了原定的 5 月和夏季发布日期,一直没有出货 。这大半年的等待,让不少人心里直打鼓,不少开发者甚至觉得可能要彻底跳票了 。

虽然官方三缄其口,但行业里的猜测都指向了其核心——Grace Blackwell GB10 芯片 。这个芯片是「合体金刚」,Blackwell GPU 部分(就是我们熟悉的 5090 显卡同款架构)早就准备好了,但与联发科(MediaTek)共同开发的 Grace CPU 部分,却在生产上迟迟没能跟上,拖了整个项目的后腿 。

「万事俱备,只欠 CPU」的故事,没想到会发生在了英伟达身上。

那么,在 M3 Ultra Mac Studio 等竞品凭借高内存带宽抢占眼球的时候,这台姗姗来迟、还比最初传闻贵了 1000 美元的 DGX Spark 还值得我们等待吗?

答案是:绝对值得! 因为它玩的路子,特立独行且直击痛点。

等了大半年,DGX Spark 到底「香」在哪?APPSO 带你回顾一下。

整台机器的灵魂,是Grace Blackwell GB10 超级芯片。

它将一颗 20 核的 ARM 架构 Grace CPU 和一颗强大的 Blackwell GPU 封装在一起,构成了一颗超级芯片 。它能提供高达 1 Petaflop(千万亿次)的 AI 计算性能,让你在桌面上就能体验到数据中心级别的澎湃动力 。

而 DGX Spark 还有一个杀手锏。是 CPU 和 GPU 通过 NVIDIA NVLink-C2C 技术无缝连接,共享一个巨大的 128 GB 统一内存池 。

这个连接技术的带宽是传统第五代 PCIe 的整整 5 倍,确保了数据在 CPU 和 GPU 之间几乎没有延迟地高速流转 。虽然它的内存带宽(273 GB/s)在纸面上远不如 Mac Studio M3 Ultra(819 GB/s),但英伟达的思路是「大力出奇迹」。

在 AI 任务中,尤其是跑大模型时,能一次性把整个模型装进内存的巨大容量,其战略价值远超单纯的带宽数字。这意味着你可以直接在自己桌上,流畅运行一个高达 2000 亿参数的超大语言模型,而无需进行复杂的模型切分 。这种体验,别无他用。

Blackwell GPU 配备了第五代张量核心(Tensor Cores),并支持 FP4/FP8 这样的超低精度格式,性能相比上一代 FP8 提升了 5 倍 。

这就像给 AI 计算开了一个「涡轮增压」模式,让推理速度暴增,同时能效比堪称惊艳。

单台不够?DGX Spark 还内置了 NVIDIA ConnectX®-7 200 Gb/s 网络接口 。你可以轻松地将两台设备连接起来,组成一个拥有 256 GB 共享内存的微型集群 。

英伟达表示,这样的组合足以处理高达 4000 亿参数的巨型模型,这已经超出了个人开发者能够想象的极限。

抛开硬件,别忘了英伟达最硬的护城河——软件生态。DGX Spark 预装了完整的 NVIDIA AI 软件栈,包括 CUDA 库、TensorRT 和各种 NVIDIA NIM 微服务,所有东西都集成在定制的 DGXOS(基于 Ubuntu)上为你调校好了 。

这意味着你不用再花时间折腾兼容性,开箱就能直接进入战斗状态,这对于开发者而言,时间成本的节省难以估量。

这场在星舰基地上演的「世纪交接」,只是一个开始。

从 10 月 15 日起,DGX Spark 将通过英伟达官网和全球合作伙伴正式发售,价格约为 4000 美元 。宏碁、华硕、戴尔、联想等几乎所有 PC 巨头都已第一时间跟进。

说实话,这个价格比最初承诺的 3000 美元贵了 1000 刀 ,也和顶配的 Mac Studio M3 Ultra 差不多了。但它们的定位完全不同:DGX Spark 预装的是 DGXOS(基于 Ubuntu),不能装 Windows 或 macOS ,它就是一台纯粹的、为 AI 开发者和硬核玩家准备的「战斗机器」。

它的魅力在于,你花 4000 美元,买到的是一个能在本地驯服 2000 亿参数大模型的超能力 ,以及背后整个 CUDA 生态的全力支持对于那些需要在本地处理敏感数据、追求极致性能、或者想要完全掌控自己 AI 工作流的专业人士来说,这个价格其实相当有竞争力。

对于这样一台优缺点都极其鲜明的「偏科生」,你是什么态度?关于这台设备你还想要了解什么细节,也欢迎在留言区告诉我们。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 |原文链接 ·查看评论 ·新浪微博


Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英伟达 DGX Spark AI超算 Grace Blackwell NVIDIA DGX Spark AI Supercomputing Grace Blackwell
相关文章