36kr 08月27日
马斯克All in AI:5年内打造5000万张H100算力集群
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

埃隆·马斯克宣布一项雄心勃勃的计划,目标在五年内实现5000万张H100 GPU的算力,这预示着AI算力竞赛进入新阶段。该计划的预估成本将超过2万亿美元,相当于美国年度军费总支出的一倍以上,凸显了AI领域与传统军备竞赛并驾齐驱的重要性。马斯克此举旨在为xAI和特斯拉等公司提供强大的算力支持,以训练更先进的模型,并可能推动通用人工智能(ASI)的出现。目前,xAI的Colossus超算集群已具备约20万张H100的算力,并已成功训练出强大的Grok模型。

🚀 **巨额算力投入与成本**:马斯克计划在五年内构建拥有5000万张H100 GPU的算力集群,预计总成本将超过2万亿美元。这笔巨款不仅远超其个人及旗下公司市值总和,也超过了美国年度军费开支,显示出AI领域已成为与传统军事力量相匹敌的关键竞争领域。

💡 **AI发展与ASI的可能性**:如此庞大的算力投入,旨在为xAI的Grok模型、特斯拉的自动驾驶技术以及Neuralink、SpaceX等硬科技领域提供强大的支撑。马斯克的技术乐观主义预示着,这可能为通用人工智能(ASI)的出现提供关键的驱动力,尤其是在“勇敢者的孤注一掷”下。

⚡ **算力基础设施与能源挑战**:为支撑如此大规模的AI集群,不仅需要海量的GPU,还面临巨大的电力供应挑战,可能需要数十个核电站的电力支持。马斯克正通过多元化的电力解决方案,包括特斯拉Megapack和迁移发电厂等方式来应对这一难题,并计划建设“世界首个千兆万级+的AI训练超算”。

📈 **Grok模型迭代与产品规划**:xAI的Grok模型已展现出强大的实力,Grok 4在各项测试中均表现优异。马斯克还预告了后续的产品规划,包括8月发布的编码模型、9月上线的多模态智能体以及10月的视频生成模型,这些都将是算力的“无底洞”,需要持续的算力投入来支撑其发展和扩展。

马斯克宣布了一个疯狂的计划,将在5年内实现5000万张H100的算力,这是什么概念?这将为人类带来怎样的影响?ASI能否在勇敢者的孤注一掷下现身?

世界首富马斯克,这次宣布决定All in AI了。

5年内实现5000万张H100的算力。

要知道,他已经有了全世界最强的Colossus超算集群,AI算力等价于约20万张H100。

他究竟想用这么多GPU做些什么呢?

十万亿元能创造出怎样的奇迹

目前,每张H100的批发价高达2万美元。

5000万张H100,光是GPU,成本就将高达1万亿美元。

要搭建目前的最先进的超算集群,目前GPU成本只占约50%。

也就是说,最终的成本将超过2万亿美元(逾14万亿元人民币)。

2万亿美元是什么概念?

美国去年的军费总支出约9970亿美元,而这已经占到了全球军费支出的37%。

这意味着,AI已经成为与传统的军备竞赛分庭抗礼的全新关键领域。

马斯克的身价约4000亿美元。

特斯拉的市值约1.1万亿美元。

加上SpaceX、X和xAI,马斯克旗下的公司市值约1.6万亿美元。

一旦摩尔定律在未来5年不能在GPU上有效,成本将无法产生指数下降。

马斯克是在拉上自己和全体股东的全部身家,All in AI,再造一个属于近未来时代的特斯拉。

此外,电力供应更是一个大问题。

这个预想中的超算集群将可能需要十几个核电站供应电力。

但马斯克觉得还不够。

他的野心是,拥有数十亿张H100算力的AI超级计算集群。

规模再扩大百倍。

马斯克的技术乐观主义为天文数字加上了对数。

Grok已经很强,但还远远不够

马斯克究竟想用这么多GPU做些什么呢?

不管是xAI和特斯拉训练模型,还是Neuralink和SpaceX在硬科技领域获得突破,都需要海量的算力。

为此,马斯克搭建了全球最强的超算集群Colossus。

最初上线,它用了10万块H100,仅在19天极限时间中完成了搭建。

随后,又扩展到了20万张GPU。

众所周知,Grok 3就是在20万张GPU中训练而来,算力是Grok 2的十倍。

Grok 2当时是在1.5万块GPU上训练。

直到上个月,最强Grok 4问世再次刷榜,让所有人见识了超强算力下LLM的强大实力。

不仅力夺所有榜一,还在HLE测试中碾压人类博士。

发布会上,马斯克还曾预告,接下来几个月的「彩蛋」。

8月发布编码模型;9月上线多模态智能体;10月亮相视频生成模型。

仅在训练下一代模型这块,就成为了算力的「无底洞」。

再加上,xAI聊天机器人的产品策略,如AI女友Ani上线,一度吸引了众多用户。

Grok Ani立绘

若没有强大算力支撑,xAI便无法扩展更多应用。

有了最强的Colossus一代,还不够。

马斯克还要用天文数字般的算力,让对手望而却步。

毕竟,他曾豪言,「未来谷歌也不是自己的对手」。

Colossus二代,便承载着这样宏大的使命,在万众瞩目中应运而生。

Colossus二代,正在建了

目前,Colossus 2,已经在分批逐步落地中。

超算中心预计首批上线55万块GB200和GB300,全部采用液冷设计,专为AI训练打造。

用马斯克的话来说,Colossus 2将成为「世界首个千兆万级+的AI训练超算」。

上个月,他曾发布了关于超算中心GB200的布线,密集度可谓相当壮观。

早在今年2月,xAI便在美国田纳西州孟菲斯Tulane Road,购入了约100万平方英尺的园区,用作二期基地。

与初代(156个)类似,Colossus 2也将由特斯拉Megapack供电,这次数量增加到了208台。

不仅如此,马斯克还计划从海外迁移一座发电厂,为其供电。

Colossus 2的供电会采取多元化措施:包含新建或改建变电站、储能、外部电源迁移等。

星际之门还遥遥无期,若Colossus 2能延续初代搭建传奇,一定再次创造世界纪录!

英伟达老黄曾不止一次夸赞,马斯克对工程系统的极致理解

参考资料

https://x.com/elonmusk/status/1947704195844608094

https://x.com/elonmusk/status/1959383653256962378

https://x.com/xAIMemphis/status/1947724711968051414

https://x.com/elonmusk/status/1947701807389515912

https://x.com/teslaownersSV/status/1924684020107116709

本文来自微信公众号“新智元”,作者:艾伦 桃子,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

马斯克 AI 算力 H100 xAI Grok Elon Musk AI Compute H100 GPUs xAI Grok
相关文章