本文原载于《MIT Technology Review》第127卷第4号(2024年7/8月号)上,是Google前CEO,Schmidt Sciences创始人Eric Schmidt的文章,主张美国应制订国家级的人工智能战略。
这些主张有一部分在“特朗普2.0时期”开始实施起来。例如:
- 把“先进算力”升格为国家安全核心——特朗普7月发布的《赢得AI竞赛:美国人工智能行动计划》三大支柱之首就是“基础设施”,明确把“兴建大型 AI 数据中心 + 政府主导的算力金融市场”写进国家级文件,并责成联邦机构90天内简化用地、并网、环评流程,与作者“国家 AI 超算”诉求方向一致;放松监管、强调“政府只搭台、市场唱戏”——OMB备忘录M-25-21/22撤销了拜登时期对联邦用AI的多数备案要求,新设“首席人工智能官(CAIO)”专司推动而非合规,等于用行政手段为公共部门采购高性能算力开绿灯;预算数字看似“放大”——OpenAI、甲骨文和日本软银已承诺2025~2028年在美新建5座AI数据中心,总投资4000亿美元;虽然资金来自私企,但白宫将其列为“行动计划样板工程”,与作者“巨型投入”口径呼应;
但是当下联邦政府有很多行动却和Schmidt的主张相反,例如:
- “政府应自建并长期持有超算”基本落空。迄今公开清单里,所有新增算力均为“企业投资、政府租用”模式,没有重启当年Frontier/Aurora那种“能源部出资—国家实验室运营”的联邦超级计算机项目;相反,特朗普把拜登时代的NAIRR试点直接冻结,26亿美元公共预算仍未落地;出口管制出现“先松后紧”的急转弯:6月白宫一度允许英伟达对华出售高端GPU,被业界视为“牺牲国家安全换企业利润”;7月《行动计划》虽重新收紧管制,但东南亚走私规模已冲上10亿美元,显示作者担心的“算力供应链主导权”正在被美方自己削弱;人才移民条款未按作者建议放宽。H-1B上限仍维持85k,并将费用提高至10万美元,通道没有法定豁免;特朗普竞选纲领中甚至提出“进一步削减低技能技术移民”,与“全球抢人”思路相左。
种种以上表明了特朗普政府把“国家算力”喊成政治口号,也给了土地、电价、许可等“政策红包”,但出资主体仍是硅谷巨头;联邦直接持有、面向公共研究的“AI阿波罗”级设施并未出现,且移民、出口管制两端与作者设想存在明显温差。
本文是在H-1B签证事件出来后从该刊中译出的,拿这篇文章和当下美方的一些行为相比,也是相当讽刺。
接下来我们一起看看Schmidt所绘就的人工智能战略“蓝图”是什么样的。
全文
全球人工智能的蓬勃发展,推动着计算能力的全球竞赛如火如荼地展开。OpenAI的Sam Altman正寻求为一家芯片制造公司筹集高达7万亿美元的资金。微软和亚马逊等科技巨头也在研发自己的人工智能芯片。对更强大的计算能力的需求——用于训练和使用人工智能模型——推动了人们对从尖端芯片到海量数据集等各种资源的追求——不仅仅是当前地缘政治筹码的来源(例如美国限制对华芯片出口)。它也正在塑造各国未来的发展和竞争方式,从印度到英国,各国政府都在制定国家战略,并囤积英伟达的图形处理器。
我认为美国现在应该制定自己的国家算力战略:人工智能时代的阿波罗计划。
今年(2024年)1月,根据(时任)拜登总统关于人工智能的行政命令,美国国家科学基金会(NSF)启动了国家人工智能研究资源(NAIRR)试点项目,该项目旨在成为一个“共享研究基础设施”,为学生和人工智能研究人员提供人工智能计算能力、开放政府和非政府数据集的访问权限以及培训资源。
NAIRR试点项目虽然至关重要,但仅仅是第一步。NAIRR工作组去年发布的最终报告概述了NAIRR六年运营所需的最终预算为26亿美元。这远远不够——即便如此,国会是否会在试点项目结束后批准NAIRR的运营仍有待观察。
与此同时,政府还需要做更多工作来扩大计算能力的获取渠道,并将人工智能应用于国家服务。先进计算如今已成为国家安全与繁荣的核心;我们需要它来优化国家情报,追求聚变反应等科学突破,加速先进材料的发现,确保金融市场和关键基础设施的网络安全等等。联邦政府通过提供核心研究基础设施,例如20世纪60年代用于高能物理的粒子加速器和20世纪80年代的超级计算中心,在推动上个世纪的重大技术突破方面发挥了关键作用。
如今,世界各国政府正持续雄心勃勃地投资高性能人工智能计算,我们不能落后。这是一场争夺人类历史上最具变革意义的技术的竞赛。
首先,需要建造更多专用的政府人工智能超级计算机,用于执行从机密情报处理到高级生物计算等一系列任务。在当今时代,计算能力和技术进步同步发展。
过去十年,美国凭借Frontier、Aurora以及即将问世的El Capitan等大型计算机,成功将经典科学计算推向了百亿亿次时代。这些大型计算机每秒可执行超过千万亿亿次运算。未来十年,人工智能模型的计算能力预计将提升1000到10000倍,领先的计算架构可能能够在一周内训练出一个包含500万亿个参数的人工智能模型(相比之下,GPT-3拥有1750亿个参数)。支持如此规模的研究需要更强大、更专业的人工智能研究基础设施、更优的算法以及更多的投资。
尽管美国目前在先进计算领域仍处于领先地位,但其他国家正接近并试图超越我们。例如,中国的目标是到2025年将其总体计算能力提升50%以上,据报道,中国计划到2025年拥有10个百亿亿次级系统。我们不能冒险行动迟缓。
其次,虽然有些人可能主张使用现有的商业云平台,而不是构建高性能的联邦计算基础设施,但我认为混合模式是必要的。研究表明,使用联邦计算而非商业云服务可以显著节省长期成本。短期内,扩展云计算可以为项目提供快速、精简的基础访问——这正是 NAIRR 试点项目所采用的方法,并得到了行业和联邦机构的共同贡献。然而,从长远来看,采购和运行强大的政府所有 AI 超级计算机,并将其专门用于支持美国公共部门的需求,将为 AI 更加普及、对国家安全和繁荣至关重要的未来奠定基础。
如此扩大的联邦基础设施也能使公众受益。政府计算集群的生命周期通常约为七年,之后新系统将建成,旧系统将退役。随着更新的尖端GPU的出现,硬件更新将不可避免地淘汰旧的超级计算机和芯片,这些旧芯片可以被回收用于低强度研究和非营利用途,从而为民用增加经济高效的计算资源。虽然迄今为止,大学和私营部门推动了大部分人工智能的进步,但随着需求的飙升,完全分布式模型将面临越来越多的计算限制。麻省理工学院和非营利组织美国竞争力委员会对美国一些最大的计算用户进行的一项调查显示, 84%的受访者表示他们在运行关键程序时面临计算瓶颈。美国需要联邦政府的大量投资才能保持领先地位。
第三,任何国家计算战略都必须与人才战略相辅相成。政府可以通过为人才提供利用世界一流计算基础设施应对国家安全挑战的机会,更好地与私营部门争夺人工智能人才。为了确保国家拥有大量高技能、高专业水平的人才队伍,以胜任开发和实施人工智能领域的高技术、专业化岗位,美国还必须招募并留住全球最优秀的学生。这项工作的关键在于打造清晰的移民途径——例如,将相关技术领域的博士学位持有者从目前的 H-1B 签证名额限制中豁免。我们需要最聪明的人才从根本上重新构想计算的运作方式,并引领能够塑造人工智能、造福公众、拓展技术边界并惠及所有人的全新范式。
美国长期以来一直受益于其作为全球先进计算创新驱动力的地位。正如阿波罗计划激励我国赢得太空竞赛一样,制定国家计算领域的宏伟目标,不仅将增强我们未来几十年的人工智能竞争力,还将推动几乎所有领域的研发突破,并提供更广泛的应用。先进的计算架构并非一朝一夕就能建成的。让我们现在就开始奠定基础。
cover image by Aidin Geranrekab @unsplash
