微软机房英伟达GPU闲置,AI算力与能源难题待解
你能想象吗?微软堆积如山的GPU只能在库房里闲置。
在最新播客节目BG2中,微软CEO纳德拉亲口承认公司面临着前所未有的尴尬状况:微软拥有大量的GPU,但由于缺电、缺空间,这些GPU只能被闲置一旁。
不过,最大的问题并非是算力过剩。纳德拉表示:“最大的问题不是芯片供应,而是供电能力,以及我们能否足够快地建成靠近电源的数据中心。如果做不到,你就会有一堆芯片只能躺在仓库。”
微软缺电,大量GPU闲置
在微软内部,大量英伟达AI芯片处于闲置状态。这并非是因为算力已经足够或者“过剩”,而是当前的基础设施无法支撑这些芯片运行。一方面是缺乏电力,另一方面是缺少可以马上投入使用的数据中心,也就是纳德拉所说的“warm shells”,即已经建好、具备足够供电与冷却能力的机房外壳。
这并非纳德拉第一次对外提及微软的这一烦恼。去年,当被问到微软在2024年是否仍受英伟达芯片供应限制时,纳德拉称:“我们受到的是电力限制,而不是芯片供应限制。”

到了今年,这似乎成了所有大模型巨头共同面临的问题。奥特曼在同期讨论中也提到,行业面临的总体挑战不只是算力问题,更多的是能源和基础设施的匹配问题。而且奥特曼对这个问题的关注比多数科技公司都要早。过去两年,他陆续投资了裂变能源公司Oklo、聚变能源公司Helion,以及太阳能创业公司Exowatt。不过,这些新型能源技术距离大规模商用还很遥远,短期内,数据中心仍需依赖燃气和可再生能源混合供电。
缺电之外:囤芯片也不再安全
过去五年,美国整体电力需求曲线急剧上升。随着AI和云计算带动的数据中心建设进入高峰期,用电需求增长速度超出预期,远远超过了公用事业公司原本的新增发电规划,供给端的反应明显滞后。传统电厂从立项到并网通常需要数年时间,而AI产业扩张是以季度为单位计算的。因此,越来越多的数据中心开发商不得不自己为AI发电,他们选择采用“计量表后”供电方式,直接将电力接入数据中心,绕过公共电网,以弥补供能缺口。
即便如此,数据中心、电力与冷却系统的建设速度还是远远跟不上现实需求。光伏太阳能被认为是目前建设周期最短、部署最灵活的能源形式,但它从选址、施工到并网也动辄需要数月甚至一年时间。而AI需求的变化可能只需要一次模型更新或一次产品发布。例如,当算力曲线每季度刷新纪录时,能源系统还在审批表格上停滞不前。

部分业内人士担心,如果未来AI需求增速放缓,当前为支撑AI算力而大规模投资的电厂和储能项目可能会出现闲置风险。但奥特曼认为,AI的用电需求不可能回落,只会持续增长。也就是说,更高效、更便宜的算力会激发出更多应用场景。从这一点来看,奥特曼似乎是杰文斯悖论的信徒。该悖论认为,资源的更高效利用将导致更大规模的使用,从而增加整体需求。奥特曼呼吁美国政府每年增加100吉瓦发电能力,并将其视为“AI战略资产”。
与此同时,算力端的企业也在调整策略。纳德拉明确表示,微软不会再囤积单一代GPU。因为一台昂贵的英伟达芯片,如果暂时无法通电使用,两、三年后又被新架构取代,就会在折旧周期内提前贬值。根据微软的经验,数据中心设备的折旧周期通常是六年,盲目囤货不仅占用现金,还会造成资源浪费。
网友建议:不如开发点能耗降低的芯片?
自20世纪90年代末以来,美国电力生产一直维持在约4万亿千瓦时/年。但随着人口增长、部分物理电网老化以及新的城市生活和科技进步,电力需求不断增加。GPU生产可以按季度迭代,而电力系统、数据中心冷却与输电网络的建设却需要以年为单位。AI产业算力增长的关键已不再是芯片产量,而是能源与基础设施能否同步扩张。
当限制从“算力短缺”变成“电力短缺”后,标准是否会发生反转呢?在reddit相关讨论帖中,有网友建议:“如果你是受电力限制而不是芯片限制,你会想要每工作最节能的芯片,对吧?如果你已经被能耗闲置,而英伟达推出一款速度提升1.2倍但能耗降低25%的芯片,那将非常有吸引力。”

One More Thing
周一,微软宣布相关部门已批准其向阿联酋运送英伟达芯片,用于建设训练AI模型所需的数据中心。微软还表示,未来四年将在海湾国家投资80亿美元用于数据中心、云计算和其他人工智能项目。外媒分析,这笔交易标志着AI基础设施正在从硅谷迁往能源充足的新兴市场。也许到了那里,微软买下的英伟达GPU就不用再闲置了。
参考链接:
[1]https://www.reddit.com/r/hardware/comments/1onawsk/microsoft_ceo_says_the_company_doesnt_have_enough/
[2]https://x.com/rohanpaul_ai/status/1985462248349766076
[3]https://finance.yahoo.com/news/microsoft-gets-u-approval-export-134300053.html
本文来自微信公众号“量子位”,作者:衡宇,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



