地球难以承载英伟达GPU,供不应求下微软缺电、英伟达上天
【导读】如今地球连显卡都供应不足,微软的GPU无法接入机房,而英伟达的H100 GPU则直接飞向太空。
英伟达的GPU,地球确实已经「供不起」了!
今日有两则新闻,一是微软囤积了大量GPU,却「插不进去」。

二是英伟达H100 GPU被发射到太空组建数据中心。

这两件事背后都隐藏着一个深刻问题:GPU虽然制造出来了,但为GPU供电、散热等配套的基础设施却没有跟上!
先看微软的GPU闲置库房一事。
微软CEO纳德拉在与OpenAI奥特曼的访谈中透露,微软手中囤积着大量GPU,却「没有足够电力」让它们运转。另一个现实原因是,缺少可立即「插入GPU」的数据中心。
纳德拉坦言:「我现在的问题不是芯片不够,而是没有能插进去的「温暖机壳」(Warm Shell)。」
所谓「Warm Shell」,指的是具备供电与冷却条件的数据中心外壳。用建筑学概念对比,相对的是Cold Shell,Cold shell指建筑结构或外壳基本具备,但室内几乎没有或只有极少的系统安装。

而Warm Shell则是更完备的状态,安装并可使用基本的建筑系统,如散热系统、暖通空调(HVAC)、照明、基本电/水/消防系统等。

AI热潮引发的芯片竞赛,如今受制于最传统的瓶颈——电力。美国电网面临前所未有的压力,科技巨头竞相布局小型核反应堆自救。与此同时,奥特曼提到未来可能出现「能在本地运行GPT - 5或GPT - 6」的低功耗消费设备,这或将颠覆现有数据中心商业模式。
地球承载不了,送往太空
与奥特曼提出的低功耗设备不同,另一则新闻提供了新思路。英伟达借助Starcloud的Starcloud - 1卫星,将H100送到太空。
11月2日,英伟达首次将H100 GPU送入太空,测试数据中心在轨道上的运行方式。

这款配备80GB内存的GPU,比以往任何在太空中飞行的计算机都强大一百倍。支持者认为这一想法很合理:在远离地球的太空空旷处,数据中心不占宝贵土地,无需大量能源和水冷却,也不向大气排放加剧变暖的温室气体。
这次为期三年的任务将搭乘SpaceX的Bandwagon 4猎鹰9号(Falcon 9)发射。重量为60公斤的Starcloud - 1卫星将在约350公里高度的低轨道绕地飞行,接收美国公司Capella运营的合成孔径雷达(SAR)地球观测卫星传来的数据,实时处理后向地面传送消息。
GPU上天的好处
在太空设立数据中心的另一大优势是,只需回传很小部分的数据。下行传输合成孔径雷达(SAR)数据历来是难题,因其数据量庞大。但能够在轨处理就意味着只需下行传输「洞见」。

什么是洞见?比如某艘船在某个位置以某个速度朝某个方向航行,这只是约1千字节的数据,而非数百吉字节的原始数据。简单来说,就是让算法贴近数据源头,在本地完成筛选、融合与推理,仅把高价值的「信息摘要」回传,即数据在外太空处理好,只传送结论。

这种方式能实现低时延响应、节省带宽与能耗、提升韧性(断联/灾害场景可持续运行),并降低敏感数据外泄风险。
为何将GPU送到太空?
与微软CEO纳德拉的烦恼不同,Starcloud是主动探索这种数据中心模式。就像其公司名,Stra Cloud,即太空的数据中心。

这么做的主要驱动力并非为GPU降温,而是地球能源与资源的瓶颈。地球数据中心耗能巨大,到2030年,全球数据中心耗电量预计将与整个日本用电量相当,且每天消耗海量冷却用水(1 MW级中心≈1000人日用水量)。相比之下,太空有天然优势:无限太阳能,轨道上24小时有阳光,无需电池储能;零土地占用,无需地面建设,不破坏生态;无温室气体排放,不依赖化石能源。
归根结底,是现在AI的算力需求爆炸。AI模型越做越大,能源和冷却成本飞涨,企业急需新解法。因此,太空数据中心被视为长期可扩展的解决方案。
通过利用低成本、持续不断的太阳能,并避免占用土地和使用化石燃料,Starcloud的技术使数据中心能够快速且可持续地扩展,随着数字基础设施的发展,这有助于在保护地球气候和关键自然资源的同时实现增长。
太空能「散热」吗?
很多人认为GPU上天是因为地球热,太空好散热,其实并非如此。太空能散热,但很困难。太空几乎没有空气,不能用风扇或液体循环带走热量(对流散热),对流散热是「热的流体(液体或气体)移动,把热量从一个地方带到另一个地方」的过程。
只剩下辐射散热方式,即「物体通过电磁波/红外波,把热量以波的形式发射出去」的过程。设备通过红外辐射向外太空释放热量,散热效率取决于辐射面积、材料发射率和温度。因此卫星或太空GPU需要大面积的散热板(radiators),设计极其关键。

在Starcloud的项目中,这部分被特别强化:他们为H100设计了专用热辐射系统,利用真空中的高温差和导热材料实现散热。
为地球省电、省地、省水,去太空建数据中心靠谱吗?Starcloud的首席执行官兼联合创始人约翰斯顿表示:我的预期是,在十年内,几乎所有新建的数据中心都会建在太空。原因纯粹是我们在陆地上面临的能量限制。
约翰斯顿称太空中唯一的额外成本是发射费。发射成本每公斤约500美元时可收支平衡,SpaceX的星舰完全投入运营后,发射价格估计在150美元到10美元不等,随着星舰投入使用,发射成本会更低。
Starcloud已在规划下一次任务,计划明年将一个计算能力比Starcloud - 1强十倍的数据中心送入太空。

Starcloud - 2任务将配备英伟达的Blackwell GPU和若干H100。约翰斯顿表示,该任务将提供7千瓦的计算能力,预计为包括地球观测卫星运营商客户提供商业服务。
微软的「没有温暖机壳」和Starcloud把H100送上天,本质上是同一问题。AI再强大,算力需求再大,也无法突破物理定律。
参考资料:
https://www.starcloud.com/starcloud - 2
https://spectrum.ieee.org/nvidia - h100 - space
本文来自微信公众号“新智元”,编辑:定慧,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




