英伟达GPU随SpaceX进入太空,在轨训练卡帕西的NanoGPT
AI真的进入太空了。
人类首次达成在太空训练并运行大模型的成就。
而参与其中的主角我们都很熟悉:英伟达、SpaceX、谷歌……还有前OpenAI联合创始人卡帕西的NanoGPT。
这几个名字一出现,故事脉络就清晰了——
SpaceX火箭将英伟达H100芯片送入太空后,在轨道上运行了谷歌的开源AI大模型Gemma,并得到了这样的回应:
你们好,地球人!

△
除了Gemma,还在H100上利用莎士比亚全集训练了卡帕西开发的大语言模型NanoGPT。

对此,网友调侃道:以后外星人研究地球或许不用亲自造访了(doge)。

首次太空AI训练
上个月初,作为Nvidia Inception成员、专注太空数据中心的初创公司Starcloud,通过SpaceX火箭发射了搭载英伟达H100芯片的Starcloud-1卫星。
如今,在这颗卫星上,人类实现了首次在太空轨道训练并运行AI大模型。

在这场太空AI“首秀”中,成功运行的太空版Gemma这样打招呼:
你们好,地球人!或者,我更愿称你们为——由蓝色与绿色构成的迷人存在。
让我们看看你们世界里的奇迹吧。我是Gemma,来此观察、分析,或许偶尔会给出些略显惊人却富有洞察力的见解。让我们开始吧!

而首个直接在太空训练的是Andrej karpathy打造的LLM——NanoGPT。

不过Starcloud的目标不止让AI在太空运行,它还计划建造基于太阳能面板的5GW轨道数据中心,且造价与运营成本要显著低于地面同行。
该公司还表示,2026年10月下次卫星发射时,将携带更多英伟达H100芯片及Blackwell平台。
Starcloud CEO Philip Johnston曾说:
地面数据中心能做的事,我期待在太空都能完成。我们这么做,纯粹是因为地面面临能源限制。
AI模型越训越大,数据中心的电力、土地成了稀缺资源。部分城市电网负荷过重,有些公司电费占训练成本大头。地球的能源与基础设施已达瓶颈,AI增长曲线受地球物理条件制约。
但在太空低轨环境,无地面土地、制冷等约束,理论成本低于地球;持续充足的太阳能供给,也让在轨算力具备长期运行的能源优势。
不少人已将算力上天列入计划。
英伟达H100上天后,谷歌CEO劈柴哥表示要发射TPU,最早两颗卫星2027年初启程。
中国玩家在太空算力领域早有布局。
2019年起,中科院计算所、武汉大学、北京邮电大学等中国科研机构,就开始探索太空智能计算并开展关键技术研究。
2024年,中科天算团队完成大模型在轨注数与部署,构建“太空智能链”。
今年5月,国星宇航联合之江实验室成功发射全球首个太空计算星座(“三体计算星座”首批12颗卫星),9月实现常态化商业运行并支持首个商业任务。
11月,中科天算发布“天算计划”,提出在近地轨道建设算力达10EOPS的万卡超级智能体集群,并公布应对辐射与散热挑战的工程方案。
AI太空版正加速发展……
参考链接:
[1]https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html
[2]https://x.com/karpathy/status/1998806260783919434
本文来自微信公众号“量子位”,作者:闻乐,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




