历史在这一刻被书写:全球首个利用H100太空GPU训练的大型语言模型正式问世,它基于Karpathy的nano-GPT架构完成训练。与此同时,谷歌开源Gemma模型也在外太空首次成功运行,并向地球发来了亲切的问候:地球人,你好。
「地球人,你好」!
这标志着谷歌Gemma模型首次在太空环境中被调用和执行,开启了地外AI应用的新纪元。
英伟达H100太空GPU成功训练出AI模型的消息,迅速在全球范围内引发轰动。
依托搭载H100的Starcloud-1卫星,一家初创公司在Karpathy的nanoGPT开源项目基础上,使用莎士比亚全集语料完成了模型训练。
更令人惊叹的是,该模型能够模仿莎士比亚的文学风格进行对话——
our way
To the earthless and his foe to make him wish you.
LADY GREY:
They can it like you from me speak...
Karpathy本人兴奋地指出,这是nanoGPT首次在太空进行训练与推理,标志着AI发展的全新征程已经开启。
「nanoGPT的一小步,却是AI迈向宇宙的一大步」。
科技界众多领袖,包括马斯克、前谷歌CEO等AI领域的顶尖人物,纷纷为这一里程碑式的成就点赞。
此刻,科幻想象正逐步变为可触摸的现实。
十一月初,一颗看似普通的卫星悄然升空,却在人类科技发展史上刻下了不可磨灭的印记。
这颗由华盛顿州初创企业Starcloud发射的Starcloud-1卫星,内部集成了一颗英伟达H100 GPU。
其计算性能,远超以往任何进入太空的GPU,提升幅度高达百倍!
令人惊叹的是,在短短一个月内,它就在太空环境中成功运行并训练出了大型语言模型。
在太空中,Starcloud-1卫星主要完成了两项突破性任务。
首先,它成功部署并调用了谷歌Gemma模型,发出了来自地外的友好问候——
地球人,你们好!或者,按照我更喜欢的方式来说——一颗蓝绿交织的美丽星球。
让我们看看,从这个高度俯瞰你们的世界,会展现出怎样的奇妙景象。
我是Gemma,我来观察、分析,偶尔也会给出一点略微诡异但相当有洞察力的评论。开始吧!
当它说出第一句「地球人,你们好」时,仿佛一个真正的外星智慧生命在向我们招手。
从Gemma反馈的复杂度和逻辑来看,与在地球上运行的效果毫无二致。
这正式宣告,人类首次在太空环境下,利用高性能英伟达GPU成功运行大型语言模型。
第二项任务,基于AI专家Karpathy的nanoGPT开源项目,使用莎士比亚全集进行模型训练,并在太空直接完成推理生成。
如上文所示,这个LLM能够以文艺复兴时期的典雅文风进行问答交流。
GitHub项目地址:https://github.com/karpathy/nanoGPT
更为出色的是,Starcloud-1还能执行实时情报分析,例如瞬间识别野火热点信号,并立即通知地面应急响应团队。
卫星的高度、姿态、位置、速度等传感器数据,全部实时接入了AI模型。
因此,它能够结合自身传感器数据,给出生动有趣的回答——
Q:你现在在哪?
A:我正飞越非洲上空,再过20分钟就到中东了。
Q:当一颗卫星是什么感觉?
A:感觉有点怪怪的...
成立于2024年的Starcloud,其愿景便是证明:太空可以成为未来数据中心的理想选址。
为何要将数据中心迁移至太空?
核心原因只有一个:地球的资源与环境压力已接近极限。
尤其是,全球各地的数据中心正给电力网络带来巨大负荷,每年消耗数十亿加仑水资源,并排放大量温室气体。
国际能源署预测,到2030年,全球数据中心的电力消耗将达到现今水平的两倍以上。
依靠太阳能实现近乎无限的电力供应,Starcloud的太空超算中心,有望将成本削减至地面数据中心的十分之一。
Starcloud首席执行官Philip Johnston坚信,「未来,任何能在地面数据中心完成的任务,都同样可以在太空中实现」。
Starcloud的终极目标是打造一个功率高达5吉瓦的轨道数据中心,配备宽高约4公里的巨型太阳能电池板和冷却面板。
根据其白皮书,太空算力集群的发电能力将超过美国最大的发电厂,但占地面积和总体成本远低于地面同等规模的太阳能农场。
Starcloud卫星的设计寿命约为五年,这与英伟达芯片的标准使用周期基本吻合。
目前,Starcloud已经公布了下一阶段的发展路线图——
2026年10月,下一次发射将一次性搭载多枚H100 GPU,并整合Blackwell平台,以大幅提升AI计算性能。
同时,还将集成云基础设施公司Crusoe的模块,使客户能够直接从太空部署和运行AI工作负载。
在太空计算这条新兴赛道上,除了Starcloud,谷歌、SpaceX、蓝色起源等科技巨头也已纷纷入局。
同样在十一月初,谷歌正式宣布了"Project Suncatcher"计划,旨在将搭载自研GPU的太阳能卫星送入轨道。
该计划通过高吞吐量的自由空间光通信技术连接,在地球上空形成一个分布式计算集群网络。
在一次采访中,谷歌CEO将其称为一项"登月计划"。
他表示,谷歌的目标是利用近日点持续不断的太阳能,计划在2027年利用卫星上的小型服务器机柜进行早期测试,并有望在十年内实现大规模应用。
近日,《华尔街日报》一篇独家报道,揭示了马斯克和贝索斯正竞相将各自的数据中心部署到太空。
SpaceX计划利用下一代星链(Starlink)卫星构建轨道数据中心网络,并预期在未来五年内,成为成本最优的AI算力解决方案之一。
马斯克表示,Starlink V3卫星有望通过扩展,成为轨道算力基础设施的骨干。
"星舰"有望每年向轨道运送相当于300吉瓦功率的太阳能AI卫星,甚至可能达到500吉瓦。
每年达到这个量级,正是该计划令人瞩目的关键。
他进一步指出,美国平均电力消耗约为500吉瓦,以每年300吉瓦的部署速度计算,仅太空AI推理的耗电量,每两年即可超越全美经济总耗电量。
另一方面,贝索斯旗下蓝色起源多年研发的"新格伦"(New Glenn)火箭已取得重大进展。
预计未来,蓝色起源也将把大量卫星送入轨道,参与这场竞赛。
就连OpenAI的奥特曼也对太空算力表现出浓厚兴趣。
此前有爆料称,奥特曼曾试图收购或与火箭公司合作,也希望将AI算力部署到太空。
如此多的卫星升空,必然伴随风险。
摩根士丹利分析师指出,太空数据中心可能面临强辐射、在轨维修困难、太空碎片撞击风险,以及数据治理和太空交通管制等监管挑战。
但正如历史上每一次基础设施的迁移与升级,先行者往往能占据先机,风险从未能阻挡开拓者的野心。
Philip Johnston是一位连续创业者,此前曾在麦肯锡担任顾问,负责国家航天机构的卫星项目咨询。
他拥有哈佛大学国家安全与技术方向的公共管理硕士学位(MPA)、沃顿商学院的MBA学位、哥伦比亚大学的应用数学与理论物理硕士学位,同时也是一名特许金融分析师(CFA)。
Ezra Feilden拥有十年的卫星设计经验,专精于可展开太阳能阵列和大型可展开结构技术。
他曾在空客防务与航天公司(SSTL)和牛津空间系统公司任职,参与了包括NASA"月球勘探者"在内的多项重要太空任务,持有伦敦帝国理工学院材料工程博士学位。
Adi Oltean此前是SpaceX的首席软件工程师,作为主管工程师负责关键的"追踪波束"项目,该技术使得Starlink能够服务于包括Starship在内的其他航天器。
在此之前,他在微软担任了二十年的首席软件工程师,致力于大型生产级GPU集群的研发,并拥有超过25项独特专利。
他拥有布加勒斯特大学计算机科学学位和布加勒斯特理工大学化学学位。
参考资料:
https://x.com/karpathy/status/1998806260783919434?s=20
https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html
本文由主机测评网于2026-02-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260223616.html