电力撞墙与轨道算力:AI 基础设施的下一个跃迁
版本:v2.1(去除署名) 时间:2026年5月
2026年的AI基础设施面临一个朴素的事实:地球不够用了。
不是计算理论不够用,不是算法不够用——是电力、土地、水、电网线路的物理极限不够用。当一个数据中心吃掉一座中型城市的电力,下一步只能往别处去。而”别处”已经不在地球上。
一、地面已经撞墙
Section titled “一、地面已经撞墙”当前规模坐标
Section titled “当前规模坐标”- Colossus 1:22万+张GPU,300+MW,孟菲斯
- Colossus 3:在建,继续扩张
- 全球AI数据中心电力增速远超电网新增容量,IEA已将AI单列为电力消费主体
三个物理瓶颈
Section titled “三个物理瓶颈”- 电力:单个超大数据中心动辄数百MW至GW级,相当于一座中型核电站的输出。增量产能至少3-5年。
- 冷却:液冷需要大量水或闭环系统,水资源紧张地区难以扩张;空冷在高密度GPU机柜下已不可行。
- 土地与电网:高压输电、变电站、土地审批,工期往往比建数据中心本身更长。
短期解都不够用
Section titled “短期解都不够用”- 重启/扩建核电(微软-Three Mile Island、Amazon-Talen等)
- 自建天然气发电
- 重新激活退役煤电
这些都是数年级别的工程,而模型规模和推理需求是季度级别的曲线。节奏不匹配。
二、轨道算力的诞生
Section titled “二、轨道算力的诞生”- 2026年2月:xAI并入SpaceX,形成SpaceXAI
- 2026年5月6日:SpaceXAI将Colossus 1全部算力租给Anthropic,缓解Claude系列爆炸式增长的算力压力
- 双方同步探讨**轨道AI算力(Orbital Compute)**的长期合作
这不是一条偶然的商业新闻。它揭示了一个底层判断:地面已经救不了AI算力的指数曲线,下一个跃迁必须发生在轨道上。
三、为什么是太空
Section titled “三、为什么是太空”轨道算力听起来像科幻,但每个理由都很硬。
1. 24小时不间断阳光
Section titled “1. 24小时不间断阳光”地球同步轨道或合适的太阳同步轨道上,太阳能板几乎无遮挡地持续发电。地面光伏的实际可用率不到25%(夜晚、阴天、纬度损失)。太空光伏的能量密度是地面的4倍以上。
2. 真空天然散热
Section titled “2. 真空天然散热”数据中心的另一半成本是散热。真空中靠辐射冷却(Stefan-Boltzmann定律),不需要水、不需要冷却塔、不需要冷媒泵。散热面积大,但不需要消耗物质。
3. 零土地、零电网、零水
Section titled “3. 零土地、零电网、零水”没有征地、没有变电站、没有高压线、没有取水许可。整套地面基础设施被消除。
4. Starship运力的拐点
Section titled “4. Starship运力的拐点”可重复使用的百吨级LEO运力把每公斤入轨成本压到了历史低点。当入轨价格降到几百美元/kg级别,部署一座轨道算力站的资本支出已经接近建一座地面超算的水平——但运营成本结构完全不同。
四、绕过SBSP的最大难题
Section titled “四、绕过SBSP的最大难题”传统**空间太阳能(SBSP, Space-Based Solar Power)**几十年来卡在一个问题上:怎么把电传回地球?
微波或激光下行的效率、安全、地面整流站、监管,从来没有真正解决过。每次SBSP计划被提出,都倒在这一步。
轨道算力把这个问题消除了。
电不回传,计算结果以数据形式回传。一公斤数据比一公斤电力容易传输得多——激光通信链路已经在Starlink、月球任务上验证过。
把”太空发电”和”太空计算”耦合起来,等于:
太阳能板 → AI芯片 → 数据下行(发电) (在轨计算) (激光/Ka波段)这是为什么轨道算力可能比SBSP先成熟——它不需要解决SBSP最难的那一步。
五、工程挑战
Section titled “五、工程挑战”不要美化。轨道算力要面对的硬问题清单:
1. 辐射加固
Section titled “1. 辐射加固”宇宙射线和太阳粒子事件会引发单粒子翻转(SEU)、闩锁、剂量累积。商用GPU不能直接上天,需要硬件级冗余、ECC全栈覆盖,或专用工艺(SOI、辐射加固设计)。
真空中只能靠辐射散热。功率1MW的算力站,散热面积要做到数千平方米(取决于冷端温度)。这是工程上的真正瓶颈——可能比电力本身更难。
3. 在轨维护
Section titled “3. 在轨维护”GPU故障率即便降到0.1%/年,22万张卡也意味着每天上百次替换。需要与Starship/Dragon级别载具配合的模块化在轨更换能力,或可冗余降级运行的设计。
4. 上下行带宽
Section titled “4. 上下行带宽”激光通信容量决定了轨道算力能承担多大比例的工作负载。很可能的分工:
- 训练(Train):仍在地面,数据密集型
- 推理(Inference):向轨道转移,计算密集 + 输出数据小
5. 政策与轨道资源
Section titled “5. 政策与轨道资源”低轨已经拥挤,Kessler症候群风险上升;国际监管尚不成熟;频谱分配竞争激烈。
| 阶段 | 时间 | 规模 | 形态 |
|---|---|---|---|
| 演示级 | 2027-2028 | kW-MW | 搭载在Starlink V3或专用平台,单星AI推理实验 |
| 过渡级 | 2029-2031 | 百MW | 专用轨道算力站,以推理为主 |
| 规模级 | 2032+ | GW级 | 与地面Colossus同量级的轨道集群 |
最大不确定性来自散热和在轨维护的工程化进度,其次是激光通信的商业化带宽成本。
AI第一次倒逼人类把基础设施搬出地球。这不是因为浪漫,是因为电网、河水、土地——这些地球资源——已经成为算力曲线的天花板。
二十世纪我们用石油把工业搬到了海上和地下。 二十一世纪AI会把计算搬到天上。
发电不再是问题,散热和带宽才是新一代瓶颈。这是把工业基础设施从二维(地表)推向三维(轨道)的根本动力。
下一篇:《Token Processor与3D打印:重构工业技术栈》——讨论数字端和物理端如何同时被重新定义。