数据核心狂飙时代的三道坎

发布时间:2026-02-23 18:44

  高盛也给出了一个估算:到 2030 年,美国需要净增跨越 50 万名工人,笼盖制制、扶植、运维以及输配电等各个环节,才能满够数据核心扩张带来的电力摆设需求。

  第一个是“矫捷负载办理”,说白了就是正在用电高峰期让数据核心自动降低负荷。杜克大学做过一个研究,若是数据核心情愿接管每年 0。25% 的停机时间(也就是 99。75% 的一般运转),美国电网能多承载 76 GW 的新负载;若是能接管 0。5% 的停机(99。5% 一般运转),这个数字能到 98 GW。

  听起来挺夸姣,但 Monroe 泼了冷水。他说这事儿有两个大妨碍:一是行业生成就怕风险,IT 设备屡次开关机谁都不敢等闲测验考试;二是光靠市场激励还不敷,可能需要监管层面强推才行。所以这个方案理论上能解锁 100 GW 的容量,现实落地还得看。

  Monroe 说这个体例的成本是电网供电的 5 到 20 倍,听着吓人,但对于那些大型 AI 数据核心来说,考虑到利润空间,这笔账仍是算得过来的。正在短短 4 个月内建成了一个 10 万块 GPU 的集群,摆设了跨越 500MW 的现场电力,OpenAI和 Oracle 已正在德克萨斯州订购了 2。3GW 的现场天然气发电厂 。

  当然手艺也正在前进。Monroe 提到了芯片级液冷和高温水冷这些新手艺,能正在更多地舆实现高效散热。但他也指出,托管型数据核心(co-location)很难跟进这些新手艺,由于它们客户群体太杂,必需正在扶植晚期就确定冷却架构,没法矫捷调整,所以仍是会用保守的冷水机组。

  具体来说,保守蒸发冷却系统的PUE(电力利用效率)能做到 1。08,意味着只要 8% 的能源用正在了非计较环节。但换成闭环无水系统之后,PUE 会飙到 1。35-1。40,也就是说能源开销从 8% 跳到了 35%-40%。这个差距可不小。

  巧的是,SemiAnalysis上个月也出了一篇关于数据核心用水的阐发,SA认为数据核心用水的争议被过度强调,这些会商往往忽略了冷却架构、能源来历、地舆和本地水资本稀缺性等环节变量。Colossus 2做为全球数据核心,Colossus 2 的水耗损仅相当于 2。5 家 In-N-Out 门店,而餐饮行业全体水耗损规模弘远于数据核心。有乐趣的能够看下SemiAnalysis的那篇原文。

  Monroe 认为,手艺工人欠缺会成为继电力之后的下一个次要束缚。为了应对这个问题,行业组织正正在和手艺院校合做开辟培训项目,以至把触角伸到了中学。

  Monroe 说得很曲白,电力是当前最要命的近期束缚。云计较和 AI 推理这些营业必需离用户近,响应速度才快,所以都扎堆正在大城市周边。问题是这些处所本来用电就严重,数据核心一来,电网间接吃不用。

  Monroe 说,现正在的趋向是从高耗水的蒸发冷却转向闭环和无水冷却系统,特别是那些大型云办事商,转得出格快。听起来是功德,但有个价格:能耗大幅上升。

  星球比来对每天的早报(周内早上9点前更新)做了一个很大的更新,之前的早报次要以头一天海外的旧事总结为从,内容都不是很长。

  第二个挑和是水。保守数据核心的冷却系统出格耗水,用的是蒸发冷却手艺。但现正在环境变了,社区不干了,监管收紧了,芯片手艺也正在前进,整个行业起头往节水标的目的转型。

  Monroe 认为,数据核心不是通俗的工业建建,它需要极其专业的电气和机械系统,这意味着电工和管道工是整个扶植过程中的环节脚色。而现正在的问题是,这些手艺工人严沉欠缺。

  虽然无水冷却的份额正在上升,Monroe 判断冷水机组的需求正在将来十年仍是会大幅增加,缘由很简单——数据核心全体规模正在迸发式增加,即便占比下降,绝对量仍是正在涨。

  但AI 锻炼就没这个顾虑。锻炼模子对地舆没啥要求,哪儿有电往哪儿搬,所以现正在良多锻炼使命都正在往偏僻地域迁徙。这种分化其实挺较着的:推理要速度,锻炼要电量,各取所需。

  第二个方案更间接也更贵——Behind-the-Meter(BTM),也就是本人建发电坐。现正在曾经有一小部门数据核心正在这么干了,次要用天然气发电机。