数据中心通过将服务器浸入液体中降低能耗——彭博社
Coco Liu
浸没式冷却是一种将服务器和其他数据中心硬件浸入特殊液体的技术。
图片由Submer提供
当丹尼尔·波普几年前首次提出将服务器浸入液体中以节能降温的设想时,数据中心设备制造商们对此普遍持怀疑态度。但如今,波普创立的巴塞罗那初创企业Submer已成为价值数百万美元的企业,并与英特尔公司和戴尔科技集团等科技公司展开合作。
这种态度转变反映出一个紧迫挑战:如何以更低能耗运营数据中心。根据国际能源署四月发布的报告,这些支撑着从TikTok到ChatGPT和谷歌地图等数字设施的电力消耗,去年已超过波兰、比利时和挪威三国的总和。到2030年,这一数字预计将翻倍以上,主要受人工智能巨大计算需求驱动。数据中心高达40%的能源消耗用于冷却计算硬件,这使其成为创新成熟领域。
据领先能源管理公司施耐德电气称,在提高能效的多种途径中,液体冷却(包含Submer解决方案在内的统称)有望帮助降低数据中心10%以上的能源需求。
施耐德电气数据中心解决方案专家史蒂文·卡尔利尼表示:“虽然10%看起来不多,但考虑到一个AI数据中心可能消耗超过100兆瓦电力,相当于约7.5万户美国家庭的用电量。在这种规模下,能耗降低10%已是值得振奋的进展。”
随着全球AI热潮将传统冷却方式推向极限,数据中心运营商正转向液浸冷却技术以提升能效。图片来源:Submer数据中心的高耗电特性使其成为不受欢迎的邻居。都柏林当局去年以驳回了谷歌母公司Alphabet在当地建设数据中心的申请,理由是对本已紧张的电网可能造成影响。最近几个月,反对数据中心的标语已出现在全美多个社区。
尽管科技巨头已投入数十亿美元赞助清洁能源项目,但其增加无碳电力的努力远未达到需求。例如微软公司去年二氧化碳排放量较2020年增加23%,部分原因在于数据中心快速扩张。谷歌过去五年碳排放量也增长了48%。
一种看似婴儿油的冷却液
为解决这一难题,近年来半导体制造商和数据中心运营商开始探索使用液体直接冷却芯片。例如微软的Maia 100芯片就设计为连接冷板——一种通过底部流动液体保持低温的金属装置。这家科技巨头还表示有意进一步开发能让整个计算硬件在液体槽中运行的数据中心。
这项被称为浸没式冷却的技术,需要将整个服务器机架(装载服务器、交换机、路由器等计算设备的框架)浸入不导电的特制液体中。行业观察家指出,该方法比直接芯片冷却更高效,但浸没式冷却仍存在挑战,这个新兴领域要实现规模化应用还有很长的路要走。
Submer公司采用一种类似婴儿油的不可燃合成液体。联合创始人Pope表示,这种以石油天然气工业原料在实验室研发的冷却剂也可用棕榈油制成。市面上多数浸没冷却液含有难以自然降解的"永久化学品"PFAS,但Submer的冷却剂是可生物降解的。该液体吸收电子设备产生的热量,通过冷却容器内的热交换器散热后,再返回机架进行下一轮冷却。
这种方法不仅降低了能耗,还解决了另一个问题。国际能源署指出,美国一个100兆瓦的数据中心平均每天消耗约200万升水,其中大部分用于冷却。尽管部分运营商已开始为数据中心配备水循环利用系统以减轻环境影响,但巨大的用水需求已成为数据中心开发商与当地社区之间的新矛盾点。
Submer公司采用类似婴儿油的可燃性合成液体进行冷却。图片来源:Submer从某种角度看,计算硬件如同人体:在特定温度下才能发挥最佳性能。为防止服务器过热,许多数据中心采用强力空调向巨型服务器机房输送冷风。但液体比空气更能高效带走固体热量,Submer表示其浸没式冷却容器能在更高温度下完成相同任务。
Submer首席执行官丹尼尔·波普指出,温差优势加上浸没式冷却直接针对发热设备而非整个空间的特性,使该策略更节能。格罗宁根大学在2023年荷兰政府资助的研究中发现,采用浸没式冷却的数据中心比传统风冷节能约50%。研究人员表示,这种方式还能减少数据中心占地面积。
难以承受的高温
一个多世纪以来,液体冷却技术一直被用于变压器等高压设备的降温,但在数据中心领域几乎无人问津,直到近期计算需求激增将传统冷却方法逼至极限。
施耐德电气的卡利尼指出,全球对高性能AI工具的渴求不仅引发了数据中心建设热潮,更使得维持计算硬件在最佳温度运行变得异常困难。以英伟达最新AI芯片Blackwell B200 GPU为例,其功耗达到前代产品Hopper H200的近两倍。芯片功耗越高,散热越大,所需冷却能力就越强。而一个数据中心可能部署数百甚至数千枚此类芯片。
截至目前,Submer公司的冷却容器已在17个国家数十个数据中心落地。这家初创企业去年营收从2018年商业销售首秀时的约60万欧元飙升至逾1.5亿欧元(1.69亿美元)。“过去两年呈现指数级增长,“其CEO表示。
尽管具备节能优势,浸没式冷却技术要实现规模化应用仍有长路要走。图片来源:Submer其他企业也正虎视眈眈这片新兴市场,包括荷兰Asperitas、美国LiquidStack和日本富士通。即便如此,该技术当前市场规模仍不足行业冷却支出的零头:2023年全球浸没式冷却市场仅4亿美元,而同期全球数据中心冷却支出高达近130亿美元。
更广泛采用仍面临一些障碍。虽然浸没式冷却可以帮助数据中心降低水电费用,但其本身并不低廉。Submer公司估计,其系统的部署成本可能比现有方案高出25%,不过该公司表示,在冷却需求巨大的数据中心,其成本已与风冷方案持平。
对于拥有现有设施的数据中心运营商而言,转向完全不同的冷却技术不仅需要改造计算硬件,还引发了基础设施安全方面的担忧:他们的地板能否承受装满液体的冷却容器的重量?
浸没式冷却解决方案缺乏行业标准又增加了一层复杂性。由于数据中心通常每隔几年就会淘汰服务器,运营商必须考虑如何确保今天部署的冷却容器与未来的计算硬件保持兼容。将服务器浸泡在液体中也使维护工作更加困难。
“一旦把它们放进冷却槽,任何更换都会非常麻烦,“卡里尼说。
这并不让波普担心,他将风冷服务器比作汽车。“你不应该把汽车放进水里,“他说。为此,Submer正与半导体行业合作开发"船”——专为这种新型冷却方法设计的新一代服务器。