人工智能可助企业更环保,但其自身亦消耗大量能源——《华尔街日报》
Nuha Dolby
作者:努哈·多尔比2023年9月11日 上午10:20(东部时间)|WSJ专业版人工智能有助于应对气候变化,但要实现这一潜力,企业需设法限制AI自身的气候影响。
据多方估算,信息与通信技术已占全球温室气体排放量的3%。数据中心排放量与航空业相当,并消耗大量水资源。随着AI发展,训练和运行大语言模型所需的能源将不断增加。
但AI也能通过提升系统效率减少排放。字母表公司旗下谷歌与美国航空公司合作,利用AI帮助飞机减少导致全球变暖的凝结尾迹。谷歌还运用AI预测河流洪水,并在地图服务中推荐环保路线。旧金山初创公司Verse正使用AI简化企业获取清洁能源的流程。AI甚至被用于生成气候变暖后的世界图像——从描绘沿海城市遭受海水侵蚀到绘制野火频发的干旱地区。
随着AI更深融入社会,实现气候影响中性(若非积极)至关重要。对多数使用AI的企业而言,其碳排放与水资源利用同时存在正负效应。在追求雄心勃勃的净零目标时,这需要精妙的平衡。
随着人工智能的发展,训练和运行其大语言模型所需的能源将不断增加。图片来源:奥马尔·马克斯/祖马通讯社### 能源失衡
AI应用开发商Hugging Face的研究科学家萨莎·卢奇奥尼与另外两名研究人员合作,绘制了一个拥有1760亿参数、名为Bloom的机器学习模型在整个生命周期内的碳足迹——他们的发现令人震惊。
她说,除了训练模型所使用的能源之外的因素——该领域的大多数研究都没有考虑到这些因素——“最终变得如此重要,以至于使总排放量翻了一番。”
例如,制造图形处理单元——一种加速深度学习计算的硬件——需要纯水和稀有金属。这增加了气候成本。Bloom在其训练中使用了1000多个这样的GPU,而这只是卢奇奥尼团队在他们的研究中评估的众多外部因素之一。
但与Bloom参数规模相似的模型,如OpenAI的ChatGPT-3,碳排放量明显更高——高出20多倍——消耗的电力大约是Bloom的三倍。
卢奇奥尼说,能源来源是造成排放差异的一个重要因素。如果用于训练模型的电力来自更“清洁”的能源,那么即使不改变大学习模型的规模,也可以减少碳排放。
在美国,由于没有中央电网,在一个州与另一个州训练模型会对碳排放产生重大影响。在拥有大量风能的加利福尼亚州,排放量可能低于在弗吉尼亚州等主要依赖化石燃料发电的州使用能源训练完全相同的模型。
若布鲁姆模型在环保标准上优于其他大型语言模型,这种优势仍是相对的。根据斯坦福大学2023年4月报告,该模型在2022年3月至7月的训练期间消耗的能源,相当于为美国家庭平均供电41年。其训练过程产生的碳排放量,是纽约至旧金山往返航班单名乘客排放量的25倍,更超过美国人年均碳排放量的三分之一以上。
俄勒冈州的谷歌数据中心。2022年该公司数据中心现场用水总量较2021年增长约20%。图片来源:Andrew Selsky/Associated Press### 深陷水危机
加州大学河滨分校电气与计算机工程教授任少雷今年研究显示,人工智能还非常"耗水"。
其研究表明,ChatGPT-3进行20至50次问答的基础对话需"饮用"500毫升瓶装水(具体取决于发电方式)。尽管平台和训练过程的保密性导致缺乏公开数据难以准确推断,但ChatGPT-4的耗水量可能更高。
该团队估算,谷歌LaMDA大语言模型仅训练环节就消耗约百万升水。2022年谷歌数据中心现场总用水量较2021年增长约20%。
“无论我们在何处用水,都致力于负责任地使用。这包括尽可能使用替代淡水的资源,如废水、工业用水甚至海水。”该公司在去年底的博客文章中表示。谷歌设定了2030年目标,平均为其办公室和数据中心的用水量补充120%。
谷歌的研究估计,训练LaMDA模型产生的碳排放量为26吨,相当于约22名乘客在旧金山和纽约之间往返航班的排放量。
与电力使用类似,用水效率也取决于水源地。微软去年表示,其亚洲数据中心的实际用水效率比美洲地区低三倍,这意味着相同AI训练的用水量可能因地理位置而增加三倍。这是因为亚洲通常更热,需要水冷式冷却器。
任的研究表明,季节变化也会带来巨大差异——夏季数据中心因高温蒸发可能需要更多水。综合考虑季节和数据中心位置,他的估算显示最高总水足迹可能比最低值高出三倍以上。
限制影响
任的研究致力于找出优化方法,以帮助平衡数据中心的碳排放和用水,同时在地理上分担这些负担,这样就不会有任何一个地区独自承担环境成本。
任表示,由于人工智能的工作——训练和使用——是通过互联网进行的,可以采取简单的步骤,比如更换任务发送的数据中心位置。将请求转移到由清洁能源供电的数据中心,或者转移到较冷地区、用水较少的数据中心,这种改变可以为气候带来累积的积极影响。“从用户的角度来看,差别不大,”任说。
例如,谷歌表示,它正在利用人工智能加速气候行动,为个人和组织提供更好的信息以做出选择。“我们已使用经过验证的方法大幅减少工作负载的碳足迹,帮助将训练模型的能耗降低高达100倍,排放减少高达1000倍。我们计划继续应用这些经过验证的方法,并不断开发新的方法,使人工智能计算更加高效,”谷歌发言人阿玛利亚·康特西说。
Equinix是一家拥有248个数据中心的互联网服务公司,也在寻找解决方案。该公司可持续发展副总裁克里斯托弗·韦利斯表示:“致力于设计、建造和运营由清洁能源驱动的高效数据中心基础设施。”
随着人工智能日益融入社会,实现中立乃至积极的净气候影响至关重要。图片来源:马克·伦尼汉/美联社根据Equinix公司2022财年可持续发展报告,其运营负荷的可再生能源覆盖率达96%,这是连续第五年超过90%。今年早些时候,该公司还在西班牙支持建设了五个新太阳能农场,以确保数据中心获得可持续电力。
与此同时,Hugging Face的研究员卢西奥尼指出,限制排放的一个实际措施是避免将AI整合到非必要平台中。
“如果仅仅为了替换原本运行良好的技术系统,就全面改用这些能耗高得多的新应用,这些光鲜玩具的代价将是不可持续的。“卢西奥尼表示。
本文发表于2023年9月12日印刷版,标题为《人工智能既能助力环保,也是能源黑洞》