智东西9月11日消息,据美联社报道,构建类似ChatGPT这样的AI产品的成本很难衡量,目前水资源消耗巨大的问题尤其突出。
例如每次向ChatGPT给出5-50个提示或问题,它就会消耗500毫升的水用于冷却计算设备和为数据中心供电的发电厂,而ChatGPT用户超过1亿人,总耗水量将相当惊人。研究报告显示,微软全球用水量飙升34%,谷歌用水量增加20%,AI技术开发商需要对大模型开发大量消耗水资源引起重视。
构建大语言模型需要机器对大量人类撰写的文本进行分析,而所有的这些计算都会消耗大量电力并产生大量热量,数据中心需要抽水到冷却塔来保持机器的凉爽,但这些用于冷却的水资源本是提供给当地居民的饮用水。因此,AI技术开发商需要思考如何提高训练大模型的效率,同时增加使用清洁能源为数据中心供电,以实现可持续发展目标。
一、用水量微软增长34%、谷歌增长20%,AI大模型开发项目耗水量巨大
根据微软最新的环境报告,从2021年到2022年,其全球用水量激增了34%,用水量达到近17亿加仑,相当于2500多个奥运游泳池的用水量,与前几年相比大幅增加,外部研究人员认为这与微软的AI开发有关。
加州大学河滨分校(University of California, Riverside)的研究员任少磊(Shaolei Ren)认为,微软公司全球用水量的大部分增长都是因为AI,其中包括微软对生成式AI的大量投资和与OpenAI的合作。微软支持的OpenAI技术需要大量的水,这些水是从爱荷华州中部的浣熊河和得梅因河的交汇处抽取的,用来给一台强大的超级计算机降温,帮助其AI系统学习模仿人类写作。
OpenAI
任少磊一直在尝试计算出ChatGPT等生成式AI产品对环境的影响。在今年晚些时候将要发表的一篇论文中,任少磊的团队估计,每次向ChatGPT给出5-50个提示或问题,它就会消耗500毫升的水,这个范围会根据服务器所在地和季节有所变化。所消耗的水不仅用于直接冷却服务器,还用于冷却为数据中心供电的发电厂。
不仅是微软,同一时期,谷歌的用水量也增长了20%,任少磊仍然将其归因于AI的开发训练。不过谷歌的用水量增长并不均匀。在俄勒冈州,谷歌的用水量比较稳定,但该州庞大的用水量引起了公众的关注;而在拉斯维加斯以外的地区,谷歌的用水量则翻了一番。此外,谷歌在爱荷华州的数据中心对可饮用水的需求也非常大,比谷歌在其它地方的数据中心都要多。
微软、OpenAI和谷歌等行业领先的技术开发商在竞相利用生成式AI的同时,都承认开发AI产品是一项高成本的工作,其中,从订购昂贵的半导体到用水量激增都在推动成本上涨,未来,关于AI模型的开发不仅要关注其碳足迹,其水足迹也需要重视起来。
二、选址合理、积极配合政府,微软与OpenAI将采取一系列措施实现可持续发展
2019年,微软向OpenAI投资10亿美元,两家公司首次达成合作。合作交易中,微软需要为OpenAI提供其训练AI模型所需的计算能力。专家们认为,因为需要在计算内核之间传输大量数据,在单个地点对人工智能模型进行预训练是很重要的。
为了完成训练AI模型的工作,微软与OpenAI将目光目光投向了爱荷华州的西得梅因市(West Des Moines),这是一座拥有6.8万人口的城市。十多年来,微软一直在那里建设数据中心以支持其云计算服务,并且微软在当地建设的第四和第五个数据中心将于今年晚些时候投入使用。
对于与OpenAI合作开发超级计算机的选址,微软没有很快公布。2020年微软首次公开其正在为OpenAI开发世界上最强大的超级计算机之一,当时拒绝向美联社透露位置,但描述了这个超级计算机是一个拥有超过285000个传统半导体核心和10000个图形处理器的“单一系统”,其中用到的图形处理器是对AI工作负载至关重要的芯片。
直到5月底,微软总裁Brad Smith才透露,微软已经在爱荷华州建立了“先进的AI超级计算数据中心”,专门让OpenAI在那里训练其第四代大语言模型GPT-4。该模型现在为高级版本的ChatGPT和微软自己的一些产品提供动力,并加速了一场关于遏制AI社会风险的讨论。
微软总裁Brad Smith讲话
从某些方面来看,西得梅因市是训练强大AI系统相对高效的地方,特别是与微软在亚利桑那州的数据中心相比,在同样的计算需求下,西得梅因市的数据中心消耗的水资源要比亚利桑那州的数据中心少得多。就像任少磊说的那样:“这两个地方在训练方面没有什么区别,但在用水和能源消耗方面,两者有很大差异。”
因为在一年中的大部分时间里,爱荷华州的天气足够凉爽,微软可以使用室外空气来保持超级计算机的正常运行,并将热量排出大楼。微软在一份对外公开的文件中提到,只有当温度超过29.3摄氏度时,数据中心才会利用水来降温。
可是尽管如此,微软仍然需要大量的水资源,特别是在气温较高的夏天。根据西德梅因市自来水公司的数据,2022年7月,也就是OpenAI声称完成GPT-4训练的前一个月,微软向其位于爱荷华州的数据中心群注入了大约1150万加仑的水,相当于该地区总用水量的6%左右,而该自来水公司能够调用的水资源还需要供应给当地居民作为饮用水。
2022年,西德梅因市自来水公司发文件称,只有微软的数据中心项目能够“展示并实施技术来显著减少峰值用水量,以保障居民和其他商业需求的用水供应”时,他们才会考虑接受微软未来的数据中心项目。微软对此回应,他们正在直接与自来水公司合作,以解决自来水公司的反馈意见。
在回答美联社关于用水量的提问时,微软在本周的一份声明中提到,他们正在投资研究测量AI的能源和碳足迹,同时也在努力研究如何使大语言模型系统在训练和应用时更加高效。
微软的该篇声明称:“我们将继续监测我们的排放情况,在增加使用清洁能源为数据中心供电、购买可再生能源等方面加快进展,并通过其它努力,共同发力来实现我们的可持续发展目标,即到2030年实现负碳、正水和零浪费。”
OpenAI在其周五的声明中也表达了同样的观点,称其已经认识到训练大语言模型可能会耗费大量能源和水资源,他们正在认真思考如何更好地利用AI的计算能力,提高AI工作效率。
结语:AI技术发展背后的巨大能源消耗需要各方加强重视
微软全球用水量飙升34%,谷歌用水量增加20%,研究人员认为两家公司的用水量激增与其AI开发项目有关,并且微软、OpenAI和谷歌等行业领先的技术开发商均承认训练AI带来的用水量激增提升了其开发成本,他们需要采取提升大语言模型效率、使用清洁能源等行动实现可持续发展目标。
同时,AI开发项目所在地的政府也重视水资源消耗巨大的问题,避免企业大量用水为当地居民使用生活用水和饮用水造成不便。
未来,生成式AI开发中水资源消耗巨大的问题是否会得到缓解,我们将继续关注。