随着ChatGPT引发新一轮人工智能(AI)热潮,而其背后带来的能耗问题也持续引发关注。
今年4月10日,芯片巨头 Arm公司CEO哈斯(Rene Haas)公开表示,包括ChatGPT在内的 AI 大模型需要大量算力,预计到2030年,AI 数据中心将消耗美国20%至25%的电力需求,相比今天的4%大幅增加。
公开数据显示,目前,ChatGPT每天需要处理超过2亿次请求,其电量消耗高达每天50万千瓦时。一年时间,ChatGPT光电费就要花2亿元人民币。
这意味着,ChatGPT日耗电量是普通家庭的1.7万倍以上。(美国商业用电一度约为0.147美元也就是1.06元,相当于一天53万元)
据荷兰咨询机构负责人Alex de Vries预计,到2027年,AI 行业每年将消耗850亿~1340亿千瓦时的电力,相当于瑞典或荷兰一个欧洲国家一年的总用电量。
马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看到,我们没有足够电力来运行所有的芯片”。
OpenAI CEO奥尔特曼(Sam Altman)也预计,AI 行业正在走向能源危机,未来 AI 技术发展将高度依赖于能源,人们也需要更多的光伏和储能产品。
这一切都显示出,AI 即将引爆全球新一轮“能源战争”。
不止是芯片,AI 还被能源“卡脖子”
过去500多天里,ChatGPT引发全球新一轮 AI 大模型和算力需求热潮。
微软、谷歌、Meta、OpenAI等多家全球科技巨头开始疯抢 AI 芯片,甚至亲自下场“造芯”,总规模超过数十万亿元美金。
实际上,AI 本质上是一种计算机技术和处理信息的技术,背后则需要大量GPU芯片,更底层则是大量电能、水力、风能、资金等资源的支持。
早在1961年,在IBM公司工作的物理学家拉尔夫·兰道尔(Rolf Landauer)发表了一篇论文,提出了后来被称为“兰道尔原理”(Landauer’s Principle)的理论。
这一理论认为,计算机中存储的信息发生不可逆的变化时,会向周围环境散发一点点热量,其散发的热量和计算机当时所处的温度有关——温度越高,散发的热量越多。
兰道尔原理连接起了信息和能量。更具体地说,它连接到了热力学第二定律上。因为逻辑上不可逆的信息处理操作,也就意味着湮灭了信息,这会导致物理世界中熵的增加,从而消耗能量。
这一原理自提出以来遭受过不少质疑。但近十几年来,“兰道尔原理”已被实验证明。
2012年,《自然》杂志发表了一篇文章,研究团队首次测量到了一“位”(bit)数据被删除时释放的微量热量。后来的几次独立实验,也都证明了“兰道尔原理”。
过去10多年间,现代电子计算机在计算时实际消耗的能量,是兰道尔理论值的数亿倍。而科学家们一直在努力寻找更高效的计算方法,以降低成本。
如今,AI 大模型爆发,它确实需要大量计算。因此,AI 不止被芯片“卡脖子”,还被能源“卡脖子”。
马斯克近期也在“博世互联世界2024”大会上表示,一年多以前,短缺的是芯片,明年你会看到电力短缺,无法满足所有芯片的需求。
中国科学技术信息研究所人工智能中心副主任李修全也表示,近年来, AI 大模型规模、数量都在高速增长,也带来对能源需求的快速增加。尽管短期内还不会很快出现“缺电”等问题,但未来大规模智能化时代来临后的能源需求激增不容忽视。
AI 大模型质量的关键在于数据、算力和顶尖人才,而高算力的背后,是靠着数万张芯片昼夜不停的运转支撑。
具体来说,AI 模型算力的工作过程大致可以分为训练、推理两个阶段,能源消耗也是如此。
其中,在AI训练阶段,首先需要收集和预处理大量的文本数据,用作输入数据;其次,在适当的模型架构中初始化模型参数,处理输入的数据,尝试生成输出;最后,通过输出与预想之间的差异反复调整参数,直到模型的性能不再显著提高为止。
从训练15亿参数的GPT-2,到训练1750亿参数的GPT-3,OpenAI模型背后的训练能耗十分惊人。公开信息称,OpenAI 每训练一次需要128.7度电,相当于 3000 辆特斯拉同时跑 32 公里。
据研究机构New Street Research估计,仅在AI方面,谷歌就需要大约40万台服务器,每天消耗62.4吉瓦时,每年消耗22.8太瓦时的能源。
而在推理阶段,AI 则会先加载已经训练好的模型参数,预处理需要推理的文本数据,再让模型根据学习到的语言规律生成输出。谷歌称,从2019年到 2021年,AI相关能源消耗60%都来自推理。
据Alex de Vries估算,ChatGPT每天大概要响应大约2亿个请求,耗电量超过50万度,按照一年电费就是2亿元人民币,比每个美国家庭的平均日用电量高1.7倍。
SemiAnalysis报告称,使用大模型进行问题搜索所消耗的能源是常规关键词搜索的10倍。以谷歌为例,标准谷歌搜索使用0.3Wh电力,而大模型每次互动的耗电量为3Wh。如果用户每次在谷歌搜索都使用AI工具,每年大约需要29.2太瓦时的电力,也就是每天约7900万度。这相当于给全球最大的摩天大楼,迪拜的哈利法塔,连续供电超过300年。
另据斯坦福人工智能研究所发布的《2023年 AI 指数报告》显示,每次 AI 搜索的耗电量大约为8.9瓦时。相比普通谷歌搜索,加入 AI 的单次耗电量几乎是一般搜索的30倍。而一个高达1760亿参数的模型,光是前期训练阶段就得用掉了43.3 万度电,相当于美国117个家庭一年的用电量。
值得注意的是,在Scaling Law(缩放规律)之中,随着参数规模不断跃升,大模型性能也不断提升,而对应的是,能耗也会越来越高。
因此,能源问题已经成为 AI 技术持续发展的关键“桎梏”。
GPT每天消耗50000升水,电和水是 AI 两大能源需求
AI不仅是“耗电狂魔”,更是“吞水巨兽”。
其中,在电力方面,除了上述信息外,据国际能源署(IEA)数据显示,2022年,全球数据中心消耗约460太瓦时的电量(相当于全球总需求的2%),随着生成式AI飞速发展,这一数字到2026年可能膨胀至620至1050太瓦时。
Alex de Vries预计,到2027年,AI服务器所消耗的用电量将等同于荷兰全国的能源需求量。最坏的情况就是,仅谷歌一家公司的AI就可以消耗与爱尔兰等国家一样多的电力。
IBM高级副总裁达里奥·吉尔曾表示,“AI能耗”是非常重要的挑战。生成式 AI 的高性能服务器的持续运行,将导致数据中心一半以上的电力消耗都被AI占据。据悉,预计到2025年,AI 业务在全球数据中心用电量中的占比将从2%猛增到10%。
那么,水能呢?大模型背后需要数据中心、云基础设施的支持,那就需要大量的“液冷”进行散热。
得克萨斯大学的一份研究指出,作为ChatGPT背后的重要支持力量,微软的Microsoft Azure云数据中心光是训练GPT-3,15天就用掉将近70万升的水,相当于每天花销约50000L水。
同时,ChatGPT每回答50个问题就要消耗500毫升水。公开信息称,2022年微软用水量达到640万立方米,比2500个奥林匹克标准游泳池的水量还多。
美国加州大学河滨分校副教授任绍磊团队预计,到2027年,全球AI可能需要4.2-66亿立方米的清洁淡水量,这比4-6个丹麦、或二分之一的英国的一年取水总量还要多。
除了数据中心,内置的GPU芯片也是能源消耗的重点领域之一。今年3月,英伟达发布史上性能最强AI芯片——Blackwell GB200,宣称是A100/H100系列AI GPU的继任者,性能相比H100提升30倍,但能耗却降低了25倍。
上个月,黄仁勋的一句“AI的尽头是光伏和储能”更是在网络疯传。尽管有网友扒出原视频称,黄仁勋本人并未说过这句话,更没有提及“光伏和能源”,但 AI 能耗严重,却是摆在公众面前的事实。
国际能源机构(IEA)在一份报告中强调了这个问题,全球 AI 数据中心的耗电量将是 2022 年的十倍,并指出部分原因在于 ChatGPT 这样的大模型所需的电力,远高于谷歌等传统搜索引擎。
不过,值得注意的是,由于科技巨头们并未正式披露过 AI 使用中的电力消耗数据,因此,目前关于 AI 耗电量的数据多为估算,并不一定是非常准确的数据。美国信息技术与创新基金会(ITIF)曾指出,个别不准确的研究高估了AI能耗。AI训练是一次性事件,它的使用是长期过程。人们应关注 AI 能耗的长期影响,并非爆发式增长。
有专家认为,目前大模型训练成本中60%是电费,能源开支已经严重制约着大模型的迭代升级。
金沙江创投主管合伙人朱啸虎近日也表示,可控核聚变实现前,我们并没有足够的算力实现真正的AGI。帮人类降低90%的工作可能未来3到5年可以实现,但最后的10%可能需要大量的算力和能耗。
如何解决 AI 能耗之困?硬件优化和核聚变或是重要手段
虽然黄仁勋也非常担忧能源供给,但他却给出了一个更乐观的看法:过去10年,AI 计算提高了100万倍,而它消耗的成本、空间或能源并未增长100万倍。
美国能源情报署发布的长期年度展望中估计,美国目前电力需求的年增长率不到1%。而按新能源公司NextEra Energy CEO约翰•凯彻姆(John Ketchum)的估计,在 AI 技术的影响下,这一电力需求年增长率将加快至1.8%左右。
波士顿咨询集团的报告则显示,2022年,数据中心用电量占美国总用电量(约130太瓦时)的 2.5%,预计到2030年将增加两倍,达到7.5%(约390太瓦时)。这相当于约4000万个美国家庭的用电量,即全美三分之一家庭的用电量。该集团还预计,生成式 AI 将至少占美国新增用电量的1%。
这意味着,即使数据中心、AI 新增用电量并不小,但还远不到毁天灭地的地步。
而在成本方面,国际可再生能源署报告指出,过去十年间,全球风电和光伏发电项目平均度电成本分别累计下降超过了60%和80%。上述业界人士也介绍说,“光伏的综合成本跟火电差不多,风电一半区域的综合成本比火电低了。”
因此,随着 AI 技术一路狂飙,我们又将如何应对即将到来的能源需求热潮?
钛媒体App根据一些行业专家的观点总结来看,目前解决 AI 能耗问题有两种方案:一是可以通过大模型或AI硬件优化降低能耗;二是寻找新的能源,比如核聚变、裂变资源等,以满足AI能耗需求。
其中,在硬件优化方面,对于能耗较高的万亿级 AI 大模型,可以通过算法和模型优化,压缩模型token大小及复杂度,以降低能源消耗规模;同时,企业也可以持续开发和更新能耗更低的 AI 硬件,如最新的英伟达B200,AI PC或AI Phone终端等;此外,通过优化数据中心的能效,提高电源使用效率,以降低能源消耗。
对此,中国企业资本联盟副理事长柏文喜表示,未来,还需要进行技术创新和设备升级,以进一步提高发电效率、提高电网输送能力和稳定性、优化电力资源配置、提高电力供应的灵活性、推广分布式能源系统并减少能源输送损耗,以此来应对算力发展带来的能源需求挑战。
中国数据中心工作组(CDCC)专家委员会副主任曲海峰认为,相关行业应该要重视提升数据中心用电能效,而不是抑制它的规模。数据中心并非要减少对能源的消耗,而是要提升能源消费的质量。
而在开发核聚变能源方面,由于可控核聚变由于原料资源丰富、释放能量大、安全清洁、环保等优势,能基本满足人类对于未来理想终极能源的各种要求。
核聚变的能量来源目前主要有三种:宇宙能源,即太阳发光发热;氢弹爆炸(不受控核聚变);人造太阳(受控核聚变能源装置)。
据统计,当前世界共有50多个国家正在进行140余项核聚变装置的研发和建设,并取得一系列技术突破,IAEA预计到2050年世界第一座核聚变发电厂有望建成并投入运行。
这种核聚变发电,将大大缓解全球因 AI 大模型需求造成的能源短缺情况。
2023年4月,奥尔特曼就“未雨绸缪”,以个人名义向核聚变初创公司Helion Energy投资3.75亿美元(约合人民币27.04亿元),并担任公司董事长。同时,去年7月,奥特特曼还通过旗下公司AltC与其投资的核裂变初创公司Oklo合并,斩获了一个估值约为8.5亿美元(约合人民币61.29亿元)的IPO,ALCC最新市值超过400亿美元。
除了奥尔特曼这种重金投资核聚变公司,亚马逊、谷歌等科技巨头则直接大手笔采购清洁能源。
据彭博数据显示,仅在2023年,亚马逊就购买了8.8GW(吉瓦)的清洁能源电力,已经连续第 4 年成为全球最大的企业清洁能源买家。Meta(采购3GW)和谷歌(采购1GW)等科技公司则位列其后。
亚马逊称,其90%以上的数据中心电力都来源于清洁能源产生的电力,预计能在2025年实现100%使用绿色电力。
实际上,以美国为例。清洁能源、AI、数据中心、电动汽车、挖矿等多种产业的增长,让原本陷入停滞的美国电力需求再度“起飞”。但即使被誉为世界上“最大的机器”,美国电网也似乎无法应对这突如其来的变化。
有分析师指出,美国70%的电网接入和输配电设施已老化,某些地区电网传输线路不足。因此,美国电网需要大规模升级,如果不采取行动,到2030年美国将面临一道难以逾越的国内供应缺口。
相对于美国,中国则对能源需求表达乐观态度。“AI再耗电,中国的体量和能力足以支撑,现在不进行大规模开发,是因为没需求。”一位风电行业人士表示,中国可规划的容量足够大,AI要是有大量电力需求,我现在就能上项目当中去工作。
目前,中国风电、光伏产品已经出口到全球200多个国家和地区,累计出口额分别超过334亿美元和2453亿美元。
随着 AI 呈现爆发式增长,这场中美 AI 产业角逐,已经从大模型技术比拼,升级成为一场算力、能源、人力等多方位争夺战。
随着核聚变能源或将到2050年落地,人类期望终结 AI 能耗这一具有挑战性难题,进入无限发电时代。