什么是人工智能电力算力?

人工智能电力容量指的是支持人工智能计算工作负载所需的专用电力基础设施,而人工智能计算工作负载是数字经济中最耗能的应用之一。训练大型人工智能模型需要数千个高性能GPU或人工智能加速器组成的集群,每个GPU的功耗为300-700瓦,这些集群部署在总IT负载达10-100兆瓦甚至更高的数据中心中。人工智能推理——即大规模运行训练好的模型——会产生持续且可预测的电力需求,这与传统数据中心工作负载的不同之处在于其密度(液冷GPU集群每个机架的功耗高达100千瓦)、连续运行特性以及对断电的敏感性。人工智能计算的快速增长正在推动对新型数据中心容量、电网连接和电力基础设施前所未有的需求。在中国,主要的人工智能超大规模数据中心(阿里巴巴、百度、腾讯、字节跳动、华为)和云服务提供商正在大力投资人工智能优化型数据中心,从而对高密度配电、精密冷却、备用电源和电网连接基础设施产生了巨大的需求。

关于人工智能电力算力的5个关键问题

人工智能计算的能耗极高。训练一个大型语言模型(例如 GPT-4)预计消耗 50-100 吉瓦时 (GWh) 的电力,相当于数千户家庭的年用电量。大规模人工智能推理会持续消耗电力:一家大型人工智能服务提供商可能运行数万个 GPU,每个 GPU 的功耗为 300-700 瓦,每个数据中心的总 IT 负载为 10-50 兆瓦。国际能源署 (IEA) 预测,到 2026 年,全球数据中心的电力消耗将翻一番,主要驱动力是人工智能工作负载。在中国,政府的人工智能发展战略正在加速对人工智能计算基础设施的投资,这对电网规
与传统数据中心相比,人工智能数据中心需要专门的电力基础设施:更高的功率密度(液冷GPU集群每个机架可达100千瓦,而标准IT机架仅为5-15千瓦);更强大的UPS和备用电源,以防止因断电而中断长时间的人工智能训练;配备高密度插座配置的精密配电单元(PDU),用于GPU服务器;液冷基础设施(直接液冷或浸没式冷却),用于管理高密度人工智能计算产生的热量;以及大型人工智能园区需要直接连接高压电网(通常为110千伏或220千伏),以避免低压连接带来的损耗和可靠性限制。
人工智能数据中心的快速增长给中国的电网规划带来了新的挑战。连接负荷达100-500兆瓦的大型人工智能园区需要专用的输电线路和变电站容量,这些都需要提前数年进行规划。人工智能数据中心在电价低廉(内蒙古、贵州、甘肃)且可再生能源资源丰富的地区高度集中,导致局部电网拥堵。中国的“东数西算”政策引导人工智能数据中心向可再生能源充裕的西部地区发展,这需要长距离数据传输基础设施,并对特高压输电容量产生新的需求。
电源使用效率(PUE)是数据中心的主要能效指标,定义为设施总功率除以IT设备功率。世界一流的数据中心PUE可达1.1-1.2;中国国家标准GB/T 32910规定新建数据中心的PUE目标值为1.3。对于采用高密度液冷技术的人工智能数据中心,PUE值可接近1.05。人工智能专用指标“每瓦性能”(每秒每瓦运算次数)用于衡量人工智能计算硬件的能效。液冷——包括直接液冷、后门热交换器和浸没式冷却——对于在高密度人工智能部署中实现低PUE(电源使用效率)至关重要。
大型人工智能超大规模数据中心正致力于通过多种方式实现数据中心运营100%使用可再生能源,包括现场可再生能源发电(屋顶太阳能、风能)、与可再生能源发电商签订购电协议(PPA)以及使用可再生能源证书(REC)。在中国,绿色电力交易市场使数据中心能够直接从发电商处购买可再生能源电力,从而提供可信的可再生能源声明。一些人工智能数据中心正与大型可再生能源项目(如太阳能发电场和风力发电场)毗邻而建,以最大限度地利用直接可再生能源供电并最大限度地减少输电损耗。电池储能系统也越来越多地与可再生能源发电系统配合使用,为需要

关键要点

人工智能电力容量是电力基础设施需求增长最快的领域之一,这主要得益于人工智能计算工作负载的爆炸式增长,而人工智能计算工作负载需要高密度、高可靠性且日益依赖可再生能源的电力基础设施。中国的国家人工智能发展战略正在加速对人工智能数据中心及其配套电网基础设施的投资。上海国际电力展(EP Shanghai)将展示推动人工智能计算革命所需的配电、冷却、备用电源和并网技术。
635_119
获取展会最新消息

联系我们

展会位置

展会微信

返回顶部