目前,数据中心行业的能耗分配、测算和测算方法有很多。在本文中,我们将与读者一起探讨测量数据中心功耗的原因、功耗的测量、采集后的数据如何处理,并介绍一些目前可用的新兴技术。为什么要测量数据中心功耗?假设您作为公司的数据中心经理,接到CIO的电话,问您“我们在处理数据中心功耗方面做了什么?”你会怎么回答?通常,数据中心经理并不担心功耗。毕竟,虽然晚上7点后企业的其他区域可以在没有空调的情况下运行,但数据中心肯定不行。如果企业需要额外的基于IT的服务,则需要购买和安装必要的硬件。这种方法正在迅速改变,因为1)通常无法获得额外的电力资源,2)电力成本正成为运营数据中心的重要成本,以及3)越来越多的企业将采用绿色举措放在首位,为被社会认可为优秀企业,承担社会责任,为遵守各项环保法律法规做好准备。显然,您的企业无法有效地管理它无法衡量的内容。对于能源消耗尤其如此。因为在这种情况下,基于经验法则的估计很可能是错误的,从而导致不必要的,有时甚至是相当可观的成本损失。被认为耗电很少的设备通常会消耗大量电能,即使它们处于闲置状态并且不执行任何实际工作也是如此。第一步是为企业数据中心的当前功耗建立基线。理想情况下,这将为比较提供有用的历史统计数据。早期的测量和估计可能是粗略的,但随着时间的推移,数据中心内外的电力部署逐渐得到更好的理解,测量的质量也会随着时间的推移而提高。有许多方法可以管理数据中心的功耗,但如果没有一些基线测量,可能很难知道从哪里开始或哪些行动可以产生最大的影响。此外,如果没有基线测量,就不可能显示您的数据中心过去如何管理能源消耗水平以及您的数据中心能源消耗如何得到改善。效率指标目前,数据中心行业最受关注的能效指标显然是电源使用效率(PUE)。这是数据中心(包括IT设备)消耗的所有能源与IT设备消耗的能源的比率。总能耗包括照明、冷却和气流管理设备,以及数据中心内的配电装置。IT设备部分是执行计算任务的设备。PUE=数据中心总设备能耗/IT设备能耗只为IT设备供电的数据中心将达到PUE=1.0,因为分子和分母都是IT设备功率。这显然不符合真实数据中心的运行情况。即使数据中心的所有照明系统都关闭,电力资源也会被消耗以提供冷却和气流管理,并可能导致配电效率低下。企业平均数据中心效率(CADE)指标考虑了数据中心设施的能源效率、利用率和服务器利用率。CADE=(FacilityEfficiency)x(ITAssetEfficiency)FacilityEfficiency=提供给IT设备的能源量/从公共电力公司获得的能源量ITAssetEfficiency=所有服务器的中央处理器(CPU)的平均利用率(它是通常是一小部分,例如5%),直到实施虚拟化等提高效率的措施。在哪里以及如何测量在数据中心,有几个地方可以测量功率。从最粗略的测量到最详细的测量,从功率进入数据中心的测量开始。如果数据中心是一个独立的结构,并且只依赖公共电力公司的供电。然后,此测量值将是PUE计算公式中的总功率数。但很多时候,这并不容易。企业数据中心可能只占用建筑物的几层楼。在这种情况下,应为数据中心楼层或机房安装单独的仪表。如果数据中心不共享电力或建筑物内的相关设施(如冷却设备),电表将记录总电量。如果设施和电力是共享的(在城市数据中心尤其如此),那么数据中心经理至少需要估计数据中心的总功耗,这可能来自几个不同的来源(例如总供电量)到建筑物,再加上建筑物的冷却设备使用的一定比例的电力)。下一个经常进行功率测量的地方是不间断电源(UPS)。如果它只是为IT设备供电,那么这个数据可以用在PUE计算的分母中。然而,UPS也可以为机架式冷却设备供电。第三个测量功率的地方是机架本身,它本身能够测量机架配电单元(PDU)。这些测量值通常被认为代表整合到机架中的IT设备,除非有风扇或机架侧面冷却装置。第四个测量功率的地方是机架PDU的各个插座。这些智能PDU通常还为聚合机架提供功耗测量。在插座级别监控功率可确保在PUE计算中确定IT设备的功耗。通过在单个设备级别提供电源信息,可以采取特定措施来提高效率。第五个衡量功耗的地方在CPU上。这给出了实际执行计算工作所消耗的功率的度量。事实上,这在今天并没有被广泛使用。就采取实际节能措施而言,CPU级测量不是很有用。因为在大多数情况下,数据中心员工可以对整个设备、刀片服务器或其他IT设备的数据进行更改或削减,而不是CPU。测量数据中心功耗的最典型方法是计量机架PDU和智能机架PDU,它们监控各个输出。如何处理收集到的数据根据在企业数据中心选择测量的位置和方式,可以采取各种能效举措。我们建议企业数据中心经理对IT设备使用单独的插座级测量,如果它们提供有用的、可操作的信息的话。通过监控机架的功耗,数据中心管理人员可以确定他们的原始功率分配是否合理。通常,IT设备根据铭牌额定值分配功率,但这些铭牌额定值通常是保守的。即使具有一定比例的铭牌功率,比如70%,功率通常也会过度分配。这意味着IT设备机架消耗的电量将超过实际消耗的电量。这种“空闲电源”可以部署在其他地方,但您如何知道您的数据中心机架在峰值负载条件下不会容易耗尽电源?定期监控每台设备,并且此间隔应尽可能短,以确保不会忽略高峰期。借助单个设备的功耗数据,可以设置机架,使设备的功耗模式相互补充,从而可以用相同的功率支持更多的IT设备。如果一个机架即将耗尽其分配的所有电力资源,并因此冒着阻塞断路器的风险,拥有单独的IT设备功耗数据可以让IT经理以合乎逻辑的方式移除设备,从而降低断路器跳闸的风险。在保持合适负载的同时将风险降至最低。例如,通过在自己的数据中心进行测试,RaritanUSA确定铭牌额定值百分比的简单经验法则不起作用。59台服务器中,15台平均功耗在20%以下,29台21%到40%,9台41%到60%,4台61%到80%,2台81%以上。即使在峰值功耗时,49台服务器的铭牌额定值也低于60%。许多数据中心规划者使用了铭牌的70%,这意味着许多数据中心有大量未使用的电力。另一方面,59台服务器中有5台使用峰值功耗的81%或更多,因此有被关闭的风险。在功耗方面,重要的是要了解各个设备的情况,而不是仅仅拥有一些可以掩盖高端和低端问题的总平均值。环境传感器及其对电源和冷却效率的影响环境传感器在提高数据中心的电源效率方面发挥着非常重要的作用。冷却消耗数据中心总功率的30%或更多的情况并不少见。供应商提供入口温度规格。只要入口温度在规格范围内,服务器就会正常运行。这些规格通常远高于数据中心冷通道中常见的规格。因此,往往可以通过提高数据中心运行环境的温度来降低冷却设备的功耗。温度传感器应位于冷却空气入口侧机架的底部、中部和上部三分之一处。将IT设备冷却到所需温度以下会消耗大量电力资源,但没有任何有益效果。由于缺乏机架安装的仪器,数据中心经理经常过度冷却以确信IT设备不会发生故障。可用的新技术介绍仅对某个时间点的功耗进行单一快照是不够的。IT设备在凌晨2点用电量可能比早上8点少得多,并且可能在周四下午4点达到用电量峰值。电力消耗也可能随一年中的季节而变化,例如12月的在线销售旺季。一些硬件设备可以按照用户定义的时间间隔每隔几秒执行一次功耗快照。软件程序可用于将这些数据点转换为用电量的计算结果,其中计量单位为千瓦时(kWh)。更先进的工具可以根据能源使用情况计算碳足迹。有了实际单个设备的信息,数据中心人员可以了解产生最多碳排放的单元,从而可以根据地图进行管理。相关考虑准确性:随着碳排放上限、信用机制和交易机制的采用,准确性变得很重要。假设一个完美的正弦波(这在现实世界中很少发生),正负5%偏差的精度可能是可以接受的,以确定机架是否在断路器跳闸前以大约25%的余量运行。在处理要在交易中验证和交易的法规和碳信用时,这是不可接受的。计费或拒付退款不够准确。开放性和互操作性:IT管理系统部署在许多数据中心。要将此类系统与功率测量联系起来,需要寻求与现有设备集成和互操作的开放标准。易用性是一个重要的考虑因素,因此电源管理不会成为已经很忙的IT人员的耗时项目。安全:电力资源是数据中心的生命线。确保对电源管理系统的访问是安全的,这一点很重要。寻找具有高级别加密(如256位高级加密标准(AES))并能够设置身份验证、授权和权限的系统。结论我们希望下次您公司的CIO打电话给您并询问“我们在数据中心的功耗方面做了什么?”一套可行的计划,通过收集相关数据和信息建立一定的基线。现在,收集数据并采用数据中心指标(例如PUE计算)的方法将帮助您的企业数据中心更有效地管理电力和电力成本。然后更有信心地响应CIO的号召。
