随着数据中心的扩展,大多数IT团队都在寻找一个管理控制台,以提供直观、全面的视图来简化日常管理任务。IT团队在管理超大规模数据中心时,也学会寻找这样一个控制台:他们可以调用当今数据中心平台带来的细粒度数据。这包括每台服务器、机架或整个计算设备房间的实时用电量和温度。第一课:不要忽视“小”数据。与能源管理中间件集成的管理控制台可以将这些数据中心数据点聚合成一目了然的热图和功率图,并记录所有数据以进行趋势分析和容量规划。然后可以利用这些数据进行各种成本削减实践。例如,数据中心团队可以根据实际功耗更有效地配置机架。在不了解实时模式的情况下,数据中心团队只能依赖额定功率和静态实验室测试。一个示例性用例演示了实时监控和静态计算之间的重要区别。当配置功率为4,000瓦的机架时,传统的计算结果导致数据中心团队在每个机架上安装大约10台服务器。(在这个例子中,服务器电源的额定功率为650瓦,实验室测试表明400瓦是预期配置的安全值。)同一团队对功耗进行了实时监控,发现服务器的功耗很少超过250瓦。知道这一点后,团队将机架配置的服务器数量增加到16台,计算能力增加了60%。如果任何一个机架中的服务器的需求将总??功耗推高到机架阈值以上以避免损坏,数据中心团队还为每个机架应用保护功率上限,这将在下面进行更详细的解释。第五个经验。第2课:消除幽灵服务器。一旦数据中心团队能够监控实时功耗,评估工作负载如何在数据中心内分布就成为一项简单的任务。很容易发现经常未被充分利用的服务器和机架。随着时间的推移,数据中心经理可以确定哪些服务器可以合并或缩减。幽灵服务器是通电但空闲的系统,可以进入节能睡眠模式。可以采取诸如此类的节能措施,通过避免能源浪费来减少能源预算。现实表明,如果幽灵服务器处理得当,一般的数据中心,无论大小,都可以将预算削减15%到20%。第三课:选择软件而不是硬件。超大规模运营通常跨越不同地区的多个数据中心,这使得远程管理对于确保日常服务连续性至关重要。当前的全球经济气候让许多企业和组织面临同样的情况,因为IT部门寻求有效地管理多个站点,而不必将员工人数增加一倍或浪费时间在多个地点之间奔波。远程键盘、视频和鼠标(KVM)技术在过去几十年中不断发展,以帮助IT部门跟上步伐,但硬件KVM解决方案也因此变得越来越复杂。为避免必须自行管理管理叠加层,世界上许多最大和最复杂的基础设施的运营商都在使用软件KVM解决方案,最近还使用了虚拟化KVM解决方案。即使对于普通的数据中心,节省的成本也会迅速增加。IT团队应将任何现有KVM切换器和适配器的成本以及相关的许可费用(切换软件、带内和带外许可证等)相加。一个典型的硬件KVM切换解决方案通常成本如下:超过500,000美元的交换机,125,000美元的交换机软件,以及另外500,000美元的带内和带外节点许可证。即使是适配器也可能超过250,000美元。此外,软件KVM解决方案可以避免超过100万美元的硬件KVM成本。第四条经验:适当提高温度。一些世界上最大的数据中心拥有多年监控和管理能源和热模式的经验,开创了环境温度升高的运营模式。公布的数据显示,将数据中心的环境温度提高1°C可以使数据中心的电费减少2%。适当提高数据中心的环境温度后,要经常检查局部热点,实时监控数据中心设备。一旦实时进行有效监控,就可以逐步调整工作温度,并根据预算和容量规划评估成本节约。第5课:不要让机架过热。由于业务期望和IT部门需要识别和避免可能会破坏关键业务运营的故障,任何已证明在超大规模数据中心可行的主动管理方法都应评估是否适用于较小的数据中心。过高的工作温度会对硬件造成破坏性后果,因此密切关注这对设备正常运行时间和生命周期的影响非常重要。许多HPC集群如Hadoop都增加了冗余和动态负载平衡机制,以便在发生故障后能够顺利恢复。相同的基本监控、警报和自动控制机制有助于最大限度地减少超大规模能源需求,也有助于较小的数据中心识别和消除局部热点;带来不良影响。对功率和温度采取一致的方法还有助于在数据中心保持更一致的环境,最终防止可能损坏设备的温度峰值和功率峰值。除了环境控制之外,IT团队还可以利用提供功率封顶的尖端能源管理解决方案。如果您设置功率阈值,您可以根据需要配置机架,而不会冒功率峰值的风险。在某些地区,功率上限在保护数据中心免受破坏性、不可靠电源的影响方面发挥着重要作用。向前看幸运的是,大多数数据中心的运行风险规模远低于超大规模和超大规模计算环境。然而,任何规模的数据中心都应优先考虑降低能源成本和避免服务中断。借助经过验证的方法并利用整个数据中心的所有实时数据,IT和设施部门可以模拟超大规模数据中心,并以相对较少的前期成本和工作量获得可观的回报。
