当前位置: 首页 > 科技观察

数据中心功率密度的悖论

时间:2023-03-20 12:41:58 科技观察

不断需要提供高性能和始终可用的IT类需求。随着服务器数量、存储空间、网络设备数量呈指数级增长,许多企业数据中心面临供电、散热、空间紧张等一系列问题。很多时候,有关数据中心电源空间和冷却问题解决方案的决策是由分析师和供应商在没有充分考虑组织的传统IT环境的情况下做出的。通过安装高密度刀片服务器和存储设施、模块化电源系统、机架内冷却、通道填充、虚拟化和云计算来解决电源、冷却和空间问题等战略决策只能在正确使用后才能实现Onlyhelpswhenusedproperly.许多企业数据中心正在部署密度较小的服务器和存储系统,以增加容量并避免重新安置数据中心或构建全新的数据中心。同样重要的是要强调您的组织需要非常小心地部署以避免“功率密度悖论(PDP)”。功率密度悖论本质上意味着,通过在数据中心部署更密集的设备,您的企业数据中心将达到一个拐点,以满足对数据中心空间增加的需求,这将导致更多的资本支出、Opex支出和大量的重组工作。部署密集设备也意味着企业数据中心将增加对电力、冷却和备份系统的额外需求,最终导致数据中心成本的增加。为了提高效率,组织必须在服务器和其他设备的密度与数据中心的电力、冷却和空间资源的可用性之间取得平衡。忽视这一点可能会导致数据中心资本支出和运营支出(电力和冷却成本)增加,以及停机中断的机会增加,从而使您的业务面临巨大风险。功率密度悖论服务器技术的根源自20世纪90年代中期以来发生了重大变化。当时,IBMAS/400(仍作为System-i出售)等落地式小型计算机刚刚开始被仅需3-5U机箱的机架式服务器所取代。货架空间。这实质上将服务器密度增加了14倍。到2000年,这些机架式服务器缩小为1U“披萨盒”设计,直到2002年才被刀片服务器取代。这些设备在单个刀片服务器上装有多个服务器主板(每个主板都有自己的处理器、内存、I/O连接,有时甚至还有磁盘驱动器)。这显然转化为每机架服务器密度的显着变化——增加了84倍!相应地,这些服务器的计算能力在几个方面得到了极大的提高,这意味着在给定的数据中心空间中容纳了更多的处理器,并为企业提供了更多的运行和冷却能力。鉴于这种情况,管理数据中心的冷却和散热成为企业数据中心运营管理者面临的巨大挑战,也是数据中心持续增长和可靠性的主要制约因素。系统中断的可能性更大,从而阻止数据中心的正常运行。功率瓦数:服务器环境越密集,为其供电和冷却所需的功率资源就越多。例如,每平方英尺需要60到100瓦的功率才能确保传统小型计算机或3-5U服务器的完整机架的平稳运行。用较小的1U服务器填充相同的数据中心空间需要每平方英尺至少200瓦,而最新的刀片服务器需要高达每平方英尺400瓦。冷却:计算环境每多消耗一瓦功率,就必须通过等量的冷却来抵消。更高密度的数据中心还需要更大的空气流动能力,以提供更冷的空气并有效地从数据中心操作空间移除热空气。数据中心占地面积:对更多电力和冷却的需求实际上推动了对数据中心占地面积的需求。由于高密度服务器每平方英尺消耗的电力比低密度服务器多,因此它们需要更多的配套设备,如空调、UPS和备用发电机。电力、冷却和数据中心占地面积要求都是相互依存的。数据中心的服务器机架越密集,对企业数据中心运行环境的供电和散热要求就越高,这反过来又增加了数据中心管理和运维人员不断扩展空间的压力。数据中心。忽视悖论的风险1.浪费散热和冷却成本在忽视功率密度悖论的情况下实现高密度服务器的第一个也是最明显的风险是会导致电力和冷却成本增加。快速和不必要的增加,以及CRAC等设备的维护成本增加。如果您的企业数据中心的可用功率有限,这些额外的加热和冷却需求会减少IT计算机、存储和网络系统可用的净功率。2.设备支出的意外增加第二大风险是:数据中心运营过程中用于维护相关设施的解决方案资本和运营费用的意外增加。使用专用空气处理设备,如可移动瓷砖或便携式/独立CRAC(机架行内冷却系统)是数据中心可能即将达到其使用寿命终点的警告信号。尽管这些系统延长了数据中心的使用寿命,但它们增加了企业的功耗和维护费用,以及潜在的故障威胁。3.停机和中断风险增加与低密度环境中的服务器相比,部署在高密度数据中心运行环境中的服务器发生计划外停机的风险要大得多。即使UPS可以在公用事业中断期间继续为相关设备提供所需的电力资源,设施也将失去冷却和气流,直到发电机投入运行和冷却系统再循环。如果服务器检测到环境温度升高并关闭服务器以防止其损坏,则此类冷却故障的停机时间可能约为几分钟;或者,如果过多的热量实际上损坏了硬件,则发生中断的停机时间可能会更长。根据用于确保应用程序软件弹性的架构,这可能会很快导致应用程序停机、降低整体性能/吞吐量,并给企业带来潜在的财务风险。优化IT设施是关键糟糕的数据中心设计和管理实践会加剧与功率密度悖论相关的问题。这方面的一个例子是:多年来,一些企业数据中心因业务需要,随意布置服务器设备机架,随意增加服务器容量。但是,如果没有为添加服务器和机架而提前进行任何数据中心气流和冷却规划,它可能会导致热点、增加功耗并导致数据中心整体冷却效率低下。此外,与现代高密度数据中心不同,较旧的数据中心在活动地板下通常只有12到18英寸的空间用于冷却(可能与网络和电源线共用)。为热通道/冷通道气流重新配置机架将略微提高效率,但实际上不会增加??整体容量,因为较浅的高架地板会限制冷气流。优化和平衡是必经之路。解决功率密度冲突的最佳方式是了解其对企业数据中心的影响,并在评估涉及的数据中心计算能力的基础上,对电力需求和冷却设施做出前瞻性规划。应由包括IT、运营和设施人员在内的相关团队进行综合评估;这样,每个相关组都可以了解他们的选择对整个企业数据中心操作环境的影响。事实上,很多企业的各个部门都是孤立运作的,或者说是“孤岛”,根据各自部门的需要自主决策。对于大多数日常操作,这很好。然而,数据中心作为一个整体并不是孤立的。虽然IT设备由IT部门采购、安装并经常维护,但电源和冷却设备通常由设备人员负责,他们通常不了解现代高密度服务器的电源和冷却方面。具体要求。让所有相关团队参与业务有助于让每个团队专注于组织的总体目标,以降低成本,充分利用流动资产并避免在当今经济衰退的环境中不必要的资本支出。寻求行业专家的帮助功率密度悖论使看似简单的决策变得比看起来更复杂。独立的第三方视角可以平衡企业IT、设施和财务等相关部门面临的需求和挑战。利用高密度数据中心设计和运营方面的专业知识可以帮助企业节省时间和金钱,同时提供满足长期需求的灵活途径。寻求行业专家的帮助有助于提高数据中心效率、降低资本成本并减少运营费用。其他建议目前,面临严重运维成本、场地和电力限制的组织不应该盲目地使用超高密度服务器和存储系统来节省数据中心的空间和资金。如果在没有对您的业务需求和数据中心操作环境进行充分规划和全面分析的情况下使用此类设备,实际上会增加成本和业务风险。作为企业数据中心的管理者,对数据中心运行环境进行全面评估可以节省大量成本,延缓甚至消除昂贵的数据中心建设或重新部署的需要。