当前位置: 首页 > 科技观察

数据中心电力中断了怎么办?你需要知道这五点

时间:2023-03-22 01:45:39 科技观察

如果数据中心电力中断怎么办?你需要知道的5件事比如美国达美航空数据中心停电导致航空公司损失1.5亿美元,美国“超级碗”球场停电让航空公司尴尬组织者。停电随时可能影响到任何人。然而,数据中心运营商面临的困难是确定停电的根本原因,因为停电的原因更为复杂,例如服务器过载、系统崩溃;当地电力供应商的供应问题、工作人员的人为错误因素等。以下是数据中心运营商应关注的五个最重要的问题,以确保数据中心不会发生中断。(1)能否随着电力系统的快速发展而迁移?在数据中心的不同阶段,对电力的需求也在变化。添加服务器或交换机会对电源需求产生重大影响。因此,能够分析数据中心一段时间内的电力需求非常重要,这样可以更轻松地进行长期预测。(2)动力链是否受到威胁?越来越多的数据中心连接到网络,机架中包含的终端和接入点之外的许多通道都可能成为网络犯罪分子的破坏路径。此外,网络漏洞甚至不需要通过电线和电缆来实施。老练的犯罪分子可以获得数据中心的访问权限并破坏内部的电源。但是,造成危害的不仅是外部恶意人员,还有数据中心内部人员的行为。一些知识和经验不多的工作人员在界面交互过程中出现失误,同样会造成不可估量的危害。为防止这种情况发生,操作文档和流程控制至关重要。使用更多硬件并不是防止灾难性中断的唯一选择,事实上,添加额外的硬件实际上可能会使控制情况变得更糟。(3)灾难恢复计划是什么?它有记录吗?在不影响业务环境的情况下进行停电测试实际上是一个虚拟开关设备,这将使数据中心运营商能够应对最坏的情况并实施恢复服务。数据中心人员总是认为他们的电源链和电源备份系统是万无一失的,但如果没有故障安全测试,他们认为自己会面临什么?电源故障模拟使数据中心运营商能够识别缺乏冗余的设施,并发现单点故障。但是,这需要记录在案。因此,数据中心运营商建立了测试中断和记录灾难性电源故障之前的恢复程序的机制。(4)能否实时监控运营情况?数据中心运营商必须知道哪些设备现在在哪里以及正在使用多少功率。对于基础设施不断增加的数据中心来说,这往往很困难,因为它会对电力容量和配电产生巨大影响。注意所有移动部件的唯一有效方法是单一视图。这种具有实时监控和警报的整体视图使数据中心运营商能够降低风险并进行更改以避免灾难。(5)你对所有互连的设备和系统了如指掌吗?对于数据中心运营来说,电源链需要一起记录是至关重要的,从电源进入建筑物,通过UPS、PDU/供应到所有机柜设备。这意味着数据中心运营需要知道涉及哪些电源相关设备,以及它们各自的相互依赖关系。这使数据中心运营能够了解某些设备发生故障或离线进行维护时的潜在影响。此外,每个动力链设备的状态应该是已知的。电源管理可以通过使用数据中心基础设施管理(DCIM)来实现。DCIM使数据中心运营能够以最高效率运行数据中心,同时允许所有相关人员改善整体运营并找出差距以确保电力链安全。已部署的DCIM还可以让数据中心运营人员对其产品具有全面的可见性,通过共享实时数据和易于理解的图表消除IT与设施之间的通信孤岛。数据中心中断的原因有很多,尝试使用手动方法和电子表格跟上基础设施的所有变化是费力的,并且会带来不可预见的风险。因此,必须采取适当可行的方法和措施进行管理。