当前位置: 首页 > 科技观察

如何在灾难期间保持数据中心的连续性

时间:2023-03-17 16:46:05 科技观察

对于维护数据中心灾难恢复和业务连续性的组织和个人来说,数据中心标准机构UptimeInstitute最近一份名为“疫情过后的数据中心”的调查报告可能有点让他们不安。报道称,“我们的分析中有一个重要的假设,我们认为冠状病毒疫情只是众多流行病中的一种,未来我们将面临更多的灾难和流行病。”直到现在,很多人还没有意识到冠状病毒爆发可能造成的影响。现在,他们迫不及待地继续实施遏制疫情所需的限制措施,但可能不得不面对此类事件再次发生的事实。今后,人们可能生活在疫情的阴影之下。对于数据中心行业关键基础设施的业务连续性管理者来说,用户的业务连续性取决于数据中心的连续性,这包括云计算和托管提供商的云服务。企业必须考虑数据中心在其业务连续性中发挥的关键作用,尤其是在大流行期间。业务连续性的新常态疫情不仅给业务连续性带来了独特的挑战,而且从物理世界到虚拟世界,从购物到员工会议的转变,增加了对数据中心应用程序的需求,并迫使组织进入响应阶段灾难恢复计划运行数月或数年。这意味着人们在一年中的大部分时间里都处于多灾模式,因为美国在应对飓风和野火等短期灾难事件的同时,还需要为冠状病毒的爆发做准备。这可能代表业务连续性的新常态。业务连续性的最佳实践在多次灾难期间保持数据中心的连续性需要依赖数据中心的组织、它们的云计算和托管提供商以及数据中心设备和服务提供商之间的协作。以下是双重灾难期间数据中心和客户业务连续性的五个最佳实践:(1)主动与客户沟通自今年年初以来,冠状病毒的爆发一直困扰着业务连续性专业人员。数据中心运营商正在积极与云计算和托管服务提供商合作,以确保他们为此做好准备。例如,计划在大流行期间实施虚拟桌面基础架构以便员工可以在家远程工作需要确保合作伙伴能够提供支持该计划所需的能力。为此,数据中心运营商需要在规划过程的早期与客户沟通并尝试预测他们的需求。(2)增强电源冗余在评估潜在的数据中心合作伙伴时,首先要了解的是电源架构。例如,您是否有必要的冗余、备用电源系统及其程序以在电网出现故障时提供连续供电?数据中心运营商需要注意应对停电(如UPS电源故障或发电机故障如期启动带来的连续性挑战)。还要确保电源的多样性,以最大程度地降低大范围电网故障的风险。(3)持续监测设备持续监测有助于数据中心运营商应对疫情期间出现的电力容量波动。通过了解电力容量的使用方式,数据中心运营商可以与供应商合作,及时增加新的电力容量。并期望数据中心合作伙伴对其关键基础设施做同样的事情。在持续的大流行期间,增加设备监控的实施和向“智能手”管理的转变已被证明对数据中心运营商及其客户具有重要意义。(四)保持容量弹性疫情期间,云计算服务的可用性一直是用户开展业务的生命线。但依赖云计算服务意味着数据中心运营商必须随着用户对容量需求的增长提供更多资源。可以通过优先考虑用户需求并与合作伙伴密切合作来应对这一挑战。数据中心运营商还必须确保他们能够为行业用户提供他们继续扩展可用容量所需的关键基础设施。这包括工厂生产预制数据中心模块和设施的能力。这些预制系统使云计算和托管服务提供商能够比使用传统流程更快地获取新容量,同时降低部署所需的复杂性和劳动力。(5)制定服务计划。维护数据中心电力和冷却基础设施所需的专业服务对于受自然灾害影响的数据中心的安全恢复至关重要。但是,当面临流行病和自然灾害时,技术专家未必能到灾区去解决问题。业务连续性规划的一个重要部分是确保数据中心运营商拥有当地专家来帮助客户恢复。如果不能保证数据中心运行的连续性,就无法实现用户的业务连续性。在发生灾难时,需要维护这些资源以确保业务连续性。但该目标仅在更大目标的背景下才重要:确保数据中心运营商提供的工程、制造和服务资源在客户最需要时可用。