IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以便在发生意外中断时执行。此类计划应概述有关如何在灾难后将IT系统恢复到可以支持正常操作的状态的详细步骤。灾难恢复计划必须涵盖企业可能面临的各种事件。但是在制定详细的灾难恢复计划之前还有一些工作要做,其中最重要的是执行风险评估和/或业务影响分析以确定对业务活动至关重要的IT服务。这些努力可以帮助您确定关键基础架构和应用程序的恢复事件目标(RTO)和恢复点目标(RPO),您可以根据这些目标开始制定灾难恢复策略和实用计划。在本文中,我们将概述制定灾难策略所需的关键步骤和构建块,包括如何编写灾难恢复计划。根据ISO/IEC27031–业务连续性国际标准制定灾难恢复策略:“灾难恢复策略应定义部署所需恢复能力的方法,以阐明事件预防、检测、响应、恢复的原则。”对于此要求,了解策略(定义您在事件响应中需要做什么)与计划(准确描述您将如何执行这些要求)之间的区别非常重要。灾难恢复策略和机会的关键步骤包括:识别关键系统。例如,这可能是一个支付或制造系统,或者对业务至关重要的东西。识别这些系统的目的是在保护或恢复水平方面给予一定程度的优先权。确定每个系统的RTO和RPO。他们需要多长时间才能恢复?一些系统可能根本没有停机时间,其他系统可能有几分钟或几小时的停机时间。从时间的角度来看,您可能会丢失多少数据?是要回到原来的样子,还是有余地?识别每个系统或系统组的潜在威胁。示例包括摧毁整个建筑物的洪水或火灾,或影响单个系统的事件,包括硬件故障。制定预防措施。这可以应对已识别的威胁。这意味着更好的防洪保护、升级的UPS或改进的服务器/应用程序保护。制定应对策略。该策略应指定在已识别的威胁导致停机时应采取的措施,其中可能包括故障转移到另一个站点或硬件,并根据RPO和RTP执行。最后,响应策略应确定恢复主要系统所需的关键任务,并针对未来类似情况提供全面保护。灾难恢复策略的其他考虑因素人员:在这方面您需要提出的问题包括:部署灾难恢复计划时关键区域所需人员/承包商的可用性如何?需要为他们安排哪些培训此外,您可能需要确保关键技能的可用性,最好是关键领域的主要和后备人员:实际位置:此处要问的问题包括:同一地点是否有备用工作区?我们是否需要安排另一个办公地点、第三方站点、员工家中或便携式设备大楼?您还需要考虑备用地点的安全性、员工访问权限、身份证件等。根据可用的选项和您的业务需求,您可能需要考虑在哪里可以确保正确配置您的IT系统。这可能包括提高楼层高度;为IT系统和人员提供电力和冷却;充足的电力以及语音和数据基础设施。数据:这主要是从预防的角度来说是一个值得关注的领域。关键是要根据RTO和RPO要求和数据存储方式来备份数据,还要考虑备份站点的数据保护功能。供应商:您应该为所有关键系统和流程(包括人员外包)与主要和备用供应商签订合同灾难恢复策略转变为灾难恢复计划制定灾难恢复策略后,它可以转变为灾难恢复计划。这里的主要任务是采取上面列出的步骤(源自您的响应策略)并添加一个新步骤:灾难操作步骤。例如,如果问题是服务器硬件故障,灾难操作的关键步骤是确定故障原因、获取并安装新服务器、测试它并恢复系统。制定DR计划灾难恢复计划为意外中断提供了步骤,这里的目标是提供易于使用和可重复的步骤来恢复IT资产并使其在RPP和RTO的约束下恢复正常运行。灾难恢复计划的结构灾难恢复计划的主要部分包括:概述:灾难恢复计划的前面应该描述企业对紧急情况的整体响应水平。还应介绍IT灾难恢复计划的目标和范围。此外,确定谁批准了该计划,谁被授权启动该计划,以及其他相关计划和文件。角色和职责:应概述灾难恢复团队成员的角色和职责。这包括他们的详细联系方式、设备购买的支出限额,以及他们在发生灾难时的具体角色和职责。事件响应:应描述事件响应过程,其目的是快速评估情况,确定其范围,必要时预防事件,并通知管理层和其他关键利益相关者。启动计划:根据事件响应活动的结果,下一步是确定是否启动灾难恢复计划,并根据面临的情况确定具体步骤。文档历史记录:应记录灾难恢复计划文档日期和修订,并应包括修订日期、修订内容以及批准修订的人员。流程:这些是指计划中指定的响应和恢复活动(恢复操作步骤),这是文档的核心。这些信息越详细,IT系统恢复到正常运行水平的可能性就越大。附录:在灾难恢复计划的末尾,可以列出系统、网络和应用程序拓扑和清单,包括合同和服务级别协议(SLA)、供应商联系人以及对恢复过程有用的任何信息。其他活动制定灾难恢复计划只是灾难恢复的开始。如果要确保DR计划的可行性,则需要对其进行测试。这需要员工充分理解灾难恢复计划,了解他们在灾难发生时的责任,并接受这方面的培训。成功实施DR计划的唯一方法是定期测试它们并确保它们在人员和实物资产方面保持最新。
