俄乌冲突的持续升级让许多公司担心其在乌克兰的员工或承包商的安全。像这样的事件也凸显了根据威胁情况制定应急计划的重要性。业务连续性是CIO和CTO规划过程的重要组成部分。“黑天鹅事件”(极不可能发生但确实发生的事件)会对业务产生重大影响。虽然其中一些事件是不可预见的,但有些是事先可以预见的,甚至是完全可以预防的。业务连续性是关于评估威胁形势并制定计划以应对可预见的威胁并建立针对这些威胁的运营弹性。威胁态势领导团队的最佳做法是不断思考威胁态势,识别潜在问题并为它们做好准备,否则可能会对业务产生重大财务影响。可能需要规划的事件包括(但不限于):地缘政治威胁(例如俄罗斯-乌克兰事件);自然灾害(例如地震);有针对性的威胁(例如勒索软件);监管变化;采取措施。其他威胁需要计划以确保团队知道关键目标是什么以及面对威胁需要采取什么行动。CIO和CTO需要持续监控威胁形势并在必要时进行更新。像SOC-2认证这样的检查具有很好的强制执行功能,允许对某些威胁进行外部检查。SOC-2是一份基于AICPA现有的信任服务标准(TSC)审计标准委员会的报告,旨在评估与安全性、可用性、处理完整性、机密性和隐私相关的组织信息系统。地缘政治威胁计划在Inflection案例中,该公司在俄乌冲突发生一年半之前就已经为可能与乌克兰相关的中断做好了准备。他们制定了一套原则,并根据这些原则制定了计划。主要原则包括:建立一个地域多元化的团队。除乌克兰外,Inflection还在美国和巴西建立了重要业务。建立工作多样性。Inflection并非在每个地区都能完全发挥作用,而是需要团队跨地区协作。这种方法有缺点(例如,沟通障碍),但从长远来看这是正确的权衡。优先考虑员工和承包商的安全。如果发生地缘政治事件,安全无疑需要额外的财务支出,Inflection愿意花费更多资金来确保其员工和承包商的安全。他们为在乌克兰的队员们提供了三个月的生活费,让他们可以搬到不同的地方。强调书面交流胜于口头交流。例如,每个重大工程决策都要经过严格的架构决策过程。这些主动措施使Inflection能够在确保业务连续性的同时优先考虑员工安全。除了上述原则外,Inflection还制定了详细的计划,以确保对无法长时间工作的员工提供保护。实践中的连续性规划:对软件可用性的洞察主动规划的一个例子与自然灾害有关。如果您的数据中心所在区域发生地震等灾难,造成网络分区,您的计划是什么?假设您使用的是公共云提供商,以下示例将展示整个思考过程。规划可用性的起点是企业向其客户承诺的正常运行时间。标准的SaaS正常运行时间基准是99.95%的可用性,这相当于每年允许4小时22分58秒不可用。对此进行规划时,企业需要考虑:当事件确实发生时,企业的RTO(恢复时间目标)和RPO(恢复点目标)是什么?做出权衡决策需要就这些指标达成一致。有维护窗口吗?如果是这样,请从不可用性预算中减去它。(你也应该问问自己为什么会有维护窗口。)你所在平台的基本保证是什么?云提供商通常不提供任何正常运行时间保证。如果可用区(数据中心)失去可用性,企业应该如何规划?如果一个区域(多个可用区)出现中断,企业应该如何应对?如果供应商(多个地区)不可用,企业的计划是什么?这些问题具有不同的成本复杂性权衡。较小的企业可能会选择避免更大的复杂性,而对于较大的企业,选择可能会有所不同。该计划的目标是清楚地了解和控制这些问题中的每一个。企业是否应该通过多个可用性区域来支持高可用性?对于大多数企业来说,这是一个简单的决定:在AWS中支持多个可用区并不复杂,而且成本相对较低。和完成的复杂性。发生区域性停电-灾难恢复(DR)情况时,企业应该怎么做?跨区域同步既复杂又昂贵。很少有企业选择这样做。相反,企业可以选择将数据备份到另一个区域,企业的RTO(RecoveryTimeObjective)和RPO(RecoveryPointObjective)反映了企业的权衡是更长的恢复时间以获得更好的性能。简单的架构。如果云提供商完全退出怎么办?进行跨供应商部署既复杂又昂贵。在大多数情况下,将您的业务数据备份到不同的云提供商就足够了。但是,如果您经营一家大型企业,出于成本和规模的原因,您可能希望加入多个云提供商。所有这些问题都需要在公司制定并获得公司高管同意的计划中加以考虑。当事件确实发生时,企业还需要制定适当的沟通计划(例如,我们将如何通知客户?),最重要的是,必须对该计划进行测试。除非经常实践,否则这些计划毫无意义。以Inflection为例,他们最终做出的决定包括:通过部署多个可用区来支持高可用。客户将无法察觉到个别数据中心的损失。跨多个区域同步数据以支持小于24小时的恢复点目标(RPO)和小于72小时的区域灾难恢复时间目标(RTO)。将数据同步到二级云提供商,以确保在云提供商完全中断的情况下,业务仍然可以恢复运营。最后,进行年度数据库恢复实践并每季度测试灾难恢复实践。有针对性的威胁计划在过去几年中,勒索软件等威胁显着增加。需要正面应对这些威胁。在Inflection,他们的计划包括:获得SOC-2认证并确保公司的流程与行业最佳流程相当;确保静态和传输中的数据始终加密;参与漏洞赏金计划;聘请外部机构进行渗透测试;确保员工设备已加密,并有针对恶意软件、网络钓鱼和其他攻击的软件保护;为自己投保;事前分析领导者要考虑的一项有用的练习是“事前分析”。在考虑业务连续性问题时,最好是主动而不是被动。事前分析与事前分析相反。事后分析允许我们在事情已经发生之后分析“出了什么问题”,而事前分析的重点是了解“可能出了什么问题?我们如何才能防止这种情况发生?”深入计划,以便在意外发生时,您可以毫不费力地利用您已经计划好的内容,冷静地应对现实世界中的事件。结论业务连续性规划是领导者的职能要求。被动接受灾难的企业将无法迅速做出反应。企业的执行团队必须就原则和成本/复杂性权衡达成一致。
