当前位置: 首页 > 科技观察

你知道什么是灾难恢复吗?

时间:2023-03-18 22:50:50 科技观察

你有没有想过如果发生地震或其他自然灾害,你在某家银行的账户信息会不会丢失?你的钱还在银行里吗?其实,我们大可不必担心。银行用户信息是非常重要的数据,所以在银行成立之前,必须有一套完整的容灾方案来解决这类问题,即建立容灾系统。所谓容灾系统,字面意思就是容忍灾难的系统。有了这个系统,即使发生灾难,银行内的用户数据也能安然无恙。这种灾难的范围从自然灾害到物理故障。为保证数据安全和业务可靠性,各家银行会在全国多个地区建立一个或多个容灾站点,相互备份数据,相当于创建了多个“副本”。当主站点遭受灾难破坏,导致数据永久丢失时,可以依靠灾备站点的“副本”来实现数据恢复。如果没有灾备站点的数据备份,将造成不可估量的经济损失和恶劣的社会影响。银行有灾备系统,但通信有灾备系统吗?答案是肯定的。每个运营商都制定了完整严密的容灾方案,保护所有用户的通信数据,包括您的话费余额!无论是3G、4G还是5G,每个运营商都建立了针对区域的通信服务容灾站点。容灾站点除了要保证各种数据的可靠性外,还要保证服务的可用性。这是建立容灾系统最重要的意义。以5GC为例,与金融系统类似,5GC也采用跨地域异地容灾部署。在两个不同的区域部署数据中心(DC,DataCenter)。当一个数据中心的网络设备因故不可用时,另一个数据中心将迅速接管业务,保证5G服务的可用性。这是双DC部署。双数据中心部署是实现部署可靠性的一种方式。除了双DC部署,5GC容灾方案还提供了哪些措施来实现容灾?部署可靠性5GC容灾方案支持双DC部署、互斥部署、NF(NetworkFunction)域部署、网络双平面等多种方式实现部署可靠性。互斥部署是指将虚拟机部署在不同的物理机上,以保证当一台物理机出现异常时,其他虚拟机仍然可以提供服务。简而言之,“不要把所有的鸡蛋都放在一个篮子里”。NF域部署是指通过分离管理域、服务域和转发域来进行NF部署。网络双平面是指5GCNF的所有逻辑网络接口至少有两个不同的物理网络平面作为彼此的备份。当其中一个网络平面发生故障时,另一个网络平面可以接管所有网络流量,保证业务不中断。架构可靠性5GC容灾方案支持负载分担和无状态特性,实现架构可靠性。负载分担是指所有运行的实例共同分担和处理业务。当部分正在运行的实例异常宕机时,其余正常运行的实例将分担处理业务,保证业务的正常运行。负载分担采用N+M冗余方式,即当N个实例能够满足系统的业务处理能力时,再提供M个实例进行冗余。上图是典型的3+1冗余方式。当三个实例可以满足系统的业务处理能力时,再提供一个实例进行冗余。当任何一个正在运行的实例发生故障时,其他三个正在运行的实例将继续工作,从而保证系统容量和业务处理不受影响。无状态是指微服务的无状态设计。3GPP定义了一个UDSF(UnstructuredDataStorageFunction,非结构化数据存储函数)用于NF状态数据(也称为非结构化数据,如移动数据等)的统一存储。业务逻辑APP可以随时进行弹性、扩容、销毁、重生、迁移等操作,是计算和存储的分离。无状态设计不仅实现了结构的可靠性,也保证了数据的可靠性。数据可靠性5GC的NF采用无状态的方式设计。当前处理流程完成后,用户、会话上下文等状态数据存储在UDSF中,UDSF保存数据的多份。UDSF支持1+1冗余,双DC部署容灾,保证数据可靠性。资源可靠性5GC容灾方案支持链路检测、自愈等机制,实现资源可靠性。自愈方式:对于不断发生故障的业务处理节点,系统会进行节点的多级自愈。系统根据用户的自愈策略配置,采用重启容器、重新推送容器、重启虚拟机、重建虚拟机的策略逐步进行自愈,从而恢复业务尽快。链路检测是指:服务节点会定时向管理节点发送心跳保活消息。如果管理节点检测到长时间没有发送心跳的节点,则判断为故障节点,从而触发业务迁移流程,将故障节点的业务迁移到其他正常节点,从而保证业务的可靠性。好吧,话虽如此,您再也不用担心您的电话费余额,更不用说存放在银行的钱了!您还知道什么是灾难恢复。