当前位置: 首页 > 科技观察

运维怎能不背锅?看看这本灾备秘籍

时间:2023-03-18 20:22:34 科技观察

果然,这次是云硬盘故障,运维人员又“背锅”了。运维不想背锅,就要从掌握容灾知识做起。无论你是西二旗的小王,陆家嘴软件园的小孙,还是科兴科技园的小张,今天,让我们重新武装自己,一起温习数据和业务保护知识,甩掉黑锅尽快下场。备份备份是指数据或系统的备份。它是灾难恢复的基础。指将应用主机的硬盘或阵列中的全部或部分数据集复制到其他存储中,以防止系统运行失误或故障导致数据丢失。中等过程。根据备份的数据量,可以分为全量备份、增量备份和差异备份。从下图可以看出它们的区别:根据备份的时间和频率,可以分为定时备份和实时备份。定时备份——指有时间间隔的数据备份方式,如每天一次、每周一次或每月一次。计划备份不能保证零数据丢失。实时备份——指没有时间间隔的数据备份方式。通过实时数据复制,保证主备两端的数据读写一致,保证数据零丢失。根据数据备份时服务器是否关机,可分为冷备份和热备份;根据数据存储介质之间的距离,可分为本地备份和远程备份。通过网络备份是热备份的主要方式,其主要传输方式如图:备份是DBA的重要法宝。备份是第一要务。有了安全的数据备份,再普通的灾难也能从容应对。Snapshot快照是指一种快速的数据保护技术。快照是数据集在特定时刻的镜像,也称为即时副本,是数据集的完整可用副本。快照实现的技术方法包括:写时复制(COW)、输入输出重定向(I/ORedirect)、分割镜像(SplitMirror)、克隆快照(COWwithCopy)、持续数据保护(CDP)、等等快照有两个作用:一是可以进行在线数据恢复。当存储设备出现应用故障或文件损坏时,可以及时恢复数据,将数据恢复到生成快照时的状态。二是为存储用户提供额外的数据访问通道。当原始数据经过在线应用程序处理后,用户可以访问快照数据,并使用快照进行测试等工作。目前主流的快照技术包括镜像分割快照技术、按需备份快照技术、指针重映射快照技术和增量快照技术。快照产品一般有三种基本形式:基于存储设备、卷级和文件系统级。归档归档是将不常访问的数据迁移到其他存储设备。迁移后,可以选择将归档存根留在原系统中,用户可以通过直接访问归档存根自动回调归档数据,实现对归档数据的透明访问。归档的特点包括改变系统中的数据和状态;节省大量在线存储空间,提高在线存储性能;提高备份/恢复速度并节省备份介质。归档的主要应用对象:文件系统、NAS;邮件系统:MSExchange、LotusDomino;文件系统:SharePoint等。归档技术路线:先设定一个时间线,将文件分为常用数据和历史数据两部分。其次,要定期进行归档操作,将历史数据入库。存档的文件/电子邮件可以在原来的地方留下存根;当用户访问存根时,归档文件/电子邮件将被自动回调。***、归档后只需要备份常用数据,大大减少了备份数据量;同样,只要恢复常用数据,系统就可以正常工作,大大减少了恢复时间。CDPCDP(ContinualDataProtection)是一种持续数据保护技术。具有数据备份和数据恢复功能。通过CDP实时备份技术,可以达到秒级细粒度的抓包效果。目前主流的CDP有很多维度,包括基于存储数据块、存储快照、操作系统IO层等。根据技术维度的不同,得到的细粒度数据恢复也不同。根据回收的细粒度大小,业界将CDP分为TrueCDP(TrueCDP)和NearCDP(NearCDP)。TrueCDP技术持续监控和备份数据变化,可以恢复到过去的任何一点。它是真正的实时备份,不会造成数据丢失。Quasi-CDP是指接近连续的数据保护,数据备份存在延迟,即存在部分数据丢失的风险。根据用户对RPO和容灾策略的要求,CDP技术方案的选择有很大的自主权,但随着数据量的增长和业务信息化进程的加快,未来的趋势将是基于真正的CDP。英国i2CDP属于真正的CDP技术,可以提供细粒度的数据持续保护,可以恢复到任意历史时间点。上面提到的备份、快照、归档和CDP都是为了数据和业务的恢复。狭义的恢复(Recovery)定义是指重新创建生产系统应用或计算环境过去的运行状态,包括全量恢复和小粒度恢复两种模式。广义上的容灾(国内通常称为灾难恢复或容灾)属于业务连续性的技术层面。用户信息服务中断后,需要迅速调动各种资源,异地重建信息技术服务平台(包括基础设施、通信、系统、应用和数据)。灾难恢复还包括本地恢复和重建。一般来说,这是灾难恢复的范畴。灾难恢复,从广义上讲,任何提高系统可用性的措施都可以称为灾难恢复。其主要功能是帮助用户快速恢复系统的正常功能,继续对外提供服务。分为本地容灾、异地容灾、云容灾。本地容灾一般是指主机集群。当一台主机发生故障不能正常工作时,其他主机可以代替该主机继续正常工作。异地容灾一般是指在与生产机房有一定距离的偏远地区建立一个类似于生产机房的信息平台(备份中心),利用特定的技术将生产中心的数据传输到生产机房。备份中心,这样生产中心就会相对安全。在发生火灾、地质灾害等重大灾害时,仍能保护生产数据的灾备系统。云容灾泛指云数据中心物理机或虚拟机的容灾。云主机系统由大量的服务器组成,分布在不同的地点,同时服务于大量的用户,所以云计算系统采用分布式存储来存储数据,冗余存储(集群计算,数据冗余和分布式存储)来保证数据的可靠性。这种方式保证了分布式数据的高可用、高可靠和经济性,即存储相同数据的多份副本。综上所述,判断数据保护和容灾方案优劣的两个重要参考指标是:RTO和RPO。RTO是指灾难发生后,从系统宕机到业务停止的时刻,到系统恢复支持业务部门运行、业务恢复正常运行的时间。RTO可以简单描述为企业可以容忍的恢复时间。RPO是指灾难发生后,容灾系统能够将数据恢复到灾难发生前时间点的数据。它衡量企业在灾难后将丢失多少生产数据。RPO可以简单描述为企业能够容忍的最大数据丢失量。总而言之,无论是本地还是云端,还是两者之间的容灾,实时数据备份、更小的数据恢复粒度和更快的容灾切换接管将是灾难中数据和业务保护的趋势未来恢复领域。