当前位置: 首页 > 科技观察

容灾备份关键指标

时间:2023-03-19 10:19:38 科技观察

数据复制软件的经典应用场景是容灾,包括备份、容灾、演练等,保障用户数据安全和业务连续性。本文来自:中国数据复制产业白皮书(2022)。(1)容灾基础知识衡量一个容灾系统是否优秀、是否满足分级保护要求的两个关键指标是恢复时间目标(RTO)和恢复点目标(RPO)。RecoveryTimeObjective(RTO):RecoveryTimeObjective,即恢复时间目标,是指用户业务系统能够容忍服务中断的最长时间。RecoveryPointObjective(RPO):RecoveryPointObjective,即数据恢复点目标,是指业务系统能够容忍的数据丢失量。根据恢复目标和所需的成本投入,容灾级别依次分为数据级容灾、应用级容灾和业务级容灾。级别越高,投资成本越高。云灾备:狭义的云灾备将灾备视为一种服务,客户付费使用灾备服务商提供的灾备服务模式。业界通常称为DRaaS。平台可根据需要设置容灾备份规则,实现多租户容灾管理,保障云数据安全。从广义上讲,云容灾是本地容灾的延伸。容灾备份场景可以发生在云平台上,也可以发生在本地和云平台之间。在云容灾模式下,数据保护的对象和容灾的目标端从本地系统转移到云端系统。与本地容灾相比,云容灾的传输环境具有带宽窄、不稳定的特点,这对数据复制技术的压缩能力和恢复传输能力提出了更高的要求。云容灾(云灾备、云备份)提供商可以是云平台服务提供商,也可以是灾备服务提供商。与前者相比,容灾服务商在专业性、备份粒度、兼容性、跨平台系统迁移和数据保护等方面更具优势。灾备演练:指在发生某种灾难场景时,如系统宕机、地震、火灾等,假设灾备系统或系统是否可以紧急使用而进行的主动应急演练。经常在野外进行周期性的灾备演练比如金融、医疗、政务等。业务连续性:是容灾技术的升华,是由计划和执行过程组成的战略,其目的是确保企业包括生产、销售、营销、财务、管理等重要的运营状态是安全可用的。业务连续性是覆盖整个企业的技术和操作方法的集合,其目的是保证企业信息流在任何时候、任何必要条件下都能保持业务连续性。业务连续性管理(BCM):是一个综合性的管理过程,涉及比灾难恢复更高级别的企业领导。BCM是企业针对潜在危机制定的一系列响应、业务和连续性恢复计划。提高企业风险防范能力,有效应对计划外业务中断,减少不利影响。例如,自然灾害、战争、国际贸易争端、不正当竞争打压等对企业经营的影响可以通过BCM增强。(2)备份及相关知识备份:数据或系统备份,是灾难恢复的基础,是指将全部或部分数据从硬盘或阵列复制到另一个存储介质的过程。根据中国容灾行业白皮书的总结,备份的分类有很多种。A、按备份时间和频率分为:定时备份和实时备份。定时备份:指有时间间隔的数据备份方式,如每天一次、每周一次或每月一次,定时备份可能会出现数据丢失的情况。实时备份:指没有时间间隔的数据备份方式。通过数据实时复制技术,保证主备两端数据读写一致,最大限度减少数据丢失甚至不丢失。持续数据保护(CDP),也称为连续备份,是在企业数据发生任何变化时对企业数据进行近乎实时的备份。CDP技术是对传统数据备份技术的革命性突破。传统的数据备份方案侧重于数据的周期性备份,因此往往存在备份窗口、数据一致性、对生产系统的影响等问题。B、按备份数据量大小分为:全量备份、增量备份、差异备份。完整备份:使用存储介质对整个数据和系统进行完整备份。这种备份方式的优点是非常直观,容易理解,而且容易恢复;缺点是备份数据中有很多重复数据,而且由于要备份的数据量比较大,备份时间比较长。增量备份:每次备份的数据只相当于上次备份后新增和修改的数据。这种备份的好处很明显,重复数据少,节省存储空间,缩短备份时间。差异备份:是将最近一次全量备份后产生或更新的所有新产生或更新的数据全部复制。增量备份和差异备份的区别在于,增量备份的数据更新准则是基于最后一个备份检查点,而差异备份则必须基于全量备份检查点。如果没有完整备份,就没有差异备份。差异备份的主要目的是限制用于完全还原的介质数量。复制数据管理(CDM)是一种可以节省存储资源并有效管理数据生命周期的技术方法,包括消除生产数据不必要的重复。数据副本管理技术之所以得名,是因为传统的备份软件和企业应用程序独立运行,通常会创建相同数据的多个副本。目前业内比较常见的CDM产品通常采用“先全量+永久增量”的备份方式,快速采集系统层、数据库层、系统层等数据,然后设置备份周期和根据用户环境的规则。负载恢复的方法可以快速恢复用户数据和服务。镜像备份:指镜像级备份。映像备份可以在数据块级别备份整个文件卷,备份传输的是数据块而不是文件。这种备份不仅在做全量备份时效率更高,而且在做增量备份时速度也更快。它使用快照技术创建一个近乎实时的数据镜像,然后对快照数据镜像进行备份,对应用程序的影响很小。适用于百万级以上的大型文件系统,以及更多需要恢复整个文件卷的应用环境。另外,传统的备份非常重视重复数据删除和压缩两类技术。重复数据删除:重复数据删除是一种自动搜索重复数据的方法。相同的数据只保留一份,其他重复的副本被替换为指向单一副本的指针,达到了消除数据冗余和降低存储容量的目的。所需的技术。通常用于基于磁盘的备份系统,以减少存储系统中使用的存储容量。去重技术包括源端去重和宿端去重,技术分类包括相同数据的检测技术、相似数据的检测和编码技术。压缩:是指在不丢失信息的情况下,减少数据量以减少存储空间,提高其传输、存储和处理效率的技术,或指按照一定的算法对数据进行重组,以减少数据冗余和存储空间。压缩可分为无损压缩和有损压缩。备份技术在不断进步,业界应该站在发展的角度来看待备份技术的进步。并非所有备份技术都需要重复数据删除或压缩,例如CDP技术。C、按备份对象分为:块级备份、文件级备份、数据库备份。我们需要了解什么是块级和文件级。首先看一下物理块与文件系统扇区->物理块->逻辑块->文件系统的映射关系。块级是指以扇区为基础,一个或连续的扇区组成一个块,也称为物理块。它介于文件系统和块设备(如磁盘驱动器)之间。块级访问是通过读写存储空间(磁盘,逻辑单元号Lun,文件集Volume)中的一个或一段地址来直接访问数据。文件级别是指文件系统。单个文件可能由一个或多个逻辑块组成,逻辑块是不连续分布的。逻辑块大于或等于物理块的整数倍。文件级访问是通过读取和写入文件中的一段数据来实现的。如果主机下达指令,则要求存储设备将A文件的前128字节复制到C盘下。块级备份:以磁盘块为基本单位,将数据从源端复制到备份端,即每次备份数据以一个扇区或多个连续扇区为单位进行备份。文件级备份:以文件为基本单位,以文件的形式读取数据,通过文件系统接口调用备份到另一个介质。两者比较,与传统的文件级备份相比,块级备份效率更高,备份时间更短,增量备份时只备份修改的物理块。传统的文件级备份,是先查找每个文件的逻辑块,再查找物理块,因为逻辑块分散在物理块上,物理块也分散在不同的扇区上。需要一层层往下查找,最后复制整个文件。数据库备份:对数据库周围的各种表、索引、视图、事务日志等进行定期或实时的备份。根据备份数据库的大小,数据库备份可以分为完全备份、事务日志备份、差异备份等类型。另外,根据备份时服务器是否关机,可以分为冷备份、热备份、温备份。根据数据存储介质之间的距离可分为本地备份和远程备份,根据数据备份的大小和路径可分为局域网。(局域网)、LANfreebackup、ServerFreebackup等。(三)容灾及相关知识提到容灾,就不得不提到数据中心和容灾中心,以及两地三中心.其中,两地三中心指同城异地,三中心指生产中心、同城灾备中心、异地灾备中心。两地三中心组合指的是同城双活、容灾、异地。备份技术的组合。容灾:指在异地建立两套或多套功能相同的IT系统,可以相互监控健康状态和功能切换。洪水等)停止工作,整个应用系统可以切换到另一个地方,使系统功能继续正常工作。容灾技术是系统高可用技术的组成部分。容灾系统更侧重于处理外部环境对系统的影响,尤其是灾难性事件对整个IT节点的影响,提供节点级的系统恢复功能。容灾分为本地容灾、异地容灾和云容灾。需要注意的是,集群等冗余方案保证系统可用性不等于容灾。在行业应用中,一些专业人士也容易混淆,导致集群系统出现故障时出现大规模的业务中断和服务中断,给组织带来经济和形象的损害。满足容灾的三个基本条件:第一,系统中的组件和数据是冗余的。当其中一个系统出现故障停止服务时,另一个系统可以继续提供服务。其次,两个系统必须相隔一定的距离。距离,比如50公里左右,可以提高容灾系统的抗风险能力。第三,在容灾系统的数据复制生命周期中,数据应该具有一致性、可用性和可恢复性。从系统的防护程度来区分,容灾系统可以分为数据级容灾、应用级容灾和业务级容灾。数据级容灾:是指通过建立异地容灾中心,对数据进行异地备份,保证灾难发生后原始数据不丢失、不被破坏。在数据级容灾中,一旦发生灾难,应用会中断,业务恢复需要很长时间。但与其他容灾级别相比,成本相对较低,建设和实施也相对简单。应用级容灾:在数据级容灾的基础上,在异地容灾中心搭建一套相同的应用系统,通过同步或异步复制技术实时复制数据,确保关键应用在允许的时间范围内恢复运行,尽可能减少故障造成的损失,让用户基本感受不到故障的发生。应用级容灾是一项复杂的IT工程,不仅涉及各种交换技术,还涉及人员部署等,建设和运维成本相当高。通常,业务和监管要求只需要银行和证券等关键机构。只有这样,才能进行应用级容灾系统的建设。业务级容灾:指所有核心业务的容灾。除了完善的IT网络,还需要完善的场地、电力等基础设施,这是所有灾备级别中最高的。随着组织数字化转型和信息化的发展,多中心生产的多活动模式正在成为行业趋势。例如大型国有银行可以在全国建设多个数据中心,每两个中心互为备份,实现业务级容灾。同时,为避免数据过度建设造成资源浪费,增加数据中心的电力负担,对于中小银行等机构而言,没有必要自建数据中心资产规模不到5000亿。高可用性:是指通过最大限度地减少日常维护操作(计划内)和系统突然崩溃(计划外)造成的停机时间来提高系统和应用程序的可用性,是企业防止计算机系统因故障而宕机的最有效手段.在国内,高可用系统中基于两台服务器的双机热备(或高可用)被广泛使用,因此双机热备经常被提及。根据工作中的切换模式,双机热备分为:主备模式(Active-Standbymode)和双主模式(Active-Activemode)。容灾与双活的区别:双活是系统冗余的范畴,而容灾包括建立容灾系统,需要涉及多种交换技术,如SAN或NAS技术,远程镜像技术、基于IP的SAN互连技术、快照技术等。一般来说,容灾的建设成本低于双活,数据丢失的风险也低于双活。限于篇幅,更多内容请参见原文《中国数据复制产业白皮书(2022)》。