当前位置: 首页 > 科技观察

恢复时间比备份时间长的五个原因

时间:2023-03-18 17:19:28 科技观察

许多人惊讶地发现恢复时间比备份时间长,但这一点也不奇怪。事实上,每个人都应该为这种差异做好计划,并将其纳入备份设计中。以下是恢复通常比备份慢的五个原因。RAID写入开销大多数现代磁盘阵列都是使用基于奇偶校验的独立磁盘冗余阵列(RAID)构建的,RAID级别从3到6。其他磁盘阵列是使用擦除编码构建的,这对基于奇偶校验的RAID提出了类似的挑战。基于奇偶校验的RAID在数据写入阵列时需要计算奇偶校验信息。从同一个数组读取数据时不会进行此计算,因此读取比写入快得多。写入开销对性能的影响可大可小,具体取决于RAID级别和/或擦除编码中使用的设置。但是所有这样的数组都会面临一些写开销,你需要弄清楚你的写开销是多少。Copy-on-write快照是一个类似于写开销的概念,它发生在使用copy-on-write快照的阵列和NAS文件管理器中。当您创建写时复制快照时,它只是一根立在地上的棍子作为参考点。最初创建快照时,几乎没有发生I/O;所有繁重的工作都发生在之后。当写入操作试图覆盖需要为快照保存的块时,在允许写入操作继续之前,该块被复制到快照区域。这就是为什么它被称为写时复制。与RAID写入开销一样,这仅发生在写入时。快照开销也可能非常昂贵,因为它取决于保存在该特定卷上的快照数量。更多的快照增加了在继续写入操作之前需要复制单个写入的机会;因此,写时复制卷上的快照越多,写入新数据时的性能就越差。写入文件系统下一个写入开销发生在写入文件系统时,尤其是具有数百万个文件的密集系统。恢复文件时,文件系统必须首先创建一个文件来恢复该数据。创建此文件是一项单独的操作,无论文件大小如何都需要时间。如果有数百万个文件要恢复,这个文件创建时间实际上可能比恢复本身花费的时间更长。不堪重负的事务日志关系数据库具有跟踪数据库所有更改的事务日志。数据库在事务日志中快速记录事务的能力通常不是大多数数据库设计中必须考虑的方面。但是,大型恢复每秒可能创建比正常工作日所需更多的事务,因此事务日志上的负载比平时大得多。因此,事务日志也会减慢恢复速度。多路复用备份流在考虑恢复比备份慢时要注意的最后一个方面是多路复用。好消息是这种开销只发生在直接从磁带恢复时。如果备份系统是基于磁盘的,则不会出现此问题。这实际上是过去二十年许多人放弃磁带的主要原因。要理解这个问题,请考虑磁带驱动器的主要问题:它们比需要的速度快得多。现代流式磁带驱动器比典型的增量备份快10到20倍。为了解决这个问题,业界开发了多路复用:将多个备份流交织成一个足够快的流,以保持磁带驱动器的正常运行。20年前开发多路复用技术时,该领域的大多数人都觉得他们别无选择,因为他们必须让磁带驱动器满意才能成功备份。然而,恢复面临着巨大的开销。如果您从多个磁带恢复,备份软件必须读取整个磁带并丢弃除您需要的流之外的所有流。如果多路复用设置为10,则磁带机必须读取所有10个流,丢弃其中的9个。这对恢复速度有很大的影响。如果将它与上面的一些写入开销结合起来,它会变得更糟。如果磁盘驱动器无法像磁带驱动器读取数据一样快地写入数据,则必须停止并启动磁带驱动器以使磁盘驱动器赶上。重要的是评估恢复延迟、设定预期、找出您环境中的恢复速度开销,然后将其纳入您的备份设计。在要从中恢复数据的每种类型的系统上对每种不同类型的数据执行测试恢复。这包括您在数据中心使用的每种不同类型的RAID,每个大型文件服务器。弄清楚规定的恢复速度是多少恢复速度,然后询问供应商如何加快这个恢复速度。然后准确设定预期在大复苏期间的预期。开会讨论恢复重要文件服务器需要多长时间,并向受影响的人解释为什么会发生这种情况。供应商可以帮助解释它是否无能为力,你可以接受,或者研究一种完全不同的备份技术。在需要恢复任何数据之前完成所有这些非常重要。尽可能彻底地测试恢复,看看恢复比备份慢多少,并相应地调整设计和预期。原标题:恢复比备份耗时更长的5个原因,作者:W.CurtisPreston