当前位置: 首页 > 科技观察

全闪存数据中心的数据减少策略

时间:2023-03-20 17:42:39 科技观察

全闪存数据中心的概念很有吸引力,因为它消除了耗时的系统调整。它使数据中心能够支持极端的虚拟机密度,其存储响应时间满足大多数应用程序提供商的要求。随着每GB闪存的价格普遍下降,重复数据删除、压缩和自动精简配置等数据缩减方法也使全闪存数据中心从概念变为现实。很少有供应商提供所有三种解决方案来应对数据缩减挑战,因此了解哪一种(如果有的话)最适合您的组织非常重要。在考虑数据缩减技术以使闪存更经济实惠时,您必须考虑可能的性能影响。在接近零响应时间的存储介质上添加任何层都会对性能产生影响,但关键问题是“应用程序或用户会注意到这一层的影响吗?”您始终可以通过增加处理能力和内存性能影响来减轻这种影响。选择适合您的数据缩减方法对于绝大多数数据中心,与任何数据缩减方法相关的开销几乎不明显。这些系统可以利用大多数数据中心无法利用的性能,因此花费一些数据减少处理周期来降低闪存系统的成本显然是值得的。精简配置(Thinprovisioning)是一个完整的解决方案,几乎适用于所有环境。动态增加卷的容量当然有开销,但它是最小的。这种技术非常有效,因为没有其他形式的数据缩减可以优化它。它将新容量硬分配给指定的LUN,不再由所有其他LUN共享。重复数据删除(Dedupe)跨文件消除数据的冗余部分。重复数据删除的好处是显而易见的,尤其是在虚拟化环境中,不同客户操作系统之间的数据实际上有很多共性。但是,重复数据删除会显着提高性能需求。它创建了大量元数据来跟踪冗余数据中的唯一数据和指针。快速交付重复数据删除所需的元数据对于整体系统性能至关重要。虽然闪存会有所帮助,但随着系统规模的扩大,跟踪冗余将需要更多的CPU能力,从而导致存储系统的购置成本更高。压缩(Compression)还可以减少存储容量的占用,它从根本上消除了文件内部的冗余,而不是文件之间的冗余信息。虽然压缩可能无法提供像重复数据删除那样高的缩减率,例如9:1,但它确实提供了更一致的处理结果,因为它作用于所有文件,不需要跨文件创建冗余信息。这种文件级效率使压缩成为数据库和其他单文件信息的理想选择。同步(内联)需求数据减少对全闪存和混合存储系统有两个明显的好处:它有助于降低整体容量需求。许多全闪存阵列供应商声称其产品的价格点低于3/GB,有些甚至声称低于1/GB。实际结果会有所不同,具体取决于具体数据缩减实施的效率,每个数据中心对这些技术需要达到的效率水平都有一些独特的要求。数据缩减。如果能同步(in-line)完成,将有助于延长闪存模块的寿命。闪存模块在写操作方面有众所周知的限制,它们都有一个预期的最大写入次数。在将数据写入闪存之前执行这三种数据缩减方法称为同时(内联)数据效率。例如,如果您同时使用这三种方法,则可以实现5:1的缩小率——这是一个合理的结果。5:1的数据缩减意味着写入操作减少了20%,这将显着延长闪存模块的使用寿命。那么哪种方法效果最好?这取决于用例——大多数数据中心都在为各种不同的工作负载部署和使用闪存。曾几何时,每种数据缩减方法都对特定类型的工作负载最有效。对于混合工作负载,最有效的系统应该具备上述三个功能,并且能够同时执行数据缩减。目前,能够同时提供这三种功能的系统并不多见。针对具体的应用场景,答案会有所不同。例如,在数据库环境中,压缩系统就足够了。如果数据库对性能要求非常苛刻,则可能需要不进行数据缩减操作或关闭数据缩减。对于虚拟环境,使用具有重复数据删除功能的系统可能更合适。数据缩减的替代方案:原生容量数据缩减的替代方案是原生容量。过去,没有数据缩减功能的通用闪存阵列系统非常昂贵。但现在,随着TLC、3DNAND等新兴高密度闪存技术的出现,全闪存阵列的价格已经突破$1/GB甚至更低。这些较新的技术虽然在耐用性方面存在更多问题,但可以与更可靠的SLC结合使用,作为对写入更敏感的TLC层的减震器。这种方法的优点是数据中心确切地知道每GB的成本是多少,并且不需要担心数据缩减变量和使用它的性能开销。毫无疑问,数据缩减技术使全闪存数据中心的概念更加现实。数据缩减技术的每个支柱——重复数据删除、压缩和自动精简配置——都有其价值。但是,当全闪存阵列可以集成所有三个功能并且可以在数据写入闪存模块之前完成同步(内联)数据缩减操作时,这些方法最有效。