译者|布加迪评论家|孙淑娟管理企业数据,就知道存储有利也有弊。一方面,能够访问大量数据对制定业务决策大有帮助。另一方面,存储所有这些数据可能成本高昂且管理起来很麻烦。这就是分层存储管理(HSM)发挥作用的地方。HSM是一种以安全、经济高效的方式存储数据的系统。本文简要介绍了HSM、它的定义、它的工作原理以及它可以为您的组织带来的一些好处。1.什么是HSM?分层存储管理(HSM)是一种以安全且经济高效的方式存储数据的系统。HSM背后的基本思想是将数据存储在最合适类型的存储介质上,具体取决于数据的访问频率。例如,经常访问的数据可以存储在更昂贵、高性能的存储介质上,例如固态硬盘(SSD),而不经常访问的数据可以存储在更便宜、性能较低的存储介质上,例如普通硬盘(硬盘)。虽然HSM是一个长期存在的概念,但由于技术存储和通信方法的进步,它自诞生以来发生了巨大变化。然而,尽管数据大小和访问时间等方面已今非昔比,但许多原始概念在今天仍然流行,只是处理大数据时的规模要大得多。2.HSM系统如何运作?HSM系统根据需要访问数据的频率自动在不同存储层之间移动数据。经常访问的数据将存储在SSD等快速、昂贵的存储介质上,而不经常访问的数据将移动到速度较慢、成本较低的存储介质上。这确保了用户始终可以快速访问他们需要的数据,同时将存储成本和功耗保持在最低水平。HSM相当于大多数计算机CPU上的缓存。与CPU缓存一样,经常使用的数据存储在小而快速的SRAM内存中,不经常使用的数据在需要加载新数据时移动到速度较慢但较大的DRAM中。3.HSM组件和算法HSM系统通常由三个关键组件组成:数据迁移策略、数据管理算法和数据分层或缓存机制。数据迁移策略定义了数据应如何根据使用频率或重要性等因素在不同存储设备之间移动。HSM系统使用的算法可以帮助根据数据访问频率或数据大小等标准确定哪些数据应该存储在哪个设备上。其中一些算法包括最近最少使用的替换算法,该算法将最近未访问过的数据移动到性能较低的存储层。大小-温度替换算法是另一种常用的算法,它使用温度阈值和大小阈值来确定何时迁移数据。启发式阈值算法是一种较新的算法,它使用机器学习技术来更准确地预测何时应迁移数据。4.分层和缓存HSM分层与缓存的争论是HSM系统设计人员在尝试确定利用较低性能存储层的最佳方式时面临的一个问题。分层可以提供更好的长期性能,而缓存可以提供更好的短期性能。无论您选择对存储进行分层还是缓存,这些机制都可确保将经常访问的数据存储在速度更快、更易于访问的设备上,而不经常访问的数据存储在速度较慢、成本较低的设备上。5、HSM的好处节省成本:HSM系统允许用户尽可能将数据存储在更便宜的存储介质上,从而使企业节省整体存储成本。提高性能:HSM系统允许用户将频繁访问的数据存储在高性能存储介质(如SSD)上,从而提高系统的整体性能。增强的安全性:分层存储管理系统允许用户将敏感数据存储在更安全的存储介质上,例如经过加密的SSD或HDD。这些选项有助于加强系统的整体安全性。改进的可管理性:HSM系统允许用户根据访问数据的频率将数据存储在不同类型的存储介质上。它们通过在需要时更容易查找和检索特定文件来帮助提高系统的整体可管理性。6.主流的HSM解决方案如今,市场上有许多不同的HSM解决方案。一些主要的大数据HSM解决方案包括:IBMSpectrumScaleEMCCelerra/VNXNetAppFAS/AFFHPE3parStoreServeHuaweiOceanStorDoradoQumuloCoreRedHatCephStorage请注意,以上列表并不完整,也不按任何特定顺序排列。当今市场上有许多不同的HSM解决方案,因此请确保您的存储工程师和其他数据专业人员花时间比较几种解决方案,以找到最适合您公司需求的解决方案。原文链接:https://www.techrepublic.com/article/what-is-hierarchical-storage-management/
