当前位置: 首页 > 科技观察

云计算将在大数据领域发挥怎样的作用?

时间:2023-03-20 12:22:08 科技观察

[.com快者]大数据处理和所有权正在导致存储行业现状的转变。本文描述了存储实践中最重要的变化。企业存储环境主要围绕记录系统构建,关注的问题包括:对于固定数据记录长度的文件,应该购买什么类型的存储介质和管理系统,以及所存储数据的性质是否是实时的、近乎实时的-实时的,或者只是偶尔需要访问的批量填充的数据,或者可以用数据存档完整保存等。自从大数据进入企业数据中心和业务部门,一切都变了——一个单一的大数据文件可以以TB甚至PB为单位进行测量。在Hadoop等分析平台上并行处理大数据与事务数据的顺序处理之间存在明显区别。毫不奇怪,存储方面的考虑会相应地发生变化。这种变化在数据分析和高性能计算领域最为明显。该领域由Hadoop应用程序主导,它们使用算法分析方法并行处理PB级数据,用于数据科学和其他复杂查询。在高性能应用方面,很难考虑虚拟化存储或云存储等概念,因为你只能通过数据中心的物理处理器和存储平台直接处理和存储数据和查询结果。因此,这项工作的计算密集型和存储密集型性质阻止了包括存储专业人员在内的数据中心管理人员像过去十年那样寻求虚拟化或云计算。以大数据对象存储为特征的单个数据集的绝对大小也是如此,它使用元数据标签来描述非传统数据图像,如照片、视频、录音和文档图像。此外,大数据项目的所有权改变了存储计算。如果公司的业务部门正在运行一个大数据项目,它的目标将转向一个碎片化的分布式物理存储架构。储存设备。分布式横向扩展NAS是基于云或虚拟存储的替代方案,与这些流行的IT趋势形成鲜明对比。鉴于这些发展,云计算在大数据领域可以发挥什么作用?答案是冷库,这是一个企业界尚未充分利用的领域。冷存储是非常便宜、非常慢的磁盘驻留数据,存储在存档中以便妥善保管。在日常IT中,很少有可能需要这些数据,因此如果您将其移动到异地数据存储库而不占用数据中心或操作系统的空间,将会很方便。如果该数据存储库位于云中,您可以从数据中心远程访问它,而不必千里迢迢跑到异地取磁盘或磁带。云计算和虚拟存储在数据集市方面也有发展前景。如今,许多公司都使用数据集市为不同部门运行批量查询。数据集市使用的数据大部分是批量创建的,基本都是过去用来查询的传统数据。不同之处在于,与过去相比,用户现在拥有更多的分析报告工具和查询选项,而且数据管理员更有能力生成从不同来源聚合的数据。在这种批处理环境中,磁盘存储解决方案一如既往地有效。存储管理员需要应对大数据带来的变化,尤其是如何处理数量众多的极其庞大的大数据文件。这需要专门的磁盘、处理,在大多数情况下还需要与云计算和虚拟化项目背道而驰的本地存储。另一方面,商业冷存储解决方案可能最终消除这样的困境:很少使用的数据驻留在机房中过时的磁盘和磁带驱动器上,无人看管。原标题:大数据项目撼动存储现状[.com独家翻译,合作站点转载并注明出处]