当前位置: 首页 > 科技观察

基于AI的存储正在帮助企业从数据中获得更多

时间:2023-03-21 13:05:22 科技观察

如果您可以将存储视为自动驾驶汽车,而不是需要动手、劳动密集型的必需品,会怎样?如果它像一辆自动驾驶汽车会怎么样同样,如果您的存储基础设施能够预测您的需求并一路扫清障碍呢?根据您对新技术的容忍度和您公司的文化,您可能已经在利用从应用程序行为中学习的技术来识别应用程序和配置中的异常,并使用此信息来预测和预防问题。正是人工智能为这些核心技术赋能。事实上,人工智能正在经历一个特殊的时刻,据专家称,这不太可能很快改变。麦肯锡最近的一项调查发现,近一半的公司目前正在以某种方式使用人工智能,但绝大多数公司仍预计未来几年他们对人工智能的投资将继续增加。AI在满足当今的存储需求方面也迅速变得至关重要。它能够如此快速、智能地分析如此多的数据,并有助于避免瓶颈、可用性问题和安全问题。基于AI的存储将使IT员工能够花更少的时间来救火,并提高基础设施的可用性和生产力。HPEStorage产品营销总监DaweiWang表示,公司的目标是创建一个自动化的、人工智能驱动的基础设施,几乎可以即时提供洞察力。“我们希望达到这样一种程度,即洞察力可以推动立即可见的变化,”他说。“有一种观点认为,应该有一个端到端的人工智能管道,从本地边缘一直到云端。”以不同的方式看待问题AI改变了存储的任务,这意味着企业也应该以不同的方式看待存储和数据,IBM存储营销总监DougO'Flaherty说。“你必须停止将存储视为数据库或特定用例所需的东西,而是考虑如何以不同方式访问来自不同部门的数据,”他说。“如果你能让数据科学家或其他在组织中具有跨职能职责的人访问这些数据,你就可以进入下一个级别的数据分析,这将是真正改变存储的关键任务。”除了从更广泛的角度考虑这一点,与传统的以数据为中心的方法相比,采用更以应用程序为中心的存储方法也很重要。“在大数据AI世界的1.0版本中,公司认为他们必须是数据驱动的。因此,他们专注于将所有数据存储在存储库中以及该组中的所有AI人员,”专门从事分布式NoSQL数据库技术的SpliceMachine首席执行官MonteZweben解释道。结果,他说,这些数据湖通常会很快变成“数据沼泽”,这主要是因为负责业务流程的人员没有考虑到这些业务流程中使用的数据和应用程序。通过关注应用程序而不是数据,您将能够更好地将存储及其功能与业务相匹配。例如,处理大量索赔(业务流程)的保险公司将与负责索赔系统的索赔专家和应用程序开发人员合作,以确定应用程序。通过将它们放在一起,他们可以就如何使用该数据创建智能索赔处理系统做出更好的决策。”它是关于让应用程序能够更智能地处理数据,而不是试图收集世界上所有的数据并将其提供给那些可能对索赔感兴趣的人,”他说。“这是一个简单的想法,但它会对企业实施人工智能的方式产生深远影响。“构建成功的基于AI的存储基础架构还意味着解决AI存储管道中的三个不同阶段:数据摄取(从不同环境中摄取和规范化数据,以便您可以将其视为一个整体)、训练(使用机器学习来研究数据以了解其真实内容)和推理(提供见解的阶段)。为了满足这些要求,存储基础设施必须能够支持超大容量、长期数据保留和高性能处理。换句话说,人工智能在规模还需要大规模的容量、保留和性能。根据StorageSwitzerland首席分析师GeorgeCrump的说法,支持高存储容量的能力至关重要。组织很少删除用于训练AI工作负载的数据点,因为初始成本很高他说,获取此类数据。此外,这些数据集不遵循典型的数据访问模型,因此随着年龄的增长,使用的机会会减少。“AI工作负载需要几乎100%的时间重新处理旧训练数据,因此整个数据集需要随时可用,”他补充道。长期保留同样重要,尤其是随着存储容量的增加“我们的意思是,机器将根据输入的数据做出决策。这意味着数据无法删除。它会继续增长,”O“弗莱厄蒂说。“你拥有的数据越多,你应用AI的准确度和效率就越高。“除了简单地存储更多数据之外,你还必须存储更多类型的数据。这包括关于数据的数据(元数据),许多人认为这正在成为最有价值的商品之一,尤其是在数据治理方面。第三个要求是高性能处理。“训练AI应用程序是一个迭代过程,(并且)提高准确性将是一个迭代过程,调整AI算法,然后再次训练,”Crump说。“迭代速度越快,开发人员可以制作的模型越准确,这就会给存储基础设施带来更大的压力。“在大多数人工智能工作负载中,确保这些环境中的标准图形处理单元(GPU)尽可能忙碌是至关重要的,”CrumpCrump说。根据AI工作负载,一个有很多节点、混合闪存和硬盘驱动器的横向扩展存储系统是有意义的。“AI工作负载往往是非常并行的,一个并行的、横向扩展的存储集群可以挑战甚至在硬盘驱动器上运行,”Crump说。“通过从系统中提取数据并将人工智能方法应用于选定的数据集以找到相关性,充分利用人工智能可以简单地增加初创公司的现有数据,”他说。不过,最终,您会想要更深入地挖掘。一旦您的关键应用程序和系统绑定在一起,获得AI的真正好处可能需要部署新的基础设施和新的数据处理方式。您基于AI的选择一个好的存储系统应该具有快速管理元数据的智能,并能够将正确类型的数据存储在正确类型的存储上。如果您选择在本地运行您的基础架构,您可以从全闪存存储系统开始,但最终将其移动到闪存和硬盘的混合环境也是有意义的。通常,该环境还将包括软件定义的存储,它可以在环境之间自动移动数据。一些组织更愿意将所有内容都保留在本地——尤其是那些具有敏感工作负载和合规性/数据治理问题的组织——而其他组织则可以从基于云的人工智能/存储环境中受益。”其中很大一部分发生在云中,因为云计算需要共享计算能力和数据,”HPENimbleStorage产品管理高级总监RochnaDhand表示,因此使用从云端收集全球数据的系统是有意义的。同时,Dhand还表示,HPE正在研究如何将云端HPEInsight提供的同类型全局数据分析应用到用户的内部环境中。她表示,这样做的目的是将在云计算中获得的经验组织成代码,作为防火墙后的本地更新应用。Dhand认为,随着时间的推移,技术将不断发展,基础架构管理最终将实现完全自动化。“你将能够预测和预防更多问题,你会对这些预测和预防更有信心,”她说。“你不仅能够预测问题并找到解决问题的方法,而且你'您将能够更进一步,确定正确的解决方案并采取行动。“