人工智能技术通过使用机器学习、计算统计和各种深度学习模型已成为主流。社交网络、搜索引擎、购物网站等使用大量人工智能应用程序,包括个性化和产品推荐引擎、点击流分析、图像特征识别和分类以及广告价格优化等应用程序。亚马逊、谷歌和微软等公司将这些功能打包到云计算服务中,因此开发人员不必成为掌握这些复杂算法的专家。近年来,类似的AI方法已应用于IT运营和管理中的许多任务,这个应用领域现在被称为AIOps。虽然AIOps通常被认为是提供全面基础设施和运营管理的产品领域,但人工智能也被应用于与数据中心硬件(包括存储系统)捆绑在一起的管理软件。企业可以将AI应用于存储管理,使用预测性机器学习来分析有关系统事件、内部参数和特定于工作负载的指标(例如错误日志、性能指标和存储硬件创建的容量利用率)的大量数据流。由于机器学习模型的准确性与用于训练它们的数据量相关,因此大多数存储供应商从他们的客户群中收集匿名数据来创建海量数据集,这些数据集几乎可以捕获用户可能遇到的任何场景、工作负载或场景和异常。人工智能和设备遥测的结合产生了预测性存储分析产品,这些产品可以显着减少设置时间、自动优化配置、主动警告即将发生的问题,甚至可以在存储管理员不参与的情况下解决常见问题。在这里,将检查来自供应商的一些存储管理产品,这些产品使用AI驱动的分析来改进阵列操作和存储管理效率。典型的AI存储特性和功能在查看这些产品的分析功能之前,了解基础知识很重要。作为一项炙手可热的新技术,“人工智能”一词通常带有一些炒作和滥用的意味。曾经被认为是标准的功能已经得到增强,可以合并新数据并转变为人工智能驱动的功能。供应商有时对AI在其产品中的具体用途以及它如何在现有产品功能之外增强管理体验含糊不清。大多数产品使用机器学习数据分析来提供以下五种功能中的一种或多种:(1)自动化日常支持任务,例如容量管理;(2)优化设备、容量设置和配置;(3)更新系统软件、补丁以及特定于设备和安装的修补程序;(4)通过预测趋势和情景分析规划资源扩张;(5)通过特定于平台的优化和指标来管理虚拟化平台。存储供应商通常使用功能来区分其AI驱动的存储分析功能。产品软件执行的质量将决定它兑现人工智能承诺的程度。AI为存储管理员带来了许多好处,包括:通过任务自动化降低运营开支,特别是容量和性能管理等经常会带来意外惊喜的事情。通过主动解决问题来提高系统可用性,例如自动扩展容量、在设备之间切换以平衡资源使用以及在灾难性事件发生之前警告硬盘驱动器故障。通过推荐最佳配置和工作负载位置、调整参数以响应不断变化的系统遥测以及不过度配置数据集容量,提高资源利用率和效率。预测性存储分析工具使系统和管理员能够更高效、更可靠地运行。以下内容介绍了AI增强型存储产品及其主要特点。这并不是要详尽列出所有使用AI的存储分析产品,而是重点介绍主要供应商的产品。(1)DellEMCCloudIQDellEMC向其存储系统的用户免费提供CloudIQSaaS应用程序,包括UnityXT、PowerMax、XtremIO、SC系列、PowerVault、Isilon和Connectrix光纤通道交换机。CloudIQ的功能包括集成监控、预测分析和异常检测,部分通过机器学习实现。其产品能力包括:统一监控一个环境中的所有存储系统;预测分析,在关键存储资源面临耗尽危险时主动发出警告;异常检测学习系统正常运行中的模式并检测可能表明性能或安全问题的模式当问题出现偏差时发出警告;确定问题的根本原因。CloudIQ仪表板、警报和预测依赖于来自系统警报、性能指标、容量使用和系统配置的数据,这些数据可以显示在日志中或通过仪表板、可视化和计算指标显示。CloudIQ的数据摘要称为ActiveHealthScore,是系统健康状况的指标。分数使用0到100的标准化比例,基于组件故障、配置缺陷、性能问题、容量问题和数据保护方面的数据。CloudIQ可通过Web或移动设施用户界面(UI)使用,其信息范围从环境中系统的整体健康评分到有关单个阵列和存储卷的详细信息。CloudIQ洞察力有助于分析和排除存储故障。(2)HPEInfoSightHPEInfoSight是一种基于云的预测性存储分析工具,与此处讨论的其他产品一样,它使用机器学习来分析服务器、存储和虚拟机环境。HPE声称其产品可以在影响运营和工作负载之前预测并解决86%的系统问题。InfoSight提供了一个中央管理控制台,可以分析和关联整个基础架构堆栈(包括存储、服务器、虚拟机)中的事件。它基于HPE在收购NimbleStorage后获得的成熟技术,NimbleStorage是使用聚合匿名数据预测存储性能和资源的行业先驱之一。与竞争产品一样,HPE分析客户数据以构建和改进InfoSight的机器学习模型。该系统可以检测并在某些情况下纠正尚未发生的问题。HPE还将InfoSight与其支持操作相集成,以针对检测到的系统无法自动解决的问题自动触发故障单。InfoSight提供了一个中央存储管理控制台。(3)HitachiOpsCenterAnalyzerHitachiOpsCenterAnalyzer是HitachiOpsCenter软件套件的一部分,是用于共享存储系统、服务器、虚拟机和SAN交换机的机器学习驱动的管理软件。它以可安装产品或SaaS应用程序的形式提供。其主要功能包括:可跨越多个数据中心的受监控资源的综合视图;预测分析,主动警告资源枯竭并指导规划;基于计算的历史模式的异常检测;关联事件、性能指标和配置更改,并推荐解决方案以自动进行根本原因分析。预测存储分析产品与日立的其他IT运营软件集成,包括其OpsCenterAutomator。与DellEMC产品一样,HitachiOpsCenterAnalyzer有一个受监控资源的摘要仪表板,可以突出显示关键警报、警告和性能趋势,但它也允许存储管理员专注于特定的存储系统。(4)IBMStorageInsightsStorageInsights是IBM的免费容量和性能管理产品。该版本支持IBM和部分第三方虚拟化存储系统。此外,StorageInsights自动收集和汇总系统日志数据,以提供系统清单和基本级别的配置、容量、性能和健康监控。它还会标记违反IBM最佳实践的配置并提供迁移和升级建议。Professional订阅增加了对IBM的文件和对象存储系统以及EMC的VNX和VMAX产品的支持。IBMStorageInsights还具有高级库存和监控选项、针对分层数据存储的优化和放置建议以及可自定义的警报。预测分析和容量规划功能需要专业级订阅。这两个版本都有针对各种IT任务定制的仪表板,包括系统操作、配置优化、性能、容量规划、问题解决和产品支持。(5)InfinidatInfiniVerseInfinidat通过智能数据缓存将机器学习从管理平面延伸到存储系统。该产品的缓存管理算法NeuralCache使用系统的数据访问和I/O历史来识别用于管理的缓存存储,以提高性能和相关性。InfiniVerse管理产品包含在所有Infinidat存储系统中,具有集成系统和性能监控功能。其中包括基于机器学习的分析,这些分析是根据来自Infinidat客户群的匿名元数据进行训练的。这些AI驱动的分析可识别可提高容量利用率、消除性能瓶颈和优化工作负载布置的变化。存储系统可以识别孤立的(已分配但未使用的)存储容量、硬件故障或应用程序异常,例如数据库服务器的往返延迟达到不可接受的水平。Infinidat计划在2020年增加自动化工作负载移动性,这将自动在分布式存储集群中的机架之间移动工作负载。此功能旨在提高性能和可靠性。(6)NetAppActiveIQActiveIQ包括上面列出的基于机器学习的基本分析和管理功能,与该类别中的大多数产品一样,ActiveIQ使用从NetApp客户收集的元数据来训练和更新其预测模型。与HPE一样,NetApp将ActiveIQ与产品支持团队集成在一起,使软件能够在检测到无法解决的问题时自动打开故障单。与此处讨论的其他存储管理产品一样,ActiveIQ生成统计数据和系统仪表板。它使用其分析为已识别的问题生成建议的操作。例如,风险报告确定了六大类问题,包括硬件故障、不受支持的配置和资源消耗,并有一个纠正措施字段,其中包含指向客户支持公告、错误报告和解决风险的知识库文章的链接。ActiveIQ还通过令牌保护的API公开功能和数据,使组织能够将系统与其DevOps自动化管道和IT关键绩效指标仪表板集成。(7)PureStoragePure1MetaPure1Meta是PureStorage阵列的分析平台,它汇总了该公司声称每天从云连接客户那里收到的超过1万亿个数据点。这些数据进入一个多PB的数据湖,用于训练容量和性能管理的预测模型。该公司表示,来自其10,000名客户的数据至少涵盖了100,000种不同的应用程序和工作负载配置文件。这允许系统对整体性能和与存储阵列上其他应用程序的交互进行建模,以帮助进行工作负载放置、整合和配置优化。聚合数据收集还使Pure1Meta平台能够在漏洞首次影响客户时标记漏洞,并在它们对其他人造成安全或可靠性问题之前检测到它们。当检测到违规时,Pure1Meta平台会通知存储管理员并通过Pure1MetaSupport创建故障单。Pure1Meta还包括一个模拟功能,允许用户查看环境中新工作负载、卷迁移和硬件更改的预期影响。在部署之前测试各种场景允许存储管理员优化工作负载布置并做出更好的硬件购买决策。Pure1Meta可通过WebUI或适用于iOS和Android的移动应用程序使用。AI驱动的分析软件已成为存储供应商的首要任务,这使得预测性和规范性分析的质量及其与管理和支持软件的集成成为产品评估的关键点。上述预测性存储分析产品侧重于每个供应商的硬件,但人工智能增强型管理软件越来越多地可用于多云环境。因此,用不了多久我们就会在异构存储环境中看到类似的功能。
