当前位置: 首页 > 科技观察

使用基于AI的云管理工具时场景很重要

时间:2023-03-13 08:30:00 科技观察

虽然基于AI的云管理工具仍处于采用的早期阶段,但IT行业专家表示,采用此类工具可以减少与性能和根本原因分析相关的问题数量。很多工作。致力于深入了解云基础架构和应用程序性能的管理员将拥有一个新盟友:人工智能。IT专业人士表示,一些新的和传统的IT供应商已经将人工智能技术整合到他们的云管理工具中。虽然它们的功能集——例如分析主机性能、优化成本和设置警报的能力——可能看起来类似于传统的第三方管理工具,但这些基于AI的平台将达到新的高度,提供更大的粒度和更广泛的场景。英国家居装修和建筑市场零售商TravisPerkins在其本地数据中心和亚马逊网络服务(AWS)云平台上使用了Dynatrace基于人工智能的性能监控平台。该公司电子商务DevOps团队负责人Al-Tayib表示,该工具可以更准确地报告Java运行时代码和错误等领域的指标,而不是专注于与主机服务器或实例相关的更高级别的指标。这使他的团队能够在问题出现时执行更快、更准确的根本原因分析,并更好地评估任何问题可能对业务产生的总体影响。Al-Tayib说:“在调查或研究我们面临的挑战的具体性能因素时,不再需要手动调查。Dynatrace使用这个平台将所有内容汇总到一份报告中。报告说,‘这项服务是在这里。没有被触发,所以它导致了一系列事件,然后与企业客户发生冲突。“企业可以立即看到他们的问题和挑战到底在哪里,”该公司首席技术策略师AloisReitbauer解释说,为了为了启动这个根本原因分析,用户在他们的主机上安装Dynatrace代理软件来识别资源之间的各种依赖关系,并帮助将某些事件与出现的任何问题相关联。“如果用户在主机上耗尽CPU,并且有一个响应时间问题与该主机上运行的服务有关,那么该工具可以说是相关的,”Reitbauer说。更复杂的异常检测,或识别IT服务异常执行的方法,是使用基于AI的管理工具脱颖而出的另一个功能。为此,Dynatrace工具执行此自动化过程,通过对响应时间、故障率和吞吐量等指标应用不同的算法来评估基线或标准系统性能。在该工具推断出正常性能后,它会提醒IT团队注意与该行为的任何偏差。为了避免警报泛滥,用户可以进一步指定性能阈值,该工具还应用算法来评估它们的重要性。“如果两个主机存在基础设施问题,用户显然更关心电子商务应用程序中购物车的结账功能,而不是另一个可能正在执行后台批处理的问题,”Reitbauer说。“从基础设施案例来看,用户上下文非常重要。”这种AI驱动的云管理工具删除非关键警报的能力也将有利于其他用户。一家云存储提供商的网络和基础设施容量规划人员表示,他们将AWS用于后端基础设施,这种能力是他们公司采用基于AI的云管理工具YotaScale的主要原因之一。容量规划人员评估了几种第三方云管理工具,但发现YotaScale工具有点嘈杂,因为警报和建议的数量太多了。例如,一家公司可能会为新的研发项目启动一些AWS实例,而这些实例在项目启动时往往未得到充分利用,他说。第三方云管理工具可能会建议调整这些实例的大小或通过AWS预留实例预留它们,但在这种情况下,这些建议是无关紧要的。Reitbauer说:“这并不是我们在引导场景中所做的,我们正试图提出一个新的测试或项目,所以这将被忽略。”根据YotaScale首席执行官AsimRazzaq的说法,智能的好处在于能够分析各个业务部门或单位的IT基础设施。在上面的例子中,这是研发团队的镜头。“我们将企业和组织方式映射到基础设施。然后,在这种情况下,提供优化建议和异常检测,”Razzaq说。YotaScale工具通过用户输入启用此业务场景。用户调整某些参数并拒绝不合适的建议,教会该工具随着时间的推移检测最相关的内容。人工智能取代人类?不太快速采用这些基于AI的云管理工具的主要好处是减少了人类进行大量分析的需要。技术咨询公司MoorInsights&Strategy的分析师ChrisWilder表示,即使是最先进的工具也无法提供相同的洞察力,至少现在还没有。ChrisWilder是一位拥有20年行业经验的IT专家。“这些算法根据他们发现的异常情况变得越来越聪明,但他们仍然缺乏经验,”怀尔德说。“在我看来,数据并不能替代人类的专业知识。它只是一种增强。”451Research分析师JayLyman表示,这些人工智能功能仍处于早期阶段。但它们最终将成为基础设施管理工具供应商的必备工具。“我们很早就知道每个供应商都必须在他们的自动化系统中使用某种机器学习和人工智能,”莱曼说。“我认为这将是一个可以有多种选择的程序。”