当前位置: 首页 > 科技观察

不容错过的AIOps落地关键点指南_0

时间:2023-03-17 20:02:20 科技观察

【.comExpress翻译】随着系统的效率和复杂度不断提高,我们用来承载服务的IT环境也变得异常复杂。许多企业在向微服务和容器化迈进的过程中,进一步在现有应用中加入了大量的服务组件。那么如何管理和协调各个组件之间的功能和关系显然是我们需要面对和应对的一个巨大挑战。对于大多数企业而言,其IT运营(ITOps)团队往往只能应对上述复杂情况,难以获得更多实用信息和管理资源。而这正是支持人工智能的IT运营(AIOps)发挥作用的地方。通过大数据、数据分析、机器学习等技术提供的高度定制化服务,AIOps可以为当前流行的基础设施提供全面、深入的有价值支持。下面我们就来看看AIOps实施实践相关的关键知识点。理解AIOps如今,虽然有大量的自动化工具,但ITOps团队并不能从效率的提升中获益。由于这些工具还不能根据数据进行自动化决策,人工运维的工作量依然巨大。AIOps提供了一种更精细的方法来将数据分析集成到ITOps中。它可以根据组织的目标更好地支持可扩展的工作流。AIOps平台的各种技术组件AIOps的各种用例异常检测——作为最基本的检测方法,只有当检测到数据异常时,才会触发一定的补救措施。因果分析——为了快速高效地解决问题,AIOps支持按需根本原因分析。预测——AIOps可以利用支持的工具对未来进行自动预测。例如,它可以了解用户流量如何以及何时发生变化,并相应地做出反应以解决问题。警报管理——无需任何人工干预即可自动进行智能化、闭环补救。在AIOps和DevOps之间创造平衡众所周知,DevOps给很多企业带来了文化变革,AIOps也有同样的效果。AIOps通过帮助企业从各种相互关联但分散的数据中发现潜在的洞察力,使企业决策自动化更加敏捷和准确。企业摆脱长期存在的信息孤岛状态非常重要。他们希望自己的系统产生的数据能够具有全局的可观察性(observability),而不局限于单一的部门或业务。此外,通过AIOps,ITOps经理的传统职能将逐渐转变为系统站点可靠性工程师(SiteReliabilityEngineer)的角色。这样,他们就可以利用手头收集到的信息,更有效地解决遇到的各种问题。尽管AIOps和DevOps的目标都是改善组织的服务并提高整体生产力,但AIOps还可以通过减少阻碍生产力的干扰因素来提高DevOps实践的效率。例如:AIOps可以有效减少各种平台的误报和通知数量,让DevOps工程师可以更轻松地将有限的精力集中在真正的故障问题上。可以肯定地说,AIOps可以为DevOps工程师及其企业目标做更多事。AIOps与时间管理无论企业开发团队大小,总会遇到“时间紧、任务紧”等普遍问题。幸运的是,无论是创建机器学习模型还是处理数据,AIOps都可以灵活地获取数据并处理大量的新信息,帮助你在有限的时间内完成海量任务。过去,企业虽然深知高质量数据的重要性,但面对其复杂性,往往无法通过常规的数据分析来解读、验证,甚至无法为自己所用。毕马威的一项调查显示:67%的CEO将不得不选择性地忽略计算机驱动模型或数据分析提供的见解,因为它们与自己的想法或经验不符,无法做出判断。今天,AIOps能够利用那些训练有素的机器学习算法,“实时”地捕获和维护那些高质量的数据,然后采用大量现有的用例来实现快速和准确的处理。例如:对于那些可以检测服务异常状态的用例,快速识别错误代码和消息往往是至关重要的。尤其是在防范系统安全漏洞的场景中,AIOps可以为运维团队提供一种自动化、精准的方式,以最快的方式找到问题的各种替代方案。AIOps的日益流行当然,拥有数据是一回事,但真正能够有效地使用它又是另一回事。在实际应用中,企业往往需要借助机器学习的相关技术,自动扩展目标应用及其对应的平台。据MarketsandMarkets(https://www.marketsandmarkets.com/PressReleases/aiops-platform.asp)预测:明年采用AIOps平台的企业增长率将达到34%,目前对转化率的需求是也在持续增长。AIOps使企业在不占用资源的情况下更加敏捷和响应更快。可以说,AIOps即将成为高度数字化时代必不可少的工具。AIOps的落地随着越来越多的企业愿意在运营中采用AIOps模式,他们不得不面对的问题是:如何以适合业务需求的方式接受它。以下是我们为您准备的AIOps实施要点指南:l实施团队通过了解人工智能和机器学习的基础知识,可以更好地运用相关技术。该调查揭示了运营人员日常工作中最耗时的任务。尤其是那些需要有效转化为自动化的重复性工作,往往最需要AIOps介入,以减轻运营负担。避免一次涵盖太多方面。我们可以从小处着手,处理高优先级的任务。一旦获得良好的反馈,技术用例可以通过及时评估推广到解决其他领域和任务中的任务。对不同的数据采用AIOps。毫无疑问,这一举措可能比你想象的要花更长的时间,但你会对你当前的系统有更多的了解。此外,通过及时成功定义参数和评估指标,您需要确保AIOps工作与组织目标完全一致。从应用成熟度的角度来看,对于大多数组织,尤其是IT部门的领导,他们更热衷于通过自动化执行复杂的事件和任务来减少各种告警的数量,减少服务中断和停机。来成本。在采用和实施AIOps时,不同的组织可能有不同的目标。但是,他们通常希望对目标系统有更全面的了解,并希望对生产环境进行更高效的操作处理。下图显示了一个五步成熟度模型。该模型可以帮助组织确定他们在监控和自动化过程中所处的位置。来源:ScienceLogic实际上,AIOps主要适用于那些有长期目标的人,将其应用到微服务驱动的应用程序中。也就是说,AIOps旨在确保组织内的信息流以满足总体架构和业务目标,而不仅仅是改进当前的运营流程。运营团队需要从当前应用的角度出发,与架构团队甚至云支持团队一起重新考虑如何感知整个堆栈。此外,这对于使用微服务构建的应用程序尤为重要。同时,企业需要通过重新设计各种运营功能,深入了解应用层的架构特点,让合适的数据自动流向应用开发者,提供各种必要的洞察。综上所述,很多公司都以尝鲜的方式采用了AIOps的运营模式,但也遇到了很多实际的实施问题。希望以上建议可以帮助大家更顺利地过渡到AIOps,充分释放AIOps的潜力。原标题:AIOps最重要的元素,作者:RahulSingh