当前位置: 首页 > 科技观察

AIOps7KeyCapabilities

时间:2023-03-16 01:07:50 科技观察

随着企业网络的不断演进,尤其是向数字业务应用转型,维持服务正常运行成为一项艰巨的挑战。例如,当前的服务往往需要与遗留系统共存,这增加了管理的复杂性;随着时间的推移,基础设施组件和服务水平的多样性常常迫使我们部署多种管理工具;管理工具的增加导致整体视图数据的连续性变得更加难以维护,由此产生的信息孤岛导致可用数据的低效使用。使问题更加复杂的是,这些组件正在生成越来越多的事件、日志和信息,最终使IT运营团队不堪重负。基于以上现实,越来越难以找到基础设施问题的根源,或者主动解决问题。这不仅会导致更长的平均恢复时间(MTTR),还会导致服务交付不佳,最终导致糟糕的客户体验并影响整体客户满意度。幸运的是,随着挑战的出现,解决它们的方法也随之而来。人工智能技术为AIOps工具和平台带来了前所未有的发展前景。AIOps平台提供的功能有望充分满足现代商业服务交付对数字化转型提出的复杂性和规模化需求。根据Gartner的说法,“AIOps平台结合了大数据和机器学习功能,以可扩展的方式摄取和分析IT流程中快速生成的不同数据量,以支持核心IT运营功能。该平台可以同时支持多个数据源,多种数据收集方法、分析和展示技术。”最好的AIOps工具需要聚合数据,提取洞察,最终基于智能输出提供价值。那么,一个理想的AIOps工具需要具备哪些基本功能呢?这七点不容忽视。首先,数据收集。寻找一个与其他解决方案完美协作的系统。本质上,企业的AIOps解决方案必须能够从多个来源收集信息,包括物理基础设施组件(如服务和应用程序)以及虚拟实体。在部署过程中,企业的AIOps解决方案还必须能够与现有监控工具和新兴技术接口。其次,数据聚合。关注有助于促进跨领域协作的功能。首先,企业的AIOps解决方案需要能够聚合来自IT基础设施监控(ITIM)、网络性能监控和诊断(NPMD)、数字体验监控(DEM)和应用程序性能监控(APM)。第三,数据充实。聚合是启用数据使用的第一步,但要获得真正的价值,我们的AIOps还需要能够丰富收集的数据。AIOps需要通过日志、事件等历史数据提供一个回溯视图,并通过应用元数据和标签丰富索引中的搜索内容。通过用时间戳覆盖数据点,可以丰富性能和遥测信息等实时数据,以生成有意义的时间序列信息。未来企业在使用这些信息时,还可以添加适当的标签,建立键值对,充分发挥数据的潜力。第四,分析见解。洞察力是AIOps工具的核心价值。显然,单靠最基本的相关性和统计分析能力不足以确定复杂的根本原因。模式发现和异常检测是一个好的AIOps系统的关键组成部分,也可以为基于洞察力的规范制定提供重要的实施依据。除了基础设施运营洞察,我们的AIOps系统还应该分析基础设施问题对业务的具体影响。由此产生的服务水平协议(SLA)管理将帮助企业在与非技术利益相关者交互时获得极大的便利和价值。第五,自动化。自动化可以为IT运营管理系统带来高效率和有效性。因此,企业的AIOps工具最好能快速生成和部署工作流,自动实现各种功能。具体来说,AIOps系统应该提供诸如自动化库维护功能和跨操作流程的快速工作流共享等选项。卓越的自动化不仅提高了操作敏捷性,而且显着减少了意外错误并大大提高了服务可用性。第六,易用性。部分AIOps平台提供了云端管理层,可以帮助IT团队以安全、分布式的方式解决多个客户同时在多个站点的问题,从而提高管理效率。通过监控数据管道,AIOps平台可以帮助其他工具轻松访问收集到的信息,并极大地促进团队之间的协作。第七,灵活部署。在服务保障方面,不同的企业往往有不同的实际情况和具体需求。因此,在选择AIOps平台时,无论是自托管、远程管理还是平台即服务,AIOps的部署模式都必须能够满足企业独特的业务和运营需求。总结根据Gartner的预测,到2023年2月,30%的大型企业将使用AIOps平台。AIOps用例表明,现有技术完全能够实现真正主动的IT运营管理功能。它提供了一种优秀的方法,将帮助我们在面对不断发展的基础设施时始终拥有优秀而有效的复杂性管理方法。企业在选择AIOps工具时必须谨慎。只有满足以上七项基本要求的优秀AIOps工具,才能巩固业务战略成果,带来稳定可靠的IT运营能力。