企业NetOps团队面临着筛选大量传入数据以识别网络上出现的技术、性能和安全问题的挑战。传统上,这是一个耗时的手动过程。如今,NetOps团队正在优先考虑有助于发现问题并快速解决问题的解决方案——AIOps就是其中之一。AIOps使用人工智能来发现和理解模式,并识别大型复杂数据集中的异常情况。根据Gartner的说法,“AIOps结合了大数据和机器学习来自动化IT操作流程,包括事件关联、异常检测和因果关系确定。”虽然AIOps可以做很多事情,但最近的研究表明,企业正在优先考虑有助于快速识别潜在网络问题(例如异常检测/智能警报和升级)并尽快修复它们(例如自动修复安全事件和IT服务问题)。为了进一步探讨这个主题,让我们深入研究一些最近的EMA研究,评估AIOps的使用和看法,并了解AIOps驱动的方法如何使NetOps团队受益。研究:确定用例的优先级在AIOps方面,EMA研究表明,企业显然在优先考虑与保持网络安全和高效运行直接相关的场景。例如,56%的企业正在优先考虑或实施异常检测,这涉及暴露异常活动或超出正常参数的操作,使其成为AIOps的首选。此外,可以训练人工智能(AI)以快速区分真正威胁网络运行的异常情况,帮助团队将精力集中在最需要的地方。例如,当带宽消耗出现异常峰值时,企业需要定义策略来检测通常的月度趋势中的异常,可以跟踪这些异常并将其缩小到某些网络服务或应用程序。这通常发生在计划外的服务器或数据备份期间,或者在BW使用某些应用程序(例如大文件传输或流媒体)期间。对于安全事件,目标是尽快消除威胁。根据EMA的说法,安全事件初始响应中涉及的大部分内容都可以很容易地实现自动化,只要规则正确,这种类型的自动化安全事件补救是企业的第二优先用途(55%)。自动化初始安全响应不仅可以加快问题的解决速度,还可以让团队更密切地关注那些需要直接人工干预的领域。围绕自动化安全事件和补救的一个常见场景是未知应用程序或主机/IP被标记并使用网络资源、服务或公司带宽。可以对企业外部的主机进行标记和回溯,在此过程中使用访问列表进行隔离。处理大量警报如前所述,NetOps和SecOps团队每天都面临大量警报,这些警报可能隐藏严重的操作或安全问题。由于AI擅长模式识别,因此智能警报/升级(53%)是企业第三高优先级用例。根据网络安全漏洞的类型和级别,可以设置服务策略来警告或升级这些问题。团队还可以配置基本警报和黑名单,以便将来分析简单的网络异常,这可以阻止通过服务策略定义的无法识别的流量模式。类似于安全事件的补救,自动化IT服务中的问题缓解过程将加快MTTR并确保运营效率。这使得自动化IT服务问题修复(52%)成为企业第四高优先级AIOps用例。为了解决这个问题,团队可以根据服务级别或应用程序级别的事件(这正在成为企业的重要优先事项)和适当的警报机制来定制强大的事件管理策略。同时,需要对不同事件的记录、跟踪和管理策略进行适当规划,以进行适当的补救。与上述发现一致,大多数企业倾向于围绕网络安全基础设施(例如防火墙或入侵检测和保护解决方案)开始部署和集成AIOps,以更好地检测异常、升级警报和修复安全问题。也就是说,应用程序基础设施,包括数据中心交换、云网络和应用程序交付网络解决方案,是一个重要的次要优先事项。AIOps解决方案部署的最后一个重点领域是Wi-Fi和WAN基础设施。AIOps与数据有关鉴于这些AIOP的优先级,以及AIOps与任何AI/ML相关的数据这一事实,企业发现数据管理(48%)是网络团队所需的顶级技能也就不足为奇了。事实上,较早的研究发现,数据质量不佳是AIOps成功应用于网络和安全管理的主要技术挑战。除了数据背景之外,企业将通用人工智能和基础设施知识(42%)列为第二优先技能。这表明一些企业可能正在开发内部AIOps功能,或寻求修改商业解决方案。同样,算法开发和API技能(39%)都在优先级列表中名列前茅,这再次表明组织正在构建或微调底层算法,并致力于将软件和工具更广泛地集成到AIOps空间中。总的来说,希望在AIOps中取得成功的组织正在寻求用特定的数据、人工智能、算法和集成技能来补充他们的网络或安全团队。企业希望有效地回答复杂的问题以加快解决速度。AIOps允许企业使用AI/ML来补充IT团队的能力,以快速识别和减轻对整体网络性能或安全的威胁,包括异常检测、自动安全和事件补救等问题。随着新工具的出现,NetOps团队需要学习新技能,例如数据管理、AI知识和算法开发。最终,这可以帮助这些团队和公司简化工作流程、更好地解释数据并高效、安全地管理网络。
