可以肯定地说,AIOps已经成为当今最热门的术语之一。严格来说,是指利用人工智能辅助IT运营。从另一种意义上说,这让人想起利用人工智能将公司的技术基础设施提升到一个全新的水平。在一次网络研讨会中,行业专家讨论了以下主题:什么是AIOps?您如何开始使用AIOps?挑战是什么?你怎么解决它们?AIOps的未来是什么?现在准备如何?BMCSoftware首席产品官AliSiddiqui和Intellyx总裁JasonBloomberg这两位AIOps行业专家对这些话题进行了分析和探讨。什么是AIOps?Siddiquiu:“我认为AIOps的字面意思是‘用于运营的人工智能’。”人工智能实际上是计算机科学的一个分支,专注于机器模式识别和统计技术来分析其环境,所以在AIOps中,在ITOps的情况下,它会分析IT操作环境。我会说,不断提供上下文“信息,AIOps将能够在事情发生之前看到事情。这确实是一项真正推动ITOps转型数字化的关键技术。”彭博社:“实际上,这个术语,无论好坏,都是Gartner创造的一个术语。它最初指的是用于操作的算法基础设施,但没有人知道它们的含义,也没有任何意义。但它没有流行起来,所以他们很快就改了措辞说,“大家都认为AIOps是人工智能的意思,所以我们一直认为它真正的意思是这样的,它是针对运营的人工智能”。但也正因为如此,它确实是Gartner的努力。该公司还创造了IT运营管理(ITOM)一词,并以某种方式将其与人工智能技术相结合,然后观察供应商对此做了什么。”那么AIOps主要是为IT服务的吗?还是AIOps可以帮助企业经营业务的更大的东西?软件为企业赋能。所以,对于正在进行数字化转型的组织,软件可以帮助他们与客户建立联系。确保软件正常运行并满足业务需求是当前业务优先事项的核心部分,因此业务现在与IT一样受到关注,因此从这个意义上说,AIOps将为这一愿景提供支持数字企业,但它实际上仍然与IT运营有关。“如果一家企业想要加入AIOps,首先要做的是什么?”Siddiqui:“因此,在IT组织中,你需要选择其中一些用例,最好是一两个,然后将你的团队吸引到合适的供应商那里来解决这些特定的用例,而且确实有一些关键目标是告诉企业它是否成功。所以这是我要说的关键事情之一,不仅仅是评估,而是知道它最终会在哪里?成功的标准是什么?这有哪些实际例子?Siddiqui:“所以,从ITOps的角度来看,异常检测将是用例之一。从用例的角度来看,这真正意味着不想手动设置阈值或做基准测试,这是工作人员想要学习的东西从系统中降低噪音,需要自我学习和自我纠正,然后解决问题。通过系统学习和检测异常,然后不仅告诉异常是什么,还要告诉它们将如何解决。”彭博社:“重要的是要了解,在企业操作环境中,已经有许多不同的工具,其中一些是较旧的工具,而另一些可能是较新的工具。部分挑战在于我们拥有这些不同的工具。”请记住,从CIO的角度来看,他们不仅拥有很多工具,而且他们已经在很多工具上花费了更多,因此必须有一个真正的成本理由来引入新工具。所以实际上有两种方法,一种是需要淘汰一种或多种遗留工具,因为它们不再满足业务需求,或者不再受支持。或者,填补空白可能是将AIOps引入组织的最常见方式,而且经常出现的问题是事件多个问题。较旧的AIOps技术将始终生成可能代表实际问题的事件,或者只是一些小问题,或者可能是关于同一问题的多个通知,然后业务最终会出现运维人员每小时看到数十个问题的情况,并且每天的事件数量将会激增。AIOps特别擅长解决这个问题,识别那些异常,因此识别那些??需要注意的奇异事件。它有助于减少小事故的影响。AIOps还擅长结合相关事件……一旦AIOps到位,这些事件现在将为企业带来额外的好处,帮助其渡过事件风暴。“部署AIOps的挑战是什么,企业如何应对这些挑战?”Siddiqui:“部署AIOps的挑战在于不要忘记平衡。随着企业继续他们的AIOps之旅,必须考虑所有三个维度:人员、流程和工具。现在供应商中有一些非常好的工具。但是人员和流程可能是薄弱环节。归根结底,这实际上是将您的业务重塑为技术驱动型业务。因此,重点实际上是敏捷性和以客户为中心。在我看来,业务成果必须至高无上。无论是敏捷性还是客户体验,改善客户体验,所以这些都是至关重要的。”彭博社:“重要的是要了解AIOps和AI在一般AIOps场景中的使用与当前的AIOps相关,但又不同人工智能在企业中的使用。人工智能在企业中特别有用,可以从大型数据集中提取见解。这对于在日常业务中处理大型数据集的任何企业来说都是如此。所以,这就是eAIOps供应商介入。他们说,‘我们将提供AIOps技术,而无需指派数据科学家来研究AIOps技术。'企业可以指派运营人员和其他负责其运营环境的人员。故事的另一部分是AIOps故事的安全部分。AIOps可以检测到的异常可能只是一些系统内存不足或某种操作异常。但通常是某种网络安全异常。这表明某种攻击正在发生。“AIOps的未来是什么,企业如何为未来做好准备?”Siddiqui:“所以如果你看看AIOps的未来,我认为在未来几年内,将会有如此多的数据影响。因此,企业需要开箱即用的机器学习能力,能够从大量数据中获得洞察力。数据,不管是日志、事件、指标,都无所谓,再就是加强IT运维和开发人员,这种紧密的nexusConnections会进一步驱动一些AIOps需求。因此,业务必须有一个明确的ROI,并且工具集成可能会改善客户体验。因此,AIOps不仅有助于提高运营效率,而且有助于实现数字化转型。因此,我对未来几年的自主数字企业之旅和ITOps紧密合作以了解业务持乐观态度结果。也就是说,供应商正在制作易于使用的工具。我们有很多客户,其中许多仍然是混合的,这意味着他们正在转向云,旅程还没有结束。这意味着有本地要求。即使是我们的BMCAMIAIOps套件,特别是刚刚推出的AMIOperationalInsight产品,它也可以在本地设施中运行。”彭博社:“我们现在谈论AIOps的唯一原因是因为人工智能是一项新兴技术。”几年后,所有运营管理都将具备AI能力。如果一切都由AI赋能,那么AI运营将只是运营管理,不再被视为一个独特的类别。但是,在企业基础架构环境中发生这种情况有两个主要驱动因素。其中之一,当我们看到正在发生的巨大变化时,正在转向一个模型称为云原生计算,我们将云计算的最佳实践应用于所有企业IT,包括混合IT。而且环境非常动态。这是容器世界(Kubernetes)为传统虚拟机带来的能力之一,这是一个非常动态的企业基础设施环境,当一个企业有这样一个环境,产生如此多的数据时,根本没有办法手动管理它,它必须自动化。所有这些趋势不会停止,AIOps在未来会变得越来越重要,无处不在。“
