采用AIOps是必要的,因为当今管理和运行技术系统过于复杂,仅靠人类无法管理。要理解AIOps,它有助于转变为这样一种观念,即人类构建的技术系统已经变得过于复杂,无法仅由人类管理。具体来说,企业IT运维的复杂度突飞猛进,使人类陷入了相当混乱的境地。这是对人类智能的极大讽刺:人们构建的IT系统如此先进,以至于管理它们超出了人类的能力范围。在云计算时代之前,企业监控自己的数据中心是比较简单的。一些关键数据提要提供了机器如何运行(或不运行)的概览。IT专业人员团队是单独运作的,很少有人真正知道他们在做什么或他们关心什么。但随后出现了云计算,催生了私有云、公共云、混合云和多云,所有这些都在向云原生过渡,企业容器可以与虚拟机一起运行。企业可以使用OpenShift,这是一个支持微服务的平台即服务混合云平台。这可能会与Tanzu的企业部署互操作,Tanzu是虚拟化平台上的容器管理系统。同时,数据分析正在被实时流数据所取代,这对人类来说太快了,需要算法来分析。然后是来自边缘计算、物联网设备和大量智能手机的大量数据(目前全球约有35亿,预计到2023年将达到43亿)。企业的IT系统不断受到黑客的攻击,因此需要人工智能技术的帮助。什么是AIOps人类具有强大的创造力,也发明了压倒人们的IT系统。但人类可以创建辅助系统来帮助管理原有的IT系统。采用的辅助系统名称为AIOps,是人工智能与IT运维的混合体。AIOps一词最早由研究公司Gartner于2017年提出。人们可能会认为AIOps是“AIOperations”的首字母缩写词。但不是。Gartner将AIOps定义为“用于IT运营的AI”,尽管该术语本身并不指IT。无论如何,如果Gartner没有创造这个词,IT市场本身就会开发它,因为人们迫切需要该技术。简而言之,AIOps有助于处理以指数方式增长的数据量,这些数据量淹没了当今的IT操作系统以及试图管理它们的人员。Sageable的创始人、Splunk的前首席技术倡导者AndiMann解释说:“在ITOps中你能做的最好的事情就是数据点采样。”但问题是人类可能会错过重要的信息,或者只是将摘要放在一起进行事后回顾。在最坏的情况下,系统复杂性可能意味着冒着发现问题为时已晚而无法预防灾难的风险。相比之下,机器没有这些限制,通过采用事件关联、算法处理、机器学习和预测分析等AIOps原理和技术,机器可以读取每个数据源的每个字节,而信息直接来自数据没有采样或聚合的流。AIOps使用人工智能来推动急需的企业数字化转型。在最好的情况下,AIOps有助于将手动工作流程转变为人机数字流程。或者至少这是希望。AIOps的使用更好地管理和运营IT系统不仅需要标记当前问题,还需要展望未来并预测未来问题——这是新兴AIOps技术的核心目标。BMCCorporation首席产品官AliSiddiqui表示:“AIOps帮助企业将他们解决问题的方法从被动转变为预测,然后最终转变为主动。”根据BMCCorporation委托进行的一项研究,使用AIOps策略的企业中最热门的用例是:“AIOps提供了第二双眼睛,基于AI的模式跟踪可以帮助预测未来。”Siddiqui说,“AIOps可以确保潜在的问题在成为影响最终用户的实际问题之前主动标记出来。”即使在其短暂的生命周期中,AIOps也吸引了财力雄厚的客户。Splunk、BMC、NewRelic、IBM、BigPanda等供应商正在积极竞争,这是有充分理由的:2021年AIOps的全球市场规模将达到150亿美元左右,预计到2026年将达到400亿美元。未来的两个转变AIOps由于AIOps仍处于采用的早期阶段,预计未来会发生重大变化。在AIOps预期的两个关键变化中,一个是非常明显和预期的;另一个代表了技术理解方式的根本转变。(1)转变1:人工智能应用将呈指数级增长第一个转变是显而易见的。简单的自动化与实际的人工智能之间存在着模糊的界限,许多IT流程都可以实现自动化。例如,系统升级可以按照预先设定的时间表自动进行,而不是使用手动完成电子表格。然而,这种自动化并不是真正的人工智能。它只是相当于工厂中机器人的软件。相比之下,基于AI的系统会自行调整和响应——这正是AI发挥重要作用的地方。一旦人类对算法进行编程,人工智能系统的自我学习就会提供超越简单自动化的巨大飞跃。因此,未来AIOps有望采用越来越多的人工智能技术,并以指数级的速度扩大对IT系统的支持。拥有一个调整良好的AIOps系统将提供巨大的竞争优势。从长远来看,不部署AIOps的企业可能无法参与竞争。(2)Shift2:AIOps的含义会发生变化当然,“AIOps”这个词会变得过时。所有IT运营都必须内置人工智能——否则它们将无法生存。因此,“Ops”前面的“AI”会变得多余。比如今天有的车叫“电动车”,但是当所有的车都是电动的时候,“电动”这个词自然就去掉了。但AIOps的变化将远远大于术语的变化。当Gartner创造这个词时,该公司认为AIOps代表“用于IT运营的人工智能”。注意事项:这表明企业将拥有一个单独的人工智能系统,专门用于运行其IT运营。随着时间的推移,这个概念可能看起来很古怪。鉴于企业的IT系统与其整体运营(从HR到销售再到采购)的集成程度,任何支持AI的系统都不太可能被用于IT运营。AIOps术语最终将具有它一直以来的含义:不是“用于IT运营的人工智能”,而是“用于运营的人工智能”。包罗万象的人工智能系统将有助于监控IT运营、预测业务支出、预测员工保留率以及分析营销活动。ProgressSoftware首席执行官YogeshGupta最近阐述了这一AI愿景。Gupta说:“对我来说,AIOps是一个更广泛的术语。他指出,AI运营不仅仅是IT运营,而是关于“如何将AI带入业务的各个方面?”这包括核心业务应用程序的安全性和数据科学家使用的方法。这种更广泛定义的出现意味着,从长远来看,使用AIOps的企业将需要选择一个可以在多个层面扩展的AIOps系统。这可以远远超出有关网络和服务器性能的数据,以促进一系列业务实践。即使在2021年,也有人谈论AIOps和/或机器人过程自动化(RPA)的融合。因此,一个系统将处理企业重复性的办公任务并监督虚拟机的健康状况。考虑到AIOps供应商正在推进他们的工具集投入更多,势必会有更多这样的变化。那么,AIOps被认为是支持几乎所有业务和技术任务的系统需要多长时间?
