当前位置: 首页 > 科技观察

三大措施为AIOps的实施开个好头

时间:2023-03-17 18:36:32 科技观察

面对激烈的市场竞争,企业意识到有必要在业务与IT之间建立顺畅的“链接”。IT部门作为制定企业发展规划和战略路线的两大支柱,应该成为业务部门的重要伙伴和支撑。IT部门的诞生恰逢大型机的早期,当时它的基本作用仅限于“速度和馈送”。但在随后的发展过程中,开明的CIO们开始积极配合业务领导,重点思考运营指标对下游业务的实际影响。这种将生态系统可观察性和运营指标与业务成果联系起来的能力不仅代表着明显的竞争优势,也是企业实现转型和快速创新的必要条件。但说起来容易,我们如何一步步朝着这个最终目标迈进呢?目前,衡量IT性能的方法主要有两种:效率和有效性。效率衡量IT性能,通常在速度、可用性和吞吐量方面。另一方面,效率表示IT部门影响业务成果的能力。显然,业务部门更熟悉性能等指标,包括可用性、客户满意度、转化率、财务指标等。谁能实现这些目标,谁就能保持高于市场的增长率,为股东创造价值并为客户赋能。传奇大师彼得德鲁克在他的畅销书《卓有成效的管理者》中解释了效率和有效性之间的区别。他的结论虽然诞生于1966年,却经受住了时间的考验。德鲁克认为,两者可以分别理解为“做正确的事”和“做正确的事”。以CIO职能为例,做正确的事是最重要的,而做正确的事就是设定正确的目标来推动业务发展,这是实现目标的前提。事实证明,IT的价值往往体现在预算和人员配备上。在解释价值的过程中,CIO实际上是在证明他们如何理解系统、服务/应用程序,甚至客户群体对业务成果的直接影响——例如客户转化率、通过净推荐值(NPS)量化的客户忠诚度,以及最终收入和盈利能力。他们可以在服务和客户的背景下证明IT支出的合理性。基于这个前提,我们来快速梳理一下哪些指标不能证明IT的价值,哪些指标可以准确反映IT的回报。IT管理中经常使用正常运行时间和服务级别协议(SLA)等指标,但这些指标显然与高级管理层无关。相反,更有意义的IT指标应该指向创新和可扩展性,例如新服务时间(TTNS)。另一个重要指标是证明IT解决方案应对变化的能力。如今,敏捷企业已将数字服务纳入日常运营。过于频繁的变更和创新,往往会导致服务失败,严重影响客户体验。一旦受到影响,客户很可能会减少购买,甚至考虑更换新的服务提供商。面对这样的问题,IT需要在故障响应速度和创新发布速度之间取得平衡。理想情况下,IT应在客户实际受到影响之前检测并响应故障。虽然IT无法完全消除故障,但它通常是第一个发现问题并应用知识来防止潜在严重后果的人。为了提高这种性能,现代CIO正在转向AIOps。AIOps是指人工智能与IT运维的融合,具体涵盖大数据分析、机器学习(ML)和其他各种人工智能(AI)技术,从而自动识别和解决常见的IT问题。例如,IT人员可以使用AIOps来衡量由变更操作引起的意外事件的频率,并将这些事件与特定客户群相关联。IT团队甚至可以在客户遇到实际故障之前执行假设分析和自动响应。通过这种前瞻性的识别和响应能力,AIOps可以防止后续类似故障的发生,提高IT指标。这种主动管理能力不仅可以提升客户体验,还可以通过NPS量化效果。最终,这将导致运营成本降低,客户对新服务的接受度提高,高级管理人员对技术措施的理解和接受度提高。效率和效果可以说是CIO职能定位的核心。CIO要想与业务部门合作好,就必须根据具体的时间段,判断哪些内容对业务更重要,然后相应地投入资源,确保IT系统具备必要的技术和人才。只有将IT和业务部门的工作重点对齐,才能真正建立起双方的合作关系,确保CIO“做正确的事”。结合实践,我们发现以下三个步骤可以作为企业探索AIOps的理想起点:?打好第一仗:盘点自己的系统和流程,找出重复、笨拙的系统流程效率低下。消除和简化此类流程可以帮助您提高业务效率。?关注正确的数据:很多数据几乎没有业务相关性。因此,请确保仅记录最有价值的用例和最值得解决的问题,然后确定解决流程需要哪些数据。这种做法的意义在于引导我们关注正确的数据。?绘制生态系统图:确定整个企业生态系统中的跨职能团队。通过这个系统图,我们可以确定谁需要参与协作,然后聚合数据来训练模型。希望这三个技巧能帮助您成功迈出AIOps发现之旅的第一步。