当前位置: 首页 > 科技观察

为什么数据中心需要时刻保持警惕和维护?_0

时间:2023-03-14 15:43:04 科技观察

数据中心的正常运行时间对于业务成功至关重要,确保不间断的服务交付需要时刻保持警惕和维护运营。随着组织越来越多地部署更多关键业务应用程序,这种对持续维护和对基础架构的依赖的需求似乎只会增加。虽然技术不断创新并引入了新的基础设施管理工具,但许多工具仍然无法实现行业所寻求的自动化和更低的维护成本。因此,许多IT专业人员仍在投入大量精力来手动解决需要调整和优化的问题。运营商面临的主要问题是数据中心的维护周期仍然需要人为干预。此外,数据中心运营商花费大部分预算来维持它们的正常运行。这就引出了一个问题,为什么在不断引入新工具来解决这个问题的同时,它仍然需要大量维护。人们到底缺少什么?传统基础设施工具的不足要真正消除数据中心基础设施的管理负担,需要具有预测性,以便在问题发生之前预测问题,同时能够深入了解底层工作负载和资源智能,以更好地优化基础设施。组织需要考虑以下四个因素来确定所采用的工具在克服令人沮丧的维护问题方面的不足之处:1.报告本地系统指标而不向其他人学习的分析通常提供的价值有限。相反,采用该工具的目的是它能够从数以千计的对等系统的行为中学习,以帮助检测和诊断发展中的问题。从两个想法比一个更好的意义上讲,需要集思广益。数据收集和分析的整体方法可以汇集来自各种工作负载的观察结果。这使得在一个数据中心识别出的罕见事件可以在另一个数据中心提前避免,并且可以更准确地检测到更常见的事件。2.看不到全局传统工具往往只能提供孤立的分析。每个设备只提供系统状态,这只是整个过程的一部分。由于在基础架构堆栈中的任何地方都会出现破坏应用程序的问题,因此能够跨多个层进行跨堆栈分析以获得更大的视图非常重要。这将需要关键组件,例如应用程序、计算、虚拟化、数据库、网络和存储。3.对预测建模的理解不足需要深入的领域经验,并且需要理解基础架构堆栈中每个系统内的所有操作、环境和遥测参数。一般分析需要深入。然而,行业领域专家和人工智能的相互作用可以让机器学习算法识别历史事件的因果关系,从而预测最复杂和最具破坏性的问题。4.无法主动采用传统工具的最大缺点或许是无法主动。在自主运行的理想状态下,数据中心将自我管理、自我修复和自我优化。从本质上讲,他们应该能够在没有管理员人工干预的情况下避免问题或改善环境。实现这一级别的自动化需要经过验证的自动化建议历史,以提供必要的信任和信心。数据中心维护的未来为了克服传统工具的局限性,有效降低维护需求,更好地实现数据中心自动化,需要新一代的人工智能解决方案。这意味着利用能够观察、学习、预测、推荐并最终实现自动化的工具。通过观察,人工智能将能够对各种工作负载和应用程序的理想操作环境形成稳定的理解。深度系统遥测与全球连接相结合,可实现云计算机的快速学习,使AI工具能够通过模式匹配算法快速预测问题。甚至可以对新基础架构进行建模和调整,以根据过去的历史配置和工作负载模式优化应用程序性能。基于这些预测分析,人工智能解决方案可以确定改善数据中心环境所需的适当响应。然后IT团队就可以减轻压力,这意味着他们在管理基础架构时不再需要通宵工作才能找到问题的根源。更重要的是,如果AI证明有效,则无需IT管理员干预即可自动应用建议。所以这就是自动化的意思。例如,HPE的数据中心运维在86%的时间里使用人工智能工具自动预测和解决问题。此外,他们在存储问题上花费的时间减少了85%,甚至可以将IT存储运营费用减少79%。因此,部署人工智能辅助数据中心基础设施的优势是不可否认的。此外,随着技术进步和经济发展,高度多样化的地区预计到2030年将面临200万IT专业人员的短缺。在不远的将来,自动化将成为数据中心管理的下一个前沿。