当前位置: 首页 > 科技观察

哪个数据中心关键绩效指标(KPI)最有用?

时间:2023-03-16 10:20:27 科技观察

当数据中心管理人员和维护人员评估性能时,他们需要一种同时查看短期和长期数据的方法。关键绩效指标(KPI)提供了一种评估组件的方法,例如存储设备。数据中心工作人员必须定期评估硬件和软件性能,以帮助他们做出有关升级和人员配置的决策。关键绩效指标(KPI)是获得额外视角以帮助业务运营、跟踪数据中心健康状况和监控单个组件(如存储设备)的有用方法。为确保存储设备高效可靠,数据中心管理和维护人员应跟踪和关注数据中心的这三个主要关键性能指标(KPI)。(1)利用率。这显示可用存储设备容量与总存储容量的比率。低比率意味着浪费存储容量。当利用率这一关键绩效指标(KPI)较低时,企业领导者通常会限制新的存储投资。高比率表示需要额外的容量,并且可以帮助企业绝对证明购买存储硬件是合理的。(2)可用性。这是衡量存储设备正常运行时间与计划或预期存储正常运行时间的比率。在软件定义环境中汇集存储时,您可以测量主要存储子系统(例如存储服务器或存储阵列)或存储层的可用性。极高的比率表示特定存储资源在大多数时间都可用。随着比率下降,业务领导者可以跟踪可能影响工作负载可用性、用户满意度和业务收入的存储问题的早期预警。(3)计划不可用。这是实际停机时间与计划停机时间的比率。KPI为1.0表示对存储资源执行的工作已在分配的时间范围内完成。比率小于1.0表示实际停机时间少于预期。如果该比率升至1.0以上,则实际停机时间将比预期的长。高于1.0的比率可能表示人员配备问题、设备短缺、采购审批延迟或服务时间延长。企业主经常使用此数据中心KPI作为运营效率的衡量标准,如果它一直很高,则有必要进行根本原因分析。IT和业务领导者可能会为存储采用更细化的数据中心KPI,例如平均故障间隔时间(MTBF)和平均修复时间(MTTR)。MTBF是设备故障或服务问题之间的平均时间。就存储而言,这是衡量存储系统可靠性的平均指标。随着时间的推移,平均值的任何变化都可以提供对可能需要更深入调查或设备评估的可能系统问题的宝贵见解。平均修复时间(MTTR)是事件发生和解决之间的平均持续时间。在大多数情况下,平均修复时间(MTTR)只是随着时间的推移进行跟踪,企业领导者将平均修复时间(MTTR)的变化作为平均修复成本、员工专业知识和系统可靠性问题的指标作为间接衡量指标的。