当前位置: 首页 > 科技观察

如何建立数据中心设施管理团队

时间:2023-03-16 11:40:50 科技观察

企业依靠数据中心来支持他们的大部分业务,这意味着即使是一个小时的中断也会造成巨大的损失。无论您的企业使用专用数据中心还是托管设施,请确保您拥有合适的人员、流程和政策来维持正常运行时间。为了构建和维护一个真正高效和可扩展的数据中心,您必须有合适的人员来监控和管理它。数据中心设施支持不足会迅速破坏最佳计划,使您的人员、基础设施和业务面临风险。如果您有机会组建自己的数据中心设施团队,请确保您选择的人员具备正确的专业知识、技能和培训组合,以确保您的基础设施和设施顺利运行。为什么人在数据中心设施管理中很重要?研究表明,数据中心固有的复杂性使它们比其他业务设施更容易遭受人为错误导致的某种中断的可能性高70%-75%。为消除人为错误并确保足够的人员配备水平,企业需要雇用和投资于技能娴熟、以团队为导向的人员来安装、维护和运营您的数据中心。由于数据中心使用的基础设施类型(例如VM、虚拟存储和虚拟网络)、每天处理的工作负载以及IT维护周期,数据中心的管理环境可能具有挑战性。这些挑战需要多个团队仔细协调和规划,包括设施团队、基础设施所有者、企业所有者和用户以及高层管理人员。由于投资中有如此多的活动部分和利益相关者,您必须确保各方之间的良好沟通和积极参与。拥有合适的设施团队和适当的战略可以发挥重要作用,因为设施最终会影响公司的其他部分。您可以采取以下四个具体步骤来为您的组织创建有效、可扩展且有价值的数据中心设施团队。第1步:记录您的策略管理和运营关键任务设施需要设施的整个团队充分了解预期的内容。让设施团队达成共识的第一步是制定数据中心管理策略。这应该概述您设施的基础设施要求,以及您设施中服务的可用性,例如环境健康和安全、能源管理、应急准备和持续培训。为确保此策略尽可能有效,请考虑为其添加以下流程:定期检查设施以确保一切正常。检查发电机、水温、燃油油位以及电气和机械分配系统。持续的系统测试,使关键系统在规定的安全测试范围内运行。这包括定期负载测试和备份或故障转移测试。预测性维护活动,用于识别在潜在故障之前可能发生的操作中的任何变化、趋势或异常。预测性维护使设施人员有机会在问题成为问题之前解决问题。预防性维护流程和程序使关键人员系统平稳运行并减少昂贵的临时修复。遵循制造商的指南来确定何时执行这些活动以保持系统正常运行。当某个项目在其定期维护计划之外发生故障时,您应该执行纠正性维护活动,例如修复系统或组件或对其进行故障排除。这包括设施维护,例如修复泄漏或更换有故障的HVAC组件。第2步:创建综合团队您的数据中心团队应包括特定设施领域的专家,例如电气、机械和操作控制;火灾探测和灭火;质量管理;建立管理系统和人员培训。如果该团队作为您的基础架构或IT支持团队承担双重职责,他们还必须了解DCIM产品等数字维护软件系统。您的设施团队必须及时了解可能影响他们工作的行业趋势和变化,因此即使从长远来看,也要将培训放在首位。第3步:开发独特的人员配置模型您的公司应该为其设施、业务职能和运营任务开发特定的人员配置模型。考虑支持范围要求-例如您是否只有白天工作时间或24/7全天候运行、紧急响应需求、维护活动工作量、项目监督要求和您的运营预算。定期分析设施维护范围的周期有助于确定这些活动的人员配备要求,还可以帮助您更好地分配和预测资源和预算。最终,您系统的任务关键性和停机成本决定了您的覆盖范围。第4步:定义和记录角色和职责许多公司在其数据中心人员管理中包含角色和职责的文档。考虑运行数据中心设施所涉及的各种角色和人员,从设施经理和数据中心管理员,到利益相关者和受数据中心变更影响的人员。应明确定义设施团队和他们参与的其他团队中每个人的角色和职责。明确定义的职责作为评估技能和绩效以及设定成长和培训目标的基准。此外,这可以帮助您的企业避免信息在特定组内隔离或人员在其域外工作的协作问题。