数据中心企业经常会因为运维管理人员操作不当而出现硬件和网络故障等问题。那么无论是在机房还是远程运维人员,应该选择哪种日常交易方式才能高效安全地工作呢?1.清晰和稳健的流程和文件数据中心的操作过程应该被记录下来,具有明确和具体的验证和实践已经通过程序来执行。当然,在一开始,数据中心管理者需要花费时间和精力去创建、记录和维护这些流程和程序,建立程序库并对员工进行培训和学习,这样可以有效避免因操作不当导致的网络问题。2.上岗前的专业知识培训数据中心人员应了解机电系统的基本知识,数据中心系统之间的相互关系,以及如何解决此类环境中可能出现的常见问题。此外,工作人员应具备良好的解释和分析解决问题的能力。为建立一致的知识库,服务提供商还应定期培训其员工。McClary指出,许多数据中心设施运营商只提供短期的在职培训,但不一定是长期的。培训必须是连续的,每个员工都应对自己的教育和能力负责。形成文件的流程和程序为培训工作提供了基础。随着知识范围的不断变化和扩大,额外的培训确保了对每个工人的角色、职责和所需技能的敏锐理解。3.日常检查和演练数据中心工作人员花时间体验和检查数据中心设施中的所有关键系统是至关重要的。这些演习可以与培训工作相结合,以帮助员工识别关键组件和可能出现的任何问题。数据中心经理应该利用他们的检查来制定一些文件化的程序来帮助指导这些工作。这包括演练过程中应检查的项目列表、工作人员应记录的具体参数以及在参数结果中应采取的步骤。演练可以帮助员工识别易于纠正的问题,并防止以后出现更大的问题。数据中心在提供机器租赁服务时,难免会出现机房布线、放服务器、安装系统、分配IP、添加硬盘等人工操作的一些误操作,用户可以监督遇到此类问题时运维工作人员细心,同时能够正确认识此类错误的发生。更高级的镜像和备份功能现在对解决数据丢失问题有一定的作用。总而言之,先进设备没有完善的管理措施,很容易发生事故。只有数据中心的所有管理者都知道自己是谁,知道自己要做什么,才能真正保证数据中心的安全运行。
