数据中心是一个复杂的组织,系统众多。要使数据中心高效、安全地运行,需要一支技术实力雄厚的运维团队。虽然近年来一直有人提出建设无人值守的数据中心和自动化运维系统,以降低人力成本,尝试提高个人运维效率。在实际应用中,仍然不完全可行。.一个没有人参与运维管理的数据中心,会乱成一锅粥,根本无法形成战斗力。降低人力成本是数据中心的长期目标,但数据中心仍需要大量的技术人才来形成人机交互的融合。而且,在数据中心建设的TIA-942标准中,对人员配置也有明确规定。不同级别的数据中心需要不同数量的人员来匹配。级别越高,对人员数量和技能等级的要求就越高。如图1所示,TIA-942将数据中心分为四个等级,其中T1等级最低,T4等级最高。中心无业务中断,对运维要求非常高。专业技术人员必须24小时在现场,出现问题及时排除,或立即切换到备份系统,不影响业务。图1:不同级别数据中心的人员配置需求在人员组织架构设计上,数据中心可以分为三大块,每个部分又可以进一步细分,构建完整的运维体系,一般是案例,如图2所示:图2:数据中心运维组织架构图根据图2所列的数据中心运维组织架构,显然13~15人是最基本的配置大型数据中心。如果考虑7*24小时轮换值班(个人岗位),人员编制至少要有25人。像保安、保洁人员,一个庞大的数据中心,部署一两个人肯定是不够的。一个大型数据中心的面积是几万平方米。这么大的建筑面积,清洁工作至少需要十几个人。还有IT系统部分。网络、服务器和存储是相对不太相关的专业技术。一个人不可能全部掌握,所以需要在这些方面储备一些人才。全国各地也建有许多数据中心。如果把图2所示的运维机构建在全国各地的数据中心,人力成本就太高了,所以很多数据中心也会把IT系统部门的专业技术人员都集中在总部办公,对各地数据中心实施远程管理。在数据中心机房现场,只需要留下少量的现场人员。这些人员只需要能够拔插网线、重启和安装设备。日常监控主要由这些现场人员完成。通知IT系统部人员上来定位分析。基础设施部门和行政部门与数据中心机房关系密切,需要在每个数据中心建立一套。事实上,现在绝大多数数据中心都是租用运营商或专业数据中心服务商提供的机房,供电、电力、空调、监控、安保、保洁等都由运营商来完成。提供商提供租金就足够了,可以节省大量的人力成本,而且数据中心的运维只需要一个IT系统部门。像腾讯、阿里这样的互联网巨头如果独立建设自己的数据中心,需要有基础设施部门和行政管理部门。当然,如果你想省事,也可以将这两部分的运维外包出去。专业的服务商可以做,比自己维护两个部门便宜很多。除了设计组织架构外,还需要制定详细的部门工作内容,每个岗位的工作要求,明确具体工作岗位。部门经理可以根据每个人的工作表现进行考核和加薪。需要建立科学合理的人事管理生命周期,包括选拔、聘用、培训、考核、解聘,通过合理的组织结构设计和人员分工,最大限度地发挥个人主观能动性,为组织目标做出贡献等。这些管理受到各种流程的制约,大家按照流程来处理和工作。流程是数据中心运维架构质量的保证。流程的目的是保证运维架构能够按质按量运行。人员是数据中心运维的基础和核心。良好的数据中心运维组织架构需要合适的技术和管理人员。人是数据中心运营中最关键的因素。有一句成语说得好:“成则萧何,败则萧何”。要知道数据中心80%的故障都是人为故障,而人是处理这些故障的关键环节,需要大量的人力来保证数据中心的稳定运行。因此,人与数据中心的关系是非常微妙的。数据中心不能完全依赖人,数据中心也不能完全脱离人的管理。必须在两者之间取得平衡。人为干预太多容易导致人为故障,人为干预太少容易导致数据中心系统出现偏差。也许有些设备被烧毁了,人们还不知道。这样的数据中心运维就会失败。
