近年来,数据中心单机柜的功率密度呈上升趋势。根据ColocationAmerica的数据,单机柜的功率密度从2008年的6kW线性上升到2016年的12kW。2020年单机柜功率密度可能达到16.5kW。在个别改造案例中,单个机柜机架的功率密度高达43kW。高功率密度机柜的设想,对数据中心的制冷系统提出了前所未有的高要求。冬季水冷系统采用冷却塔和板式换热器,利用室外自然冷源进行降温。年能效比比风冷空调更有优势,被越来越多的大型数据中心使用。图1典型的数据中心水冷系统典型的数据中心水系统通常由冷冻水和冷却水系统组成,管道较长,管道附件较多,如法兰、阀门、过滤器等。系统故障率相应增加。面对随时可能发生的故障,水系统备件可以说是抢修的前提。备品备件是指为保证系统正常运行和设备维修需要而预留、存放在仓库中的用于维护系统和设备的可更换单元。1.无用备件存放不同的企业需要不同类型的备件。企业需要根据现场实际情况,制定生产、订货、供应、仓储等备件管理计划。针对数据中心7X24小时稳定运行的需求,故障处理必须及时有效,备件具有品种多、数量大的特点。一些大型数据中心的水冷系统管径超过DN500,管路配件备件不常用,体积和重量都比较大。备件不会在现场储存。但值得注意的是,一旦这些无法使用的备件出现故障,很可能会直接影响到数据中心水系统的运行。如果现场没有库存,备件供应周期长,数据中心将直接面临制冷中断的风险。2、故障修复案例分析(1)故障描述某大型数据中心大楼内装有5台冷水机组。故障前,1#、2#、3#冷水机组正在运行,每台冷水机组的负荷率均在60%以上。2019年8月16日17时10分,1#冷水机冷却水自清洗过滤器漏水。冷却水不足导致冷水机组停机。系统自动切换到4#冷水机。切换后,三台冷水机组的负荷率均在60%以上。但由于5#冷水机压缩机故障,导致1#冷水机无法启动,致使制冷系统无冗余,数据中心运行存在巨大风险。数据中心立即成立了专门的应急抢修小组,力争在最短的时间内完成故障的恢复。(二)故障原因图2自清洗过滤器如图2所示,自清洗过滤器是一种安装在管道中Y型过滤器上的自动清洗排污装置,Y型过滤器的直径是DN350。自清洗过滤器主要由法兰盘、不锈钢内刷(含支架)、滤网、钢刷轴、电机等组成。漏水的原因是自清洗过滤器长期运行,法兰安装孔处的水封被腐蚀。另外,钢刷主轴磨损严重,冷却水从安装孔漏出。备件库虽然备有水封,但自清洗过滤器体积大,故障率低,所以没有备货。由于钢刷轴磨损严重,单纯更换水封不能解决冷却水漏水问题。(3)故障处理方案一:购买钢刷轴进行更换。由于自清洗过滤器为定制设备,主轴为异型件,生产周期至少3-4天,故障接近下班时间。经电话沟通,主轴最快生产时间为次日上午,使冷机系统处于非冗余备份状态至少4-5天。选择一,数据中心将面临前所未有的运营风险。方案二:除冷冻水和冷却水外,用未使用的水系统钢丝刷主轴更换主管。数据中心还安装了水环加热管,目前还没有启用。可用管道上的自清洗过滤器钢刷轴代替。但自清洗过滤器由铸铁制成,自重较大。拆卸电机、法兰和钢刷轴需要2个小时左右,所以拆装需要4个小时左右,而且由于自清洗过滤器比较重,安装过程中容易造成水封变形,可能导致再次漏水。如果修复失败,将延长故障恢复时间。使用选项2,数据中心也将面临长期运营风险。(4)故障分析方案1风险过高,方案2即使使用闲置备件也无法在短时间内完成故障修复。抢修组成员均认为方案一和方案二的效果无法在短时间内达到完成抢修的目的,归纳重点如下:自清洗过滤器的泄漏点为钢刷轴和法兰盘的安装孔;自清洗过滤器的重量体积大是拆装工作耗时长的主要原因;自清洗过滤器利用内部钢刷和排污开关定时启动,达到控制水质的目的。针对以上三个关键点,抢修组提出了几个问题:是否可以在不更换钢刷轴和水封的情况下,完全堵住安装孔,解决漏水问题;更换自清洗过滤器是否可以减少工作量;1#如果自清洗过滤器不起作用,会不会影响系统的水质。针对以上三个问题,抢修小组进行了讨论,最终得到了答案:完全堵住安装孔可以解决漏水问题;减少拆卸法兰盘、钢刷轴、不锈钢内刷(含支架)的工作量;1#冷水机组运行时,可在不影响系统水质的情况下,增加另外两台冷水机组自清洗过滤器的排污量。综上,抢修组得出方案三:拆除1#自清洗过滤器法兰,拆除钢刷轴和不锈钢内刷(含支架),临时用铁板焊接安装孔,然后安装回Y过滤器。(5)故障排除17:10—17:30:抢修组对现场故障进行评估,最终确定方案三;17:30—18:45:抢修组从其他机房调派人员关闭1#自清洗过滤器,完成过滤器前后阀的拆卸;18:45—19:00:抢修队用一小块铁板将安装孔焊死;19:00—19:30:抢修队安装1#自清洗滤板法兰盘。19:30—20:00,抢修组打开1#自清洗过滤器前后阀门注水,观察1#自清洗过滤器前后压力恢复正常,安装孔无渗漏。至此,从制定应急抢修方案到完成故障处理,用时约2小时30分钟。2#、3#、4#冷水机组运行正常,1#冷水机组作为备用机。数据中心大楼恢复N+1备份机制,运行风险消除。3、“非全尺寸”备件管理新思路“非全尺寸”备件的灵感来源于汽车的非全尺寸备胎。(1)非全尺寸备胎的优势作为汽车设计领域的技术难点,备胎槽的尺寸会受到后悬挂结构、排气管布置、油箱位置和上部的综合制约。后备箱的设计。简单来说,非全尺寸备胎的宽度要小很多,后备箱地板下的空间可以压缩,地板上的行李装载空间会更大。同时,鉴于备胎在用车实际使用中的使用率并不高,不少车企通过压缩备胎来换取更大的后备箱收纳空间。(2)“非全尺寸”备件的特点与非全尺寸备胎的原理相似,“非全尺寸”备件的特点鲜明:成本更低:与更换整套自清洗过滤器,铁板焊接法兰成本明显降低;维修时间更短:自清洗过滤器法兰的更换省去了拆卸非活化水系统法兰和钢刷轴的步骤,大大节省了维修时间;占用空间小:可想而知,与整套自清洗过滤器相比,单个法兰盘占用空间明显减少;功能降低:自清洗过滤器在安装了带焊接安装孔的法兰后,不再具有清洗和排污功能。(3)“非全尺寸”备件管理的特点“非全尺寸”备件管理具有以下特点:备件采购成本较低:“非全尺寸”成本”备件较低,有临时抢修的可能,因此在使用“非全尺寸”备件后,可以单独购买“全尺寸”备件,减少了初始采购备件成本;备件库空间进一步压缩:由于“非全尺寸”备件的尺寸优势,数据中心在规划备件时可以压缩“全尺寸”备件的存储空间零件仓库;备件应急响应更加突出:由于“非全尺寸”备件的更换时间更短,抢修工作的及时性更高。4.结语本文从一个数据中水系统故障抢修的案例分析出发,提出了数据中心备件管理的新思路,得出以下结论:采购“非全尺寸”备件降低了备件采购成本,备件库的空间需求提高了抢修的及时性;“非全尺寸”备件仅用于紧急维修。维修完成后,仍需购买“全尺寸”备件进行更换,以保证备件的功能完整性;“非全尺寸”备件管理为各类企业的备件管理提供了新思路。
