当前位置: 首页 > 科技观察

数据中心UPS供电系统运维中常见的人为故障类型

时间:2023-03-20 21:49:59 科技观察

数据中心供电系统的可靠性至关重要。可以想象,无论IT设备多么精良,系统功能多么优越,可靠性多么高,一旦停电,再好的系统也无法运行。因此,设备在运行过程中的维护保养的重要性不容忽视。可见,维修人员肩上的担子是很重的。运维任务及尚未解决的问题为保证供电系统可靠运行,多地制定了多项良策。但即使这样也有很多漏洞。设备出厂后的可靠性已经确定。比如一些先天性的缺陷,比如有的电源输出隔离变压器绕组电缆用铝漆包线代替铜漆包线。满负荷运行时十有八九会出事故……但由于设备本身统计显示,只有不到30%的故障是质量问题引起的,而70%的故障来自后天.即人为故障,表现为:1、选型不当造成的故障(1)基本概念不清,容易被厂家误导。例如某高速公路招标UPS,招标文件要求UPS具有在一两相断开后电池不放电的情况下继续供电的能力。因为有些厂家宣传他的UPS的电池在输入一相断掉后不会放电,UPS还有50%的供电能力;两相输入断路后,电池仍不放电,UPS仍有25%的供电能力,延长电池寿命。使用寿命。用户觉得这个性能不错,稍加思考就不难发现它的缺点:要想享受它的优点,就必须购买4倍负载容量的UPS,否则当前负载不会一相断电后仍能承载电流负载。话又说回来,万一UPS把输入开关后面的两条线断了怎么办?该不该修?什么时候修好?是否应该在完全停电后进行维修?如果用户真的按照负载的实际容量来购买这样的UPS,这是一个巨大的隐患,是运维无法解决的。(二)不便说明的原因。例如,一些用户从上个世纪开始就一直在使用某个品牌的机器。当时,由于客观原因,尽管输入功率因数低、效率低、体积大、功耗大、价格高,但无法解决,也不方便。现在已经问世了比原来的模型好得多的新模型。例如,新型高频机结构UPS与原有工频机结构UPS相比,每年每百度电可节电5万度电,而这几兆瓦容量的大型机房可节电数百万度电。每年用电。但出于某种原因,不选择节能设备并在招标文件中仍然包含该耗能设备是不安全的。这样做是不安全的,而且那种机器的结构特点也包含在招标文件中。这不仅增加了空调设备的投资和占地面积,也无疑为以后的运行埋下了隐患。这又是运维无法解决的问题。(3)追求低价。一些用户认为所有的UPS都一样,所以追求低价,导致出现故障。比如某高速公路指挥部贪图便宜,第一天装机,第二天就起火了;某寿险公司低价采购的一台机器,不到半年就因为UPS故障,几乎烧毁了IT设备的所有输入电路,导致系统瘫痪;再比如一个兆瓦级数据中心,拥有多个UPS并联。安装几个月内,所有UPS因其中一台UPS中的逆变功率管击穿而跳闸...2.使用环境不当造成的故障故障未按环境要求放置机器于说明书,有的甚至把UPS放在随便经过的楼道,或者滴水的地下室。比如几台200kVA的UPS放在一个平房里,屋顶只有一层预制板,空调也只有两台5P的舒适型空调。又比如,玻璃厂居然把UPS放在粉末飞扬的厂房里,等等。导致频繁失败。3、系统不健全引起的故障如部分值班人员随意将电炉、电饭煲、吸尘器接入UPS,导致过载跳闸;一些值班人员的食物引来老鼠进入机器,引起了火灾……例如,在某火车站售票系统中,前台检票人员因移动机器位置,断开了UPS外接电池组,事后未向迟到人员说明,导致同时停电市电和UPS...5.故障经验经验是不可或缺的,也是一笔不可多得的财富。但经验有其相对性,即在某台UPS上获得的经验未必完全适用于另一台UPS,否则会导致故障。某电信局在未看说明书的情况下,用同样的方法启动了另一品牌的机器,导致逆变器烧毁。6、被忽视的故障有些元器件在运行过程中可能会出现老化或早期失效,如果不及时发现就会导致故障。这些在自动监控中是找不到的。例如,因老化而开始弯曲的保险丝、电池结构螺丝松动、电池长期放电后电池外壳出现微小裂纹等。7、仓促上阵造成的故障。维修保养不可操之过急,做之前一定要深思熟虑。某公司的工程师想要检修用户正在运行的UPS。按照规定,检修前必须将UPS连同维修旁路开关一起撤下。但按照程序,必须先启动自动旁路,然后再闭合检修旁路开关。可能是项目有其他急事要办,进入机房后不加考虑就关闭了检修旁路开关,导致逆变功率管爆炸。8、维护不当造成的二次故障,UPS的定期维护是必要的,但要有一套严格的管理程序。那些不负责任,不按规定要求进行定期或不定期维护保养的,是造成机器故障的重要原因。此外,在维修时也会造成故障。例如,用万用表表笔测量电路板电位时,表笔将两点短路而导致故障。当用户对电池放电时,他将电池从UPS中取出,放电后将电池重新连接到UPS,导致电流爆炸。又如一位工程师在更换离心风机时,不小心将活动扳手滑落,撞到控制板。他当时不在乎。机房照例停机检修,检修后无法开机。经检查,发现有元件电压击穿。回顾维修过程,发现控制板用塑料牙刷扫过灰尘。塑料可以在干燥设备的表面产生数千伏的摩擦静电。由于机器中的小信号电路中使用了一些MOS器件,这些器件的耐压很低,最怕静电。测量普通塑料袋后,用电路板摩擦可产生3000V的静电电压。因此,在检查这些电路板时,最好在手腕上戴一个接地环。10、过度自信造成的故障做事自信是成功的基础,但过度自信有时也会出错。比如某国际银行UPS运行8年后要更新设备,厂家也多次提醒。由于UPS在过去8年几乎没有出现过问题,用户负责人多次回答“不需要更新”。结果几个月后,UPS因老化故障停止供电两小时,导致全球业务中断两小时,损失惨重。根据国际统计,5年标称使用寿命最多不超过3年。在平时不维修的情况下,应在两年内更换。某机场候机厅的电池原装4小时,3年后没有更换。外部电网停电,UPS后备时间只有4小时。因停电造成损失……类似的人为故障还有很多,就不一一列举了。例子。归根结底,动力系统的选型是第一关,这一关处理不好,先埋下隐患的种子。电力系统的连接是第二道关卡。有了好的设备,如果没有好的连接方案,也会埋下隐患。某电视台因为连线方案被厂家误导。十几个方案供电的UPS故障接连不断,其中绝大部分是意外事故。连续数年如此,让维修人员忧心忡忡。连接方案是一个项目,不是维护人员能控制的。无奈,工厂工程师不得不在重大活动和节日期间值班。这有什么用?厂商的工程师只能给用户心理安慰。

猜你喜欢