当前位置: 首页 > 科技观察

停电是数据中心无法磨灭的痛

时间:2023-03-13 02:46:57 科技观察

电源对于数据中心的重要性就像心脏对于人类一样重要。没有持续供电,数据中心就无法运行。当数据中心内的设备出现自动断电、关机、停电等相关不良现象时,统称为断电故障。停电对数据中心造成的损失会非常严重,数据中心可能直接停止运行,所有应用系统都无法继续运行。例如,2016年6月,大连电信中心机房因市电故障,设备突然断开,造成部分线路短路,变压器损坏跳闸,导致核心设备失效.停电导致大连、旅顺市区移动网络用户手机通话和短信功能无法正常使用;2015年11月,因山西证券数据中心机房停电,股市交易系统中断,导致多名股东无法交易,亏损惨重。严肃的;2012年10月恰逢凡客诚品5周年,机房停电导致凡客诚品出现访问故障,导致傲游、豆荚、新浪邮箱等多项服务中断。此类数据中心停电导致业务中断的案例不胜枚举,还有很多,这里不再一一列举。没有人希望数据中心停电。停电已经成为数据中心的一个严重问题,因为不知道停电会发生在什么时候,会发生在哪些设备上,并且在停电发生之前没有任何预警,这使得数据中心对于停电的问题很无奈。停电已经成为数据中心难以磨灭的痛。面对停电的问题,很多时候都是束手无策。断电不仅会导致正在运行的业务丢失,还会带来很多其他方面的负面影响。首先,停电对电子设备的危害很大。当正在运行的设备突然断电时,设备中的所有电容器都必须放电。如果完全切断电源就可以了。如果频繁开关电源,或者电源质量不好波动较大,这种情况极有可能导致设备内部具有电容特性的设备发生故障,降低设备的使用寿命。设备;其次,断电对电子设备内部的危害很大。使用的内存存储设备受到影响。存储设备正在读写,突然断电。启动,设备出现故障;第三次断电很可能导致应用软件系统运行异常。例如:停电对LINUX系统服务器的危害。LINUX文件系统包括各种具有日志功能的EXT3、REISERFS、JFS等。这些日志文件系统经不起停电的打击。常用的EXT3和REISERFS文件系统,遇到突然断电系统重启时,经常无法自举,需要手动FSCK。ORACLE数据库也有损坏。掉电会导致ORACLE的部分控制文件、REDOLOG、RollbackSegment、数据文件损坏。重新上电后,ORACLE数据库无法正常启动,运行不正常。造成这些应用系统异常的根本原因是这些应用软件在断电时没有及时备份数据。如果设备在发生断电后能延迟工作几分钟,并保持重要数据完好无损,就不会发生这种情况。这种失败。第四次停电只是停电故障的原因之一。在很多情况下,停电并不是因为供电不足造成的。停电的含义要广泛得多。例如,设备故障导致供电线路短路,产生大电流,击穿保险丝盒开关,导致该路供电设备全部断电;电源遇到过压、过温等保护,电源自动进入保护,不再这样也会导致设备掉电;有时设备上一些重要的电压没有产生而导致欠压保护掉电,这通常表现为设备上电后立即被切断,用万用表无法测量相关电压。总之,停电对数据中心及其设备的影响是多方面的,应采取一些保护措施,避免数据中心频繁停电。在很多情况下,数据中心的电源故障大多是由人为操作造成的。有时在电力施工中,误将供电电缆拉断,造成停电。有时在调整设备的供电线路时,不小心接错,导致断路或短路,造成部分设备断电。因此,数据中心的首要任务是管人,制定严格、详细的操作规范,避免低级别的人为断电;数据中心还必须有冗余电源。供电采用冗余电源,因为数据中心所有设备只用一根市电供电。如果电源出现故障,整个数据中心将停止运行。因此,最好引入两种不同的市电电源,并为核心设备配备UPS、电池或后备电源,这样当市电出现故障时,后备电源也能保证数据中心持续运行几个小时,等待市电恢复供电时,将设备电源输入切换到市电。定期检查这些备用电源系统的剩余容量。通常备用电源处于备用状态。掉链子;需要定期对数据中心的供电安全进行评估,全面检查供电的安全性和可靠性,及时发现日常维护中发现不了的问题。同时制定供电应急预案,明确停电时的处理程序、操作人员、操作规程、厂家支持要求等。数据中心内部需要保持良好的温湿度环境,避免电子设备出现静电、腐蚀、过压、过流等故障,导致设备断电。虽然我们无法预测什么时候会停电,但是我们可以提前做好一些保护工作,避免停电。在停电的情况下,我们也有完善的应急预案,确保数据中心业务不会受到停电的影响。停电是数据中心无法磨灭的痛,给数据中心上了很多惨痛的教训。经过上面的描述可以看出,虽然停电故障很可怕,但是通过制定一些保护方案,可以大大降低停电的频率。即便发生,也有提前部署冗余供电系统,避免数据中心业务受损。