1.机房环境1.温度和湿度:最佳工作温度:20-25摄氏度极限工作温度:10-40摄氏度湿度:8-80%(在23摄氏度以下)。2、机房同时要保持服务器清洁。机房应保持服务器清洁。如果空气中灰尘过多,很容易造成资源读写错误,损坏磁盘或磁盘驱动器中的读写磁头。定期使用皮虎和刷子清除服务器上的灰尘。2、电源电压:要求电压稳定,尖峰电压会损坏设备。电压范围:220V+/-10%,即200-240V,50-60Hz。地火三相电,其中零地电压不得超过3.0V。电源连接:使用空气开关或其他符合电流要求的设备与主机电源线连接,以保证计算机系统的可靠运行。使用稳压电源和UPS,冗余电源接入,采用两路独立输入。3、硬件检查检查服务器、磁阵安装、电源线主机接线是否符合要求。服务器状态检查:1.当服务器启动并正常工作时,前面板液晶显示器上不应有任何信息显示。2、当LCD上出现带数字和字母的信息时,表示有硬件告警。您可以通过查询相关机型面板上的报警编号信息,找出相应报警的原因。如果情况严重,必须立即通知服务器厂商进行故障排除。3、当服务器状态灯变为橙色时,表示有硬件告警。此时检查磁柜的电源、接线、硬盘等。如果出现硬件故障,请立即更换并修复。如果查不出具体问题,则需要联系相关厂家进行进一步诊断。4、当硬盘正常工作时,每个硬盘对应的硬盘灯会呈绿色。如果没有读写,绿灯会一直亮着。如果硬盘有读写操作,绿灯会不规律的闪烁。当硬盘损坏或RAID出现问题时,硬盘状态灯会熄灭或闪烁:它会以1到3秒的频率有规律地连续闪烁。4.系统日常维护流程(1)系统启动系统启动的正常顺序如下:首先,给外围设备(磁盘阵列、磁带库等)上电。所有外设开机自检完成后,主机开机正常。主机上电后,按下POWER键开机。(2)系统关闭和服务器系统关闭时,需要确认服务器的服务是否对现网业务有影响。安全关机步骤,执行关机操作。2.3系统和数据备份有效及时的系统备份是系统管理中非常重要的一环。当系统出现故障,尤其是文件系统严重损坏或硬盘损坏时,往往需要使用系统备份来恢复系统。以下情况应进行系统备份:1、全新安装。安装硬件和系统软件后,应进行系统备份。2.软件变更。当系统软件或应用软件发生变化时,应做好系统备份。3.定期备份。定期备份系统,最好每三个月备份一次。2.4系统恢复当系统出现严重故障,一般维护措施无法在短时间内恢复原系统时,经与上级确认后,可恢复最新系统。倒回备份到机器,将系统完全恢复到上次备份时的系统环境,再倒回当天的数据备份到系统。此时,系统可以恢复正常运行。之后,制造商应对整个事件进行全面的分析和审查,以找出故障原因并采取相应措施,防止类似事件再次发生。(三)安全工作规程a.定期进行系统备份。b.当系统发生变化或安装操作系统补丁时,必须进行系统备份。C。当发现硬盘故障时,要注意当天的数据备份。更换硬盘时,请确认当天已完成数据备份。d.更换敏感电子元件时一定要防止静电。e.插拔外围设备时,请关闭外围设备电源。F。删除文件时,请注意当前路径是否正确。G。解压文件时,请注意参数和路径。五、故障分类、故障定位及排除方法根据系统实际运行中遇到的问题,归纳出以下几种常见故障及其定位方法和解决方法。1、硬件故障硬件故障有很多种,对系统的影响也不同。这里根据故障对系统的影响分为两类:致命的硬件故障和只影响功能的硬件故障。硬件分类:其损坏对系统有致命影响(会导致机器停止或无法启动)的硬件包括:主板、CPU、RAID卡、电源模块、风扇、本地硬盘、内存损坏等.这些器件的损坏会导致系统无法完成自检、开机和启动,液晶屏上会出现错误信息,可以根据液晶屏上的错误代码比较错误原因,如果在工作状态下发生这些硬件损坏,系统将暂停或关闭。仅对系统有功能影响(机器不会停机,可以正常启动)的硬件损坏包括:??网卡、有坏块的本地硬盘、显卡和其他外围设备。这些设备的损坏只影响特定的功能,如网络功能、显示功能、访问磁盘阵列等。如果本地硬盘有坏块,则要看坏块中是否包含重要的系统文件。如果不是重要的系统文件,不会影响系统功能,但也建议立即更换硬盘。故障定位与排除:液晶屏上的错误代码根据错误代码判断是什么硬件出现了故障。对于系统来说,原则上需要进行业务切换,在不影响用户使用的情况下,让损坏的服务器下线,然后修复故障机器,恢复系统。2、磁阵故障磁阵引起的故障是目前遇到的频率最高、危害最大的故障。据不完全统计,其故障占故障总数的70%以上。具体可能导致磁阵故障的环节包括:磁阵硬盘、主机上的RAID卡、连接主机的SAS线、硬盘的位置和接线方式、机柜使用的电压和周围磁场、磁阵/硬盘/RAID卡等都可能导致异常。磁阵问题最为复杂。一般有物理损坏和环境原因。这是主要原因,如接线、插盘位置不符合要求,未能及时检查系统告警而导致系统中断。根据经验,无论是什么硬件故障导致故障,系统都会产生告警。如果能及时发现问题并采取措施,如果是硬件故障,可以从状态灯上观察:当单个硬盘出现故障或不使用时,面板上的硬盘状态灯不会亮灯亮,阵列状态灯黄灯亮。服务器磁阵配置的RAID卡一般带有充电电池,以备突然断电时使用。
