当前位置: 首页 > 科技观察

如果服务器出现故障怎么办?七步SNMP报警

时间:2023-03-19 00:58:21 科技观察

大家一定有过手机、电脑等电子设备出现问题的经历。就像手机和电脑一样,服务器在运行过程中也会出现故障。作为承载企业各项业务的平台,服务器故障的影响不小。严重时,可能危及企业发展。如果不及时发现故障,企业将遭受更大的损失。经常有人问如何快速发现服务器挂了。目前有两种主要的解决方案。一是通过集中管理平台对大量设备进行管理,定期检查,发现问题及时处理;另一种是一旦服务器出现问题就发送事件通知,然后管理员根据通知位置解决问题。可以看出,在第二种方式下,管理员只需要关注有问题的设备,不仅避免了很多重复的设备巡检工作,也有助于及时处理问题,比如SNMP警报。SNMP告警SNMP(SimpleNetworkManagementProtocol),即简单网络管理协议,是一种可用于网络管理的应用层协议。通过SNMP,管理员可以进行信息查询、设置、接收告警等,及时发现网络设备存在的问题。当设备状态发生变化(如电源故障、硬盘拆卸、服务器重启或停机等)时,SNMP会向管理设备发送Trap报文,实现事件通知、告警等功能。这样,SNMPAgent主动将信息通知管理设备,使得管理设备不需要定期检查大量设备,只要有问题就可以收到信息。为了接收SNMPAgent发送的通知,管理端需要开启Trap接收机制——通常使用UDP162端口。当接收到Agent发送的信息时,接收端的控制台会显示该事件,并显示相关的描述该事件的表达式。.目前SNMP有v1、v2和v3版本,其中v3版本可以实现加密和认证,比前两个版本更加安全。目前,大多数设备都支持该版本,包括DellEMC服务器。为了及时发现服务器故障,需要在服务器上配置SNMP。下面具体说明如何在服务器上设置SNMPTrap告警,以及配置管理终端接收信息。1.由于SNMPv3协议需要支持认证和加密,在iDRACWebUI上,首先要设置用户支持的协议类型和认证加密类型。在iDRAC设置中找到用户配置。编辑本地用户后,需要在高级设置的SNMPv3Settings中勾选v3协议。默认为禁用。这里需要选择Enabled来为该用户启用SNMPv3支持。此外,身份验证和加密类型需要设备支持。有“认证+加密”、“认证+不加密”、“不认证+不加密”几种选择。这里我们自己测试的话,认证加密类型可以是none。2.其次,在配置的系统设置中选择报警配置选项。为了发送告警信息,需要在这里将默认的Disabled选项调整为Enabled。3、对于告警内容,PowerEdge服务器支持多种告警方式,包括Email、SNMPTrap、ipmi等,这里要实现trap功能,需要勾选SNMPTrap类别。至于告警级别,也包括“通知”、“警告”、“严重”三个级别,我们可以根据不同的类别进行设置。关于类别过滤,我们可以在AlertsandRemoteSystemLogConfiguration中执行操作:SystemHealth-SystemHealth类别代表系统机箱内所有与硬件相关的警报(示例包括温度故障、电压故障、设备错误)。存储健康——存储健康类别表示与存储子系统相关的警报(示例包括控制器错误、物理磁盘错误、虚拟磁盘错误)。配置-指示与硬件、固件和软件配置更改相关的警报的配置类别(示例包括添加/删除的PCI-E卡、更改的RAID配置和更改的iDRAC许可证)。审计——表示审计日志的审计类别(示例包括用户登录/注销信息、密码验证失败、会话信息、电源状态)。更新-更新类别表示由于固件/驱动程序升级/降级而生成的警报。4.在SNMP陷阱格式部分,选择发送陷阱的版本。通常支持SNMPv1、SNMPv2或SNMPv3。为了实现SNMPv3功能,您需要选择SNMPv3,然后单击Apply。SNMP端口号默认为162。社区(CommunityString)被v1和v2使用(如图),其实相当于一个密码。必要时可以设置,但SNMPv3协议不需要。5.在SNMPTraps设置中,勾选State以启用警报目标填写IPv4地址、IPv6地址或完全限定域名(FQDN)。目前最多可以指定八个目标地址;DestinationAddress(添加的发送目标IP地址),这里的地址为管理设备的地址,如网管平台或MibBrowser客户端的地址;至于SNMPv3Users,只有在上一步Trapformat中选择了v3后,才能在这里选择用户。6、服务器设置完成后,还需要设置管理端,管理端可以通过MibBrowser接收服务器发送的Trap信息。MibBrowser界面如下图所示,通常包括Mib库相关内容和告警信息查看。可以在管理终端的设置中添加用户。该用户应与PowerEdge服务器上设置的用户相对应。这里首先需要设置SNMP版本为v3,然后添加参数信息。选择v3后点击Add添加用户信息——添加目标主机的IP地址和端口。当需要从服务器获取或设置信息时,管理终端会与服务器上SNMPAgent的161端口进行通信。这里的认证和加密协议要和服务器端之前的设置保持一致。7、设置完成后,打开TrapViewer即可接收报警信息。服务器状态发生变化后,可以看到接收端收到了一个Trap信息。至此,服务器上的SNMPTrap告警设置就完成了。由此可见,通过SNMPTrap的简单设置,用户可以轻松实现大规模的设备管理操作,而且相对于人工从设备中寻找信息,被动接收告警减少了很多工作量,保证了问题的解决。及时发现,将损失降到最低。