当前位置: 首页 > 科技观察

普罗米修斯最香?大型银行使用Zabbix进行监控和杠杆!_0

时间:2023-03-22 00:12:58 科技观察

简介随着银行G业务的快速发展,业务系统规模日益扩大,监控管理成本也越来越高。现有的监测手段已经不能满足监测和管理的需要。因此,G行推出了ZABBIX开源监控项目。通过本项目的建设,在节约监控管理成本的同时,完善了国产软件和开源软件的监控方式,提高了G行的自动化监控能力和自主可控能力。一、ZABBIX开源监控建设背景很多行业和单位使用商业监控软件来实现其信息系统的日常运行监控,但是商业监控软件在管理上存在很多痛点。图1监控管理痛点为了解决传统监控管理在日常运维中存在的痛点和问题,G银行对几款开源监控软件的监控能力、灵活性、兼容性、易用性进行了比较。类型,最终选择了zabbix作为未来业界主要的监控工具。ZABBIX是一款功能强大的开源监控软件。操作简单,适用于多种平台。可支持虚拟化、云环境等多种场景的监控,提供开放通??用的API接口。它广泛应用于各个行业。广泛使用。支持多平台企业级分布式开源监控;可实现复杂、多条件报警;提供多种API接口,支持二次开发;自动发现和低级发现功能;它得到了丰富的社区资源的支持。图2ZABBIX支持多种监控场景2.G线ZABBIX开源监控项目经过前期调研和选型,选择了ZABBIX作为业界主要的监控工具。从开源软件监控和开发测试环境监控开始,逐步推进到通用,全面覆盖分支机构生产环境中的所有主机和所有监控指标,顺利替代行业内传统商业监控软件,以及在此基础上逐步实现平台化、自动化监控和统一管理。下面从监控部署架构、监控采集方式、监控告警策略、监控自动化四个方面介绍G银行在ZABBIX开源监控中的实践。1、监控部署架构按照总、分、生产、测试??的划分采用多套ZABBIX软件,采用Server-Proxy-Agent分布式监控架构,有效降低服务器端采集压力;同时,根据不同环境的特点采用不同的环境。监控方案:图3总分公司生产测试环境监控架构1)开发测试环境监控策略开发测试验证环境,结合开发测试环境的特点(被监控主机生命周期短),使用自动发现+自动注册的监控方式进行自动监控。2)总公司的生产按照监控对象的类型进行分组,每组Proxy承担不同的监控职责,实现监控压力的平衡,准确定位不同组件的作用范围。3)分支生产ZABBIXServer部署在总公司集中统一管理。按区域划分,每个分支部署一个独立的代理,代理的每个模块部署在一个容器中,调度灵活,易于迁移和扩展。Proxy和Server之间的数据采用压缩方式,加密传输,保证网络无压力和数据安全。2、全面支持开源/新创依托ZABBIX的开源属性,全面支持对开源软件和新创产品在行业内的监控管理,推进自主可控的监控,具体包括:操作系统:中标麒麟LINUX、银河麒麟ARM等;数据库:大梦、MySQL、KINGBASE等;中间件:Baoland、NGINX、ROCKETMQ等;大数据:KAFKA、SPARK、ES等。3、监控采集方式ZABBIX支持多种采集方式,可根据不同的监控项目自由定制:使用Agent或SSH、WMI监控服务器软件的运行状态。使用DBforBix插件、JDBC协议或Agent来监控数据库。使用JMX(javamanagementextension),T3协议来监控java类服务。使用ping和Web检测来监控WEB应用程序。利用日志日志主动监控,及时发现应用异常。使用system.run调度现有的监控脚本和工具,保证现有监控工具的平滑切换。利用关联项和预处理函数对监控结果进行分析拆分,实现一次采集,多次使用,提高监控效率,降低被监控端的性能压力。图4异构对象综合监控4.监控报警策略ZABBIX支持通过邮件、短信、微信、接口等方式发送给指定人员,通过调用ZabbixAPI,读取报警数据,对报警数据进行分析、丰富、处理检修期间,将告警数据推送至统一的监控管理平台,进行集中展示和告警。5、监控自动化G线数据中心的管理已经标准化,标准化是实现监控自动化的前提。ZABBIXAgent通过一键掌握、SMDB分发或脚本自动部署。Agent开机自动启动,状态检测,支持远程重启和停用。LLD自动发现可以自动发现系统分区和网卡,也可以自定义发现主机上的数据库或中间件的多个实例。自动注册,自动监控新设备,创建主机,关联模板,开启监控。通过API批量添加监控主机,关联监控模板。统一的监控模板,结合组合告警触发器,满足多种监控场景。简单的故障自愈功能,可以对告警进行分级分类,结合脚本修复一些低级别的告警,并自动进行相应的操作(如指定文件清理、服务拉起等),保证系统可用性.3.ZABBIX开源监控阶段性成果经过四期的持续建设,G行基本完成了对商业软件的监控覆盖,在开源软件监控能力、监控自助服务能力等方面取得了长足进步,丰富了完善监控手段,在总分公司生产系统监控管理中发挥重要作用。ZABBIX已完成开发测试环境、总公司、39家分公司监控全覆盖,利用ZABBIX系统对生产环境HPUX系统进行细粒度监控,实现替代商业监控软件的能力,完成同时对39家网点进行全覆盖,并在营业中完成监控软件的更换。图5ZABBIX分阶段构建结果IV.总结与展望数字银行离不开强大的技术支撑。我们将继续紧跟新技术发展步伐,夯实基础设施、技术架构、新技术应用等多个领域的技术支撑能力,为众多新技术的引进和应用提供全方位的监测服务。新架构。监控思维转型数字化思维要求运维人员树立数据意识,以业务价值为导向,以数据服务为目标,实现监控的数字化转型。监控智能依赖于大数据技术。通过海量数据和机器算法,实现告警根因分析、动态基线、自动预测等智能场景的监控应用。技术创新保持技术创新能力,运用更多新技术、新架构,帮助我们更便捷、更高效地应对数字化转型中遇到的各种问题。监控管理+服务强化监控标准化管控能力,以监控标准化为标杆,进一步优化自助式、自助式运维监控模式,提高监控服务覆盖率。

猜你喜欢