当前位置: 首页 > 科技观察

WOT2016吴兆松:未来Zabbix监控自动化将如何发展

时间:2023-03-12 21:05:32 科技观察

“运筹帷幄之中,决胜千里。”在IT运维中,监控占据着非常重要的位置。按比例来说,30%一点也不算多。对于IT运维工程师来说,构建一个真正可用的监控告警系统是一项艰巨的任务。在监控系统的开源软件中,可供选择的工具有很多,但是真正适合自己需求,真正能够解决自己业务问题的监控系统软件却凤毛麟角。  记者特地采访了【WOT2016互联网运维开发者峰会】特邀讲师、OneOaaS技术合伙人吴兆松,他将与大家分享Zabbix监控自动化是如何发展的,以及优秀运维工程师需要具备的特质。在运维生涯中,监控系统使用过Cacti、Nagios,以及公司自研的监控报警系统。直到接触到Zabbix,他才发现这个灵活而强大的自动化监控工具正是他要找的东西。讲师介绍了OneOaaS技术合伙人吴兆松  吴兆松,离职创业前曾在饿了么工作。目前就职于OneOaaS,作为公司技术合伙人,主要从事运维工具开发、Zabbix监控服务及二次开发。OneOaaS是一家集运维工具开发、监控服务、运维架构咨询为一体的运维服务公司。也是Zabbix在中国的官方合作伙伴。  1。你在饿了么的工作经历对你现在的创业有影响吗?有什么创业经验分享给想创业的朋友?  饿了么是一家非常重视技术的公司。员工都很年轻,是一群有想法、有追求的年轻人。因此,我很高兴能与这么多充满激情和创造力的同事一起工作。饿了么的专注、效率和执行力是有目共睹的,这些对我影响很大。  创业初期,我还是个“小学生”,要向更多前辈学习。给第一次创业的朋友一个小小的建议,也是我自己的感受:创业之前,一定要想好自己所拥有的资源,以及所选择的方向的发展前景。如果这两点都得到了证实,那么你就要非常专注,为家人、伴侣和***的生活勇敢地战斗。  2。您在工作中使用的Zabbix监控自动化在哪个阶段?您对其未来的发展有何期待?  Zabbix是一家提供基于web界面级开源解决方案的分布式系统监控和网络监控功能的企业。可以监控各种网络参数,保证服务器系统的安全运行,并提供软通知机制,让系统管理员快速定位/解决各种问题。是企业自动化运维监控的利器。Zabbix灵活的设计为用户提供了简单易用的二次开发接口,让用户不仅可以使用Zabbix自身提供的功能,还可以自定义更多的监控项功能,从硬件监控,到操作系统,再到服务流程和网络设备。  目前我们为客户提供Zabbix监控咨询架构及设计实施,规模或大或小,多则上千台服务器,多则上百台服务器。环境包括物理机、网络设备、虚拟化、存储和云环境,如AWS和阿里云。甚至有些客户的监控点物理分布在全球各地,网络环境造成的监控波动也比较严重。我们涉及的监控需求比较复杂。  就监控系统自动化运维的发展阶段而言,我们可以从几个方面来理解。  (1)设备添加自动化是指监控系统可以通过主动上报、被动扫描等一定的规则自动添加监控。  (2)添加监控指标的自动化。对于发现的设备,添加需要的监控指标,或者根据业务指标,或者根据设备类型指标。  (3)失效监控指标自动清理,失效监控指标到期后自动清理。  (4)监控客户端配置自动化,实现配置管理自动化。  (5)对于故障处理的自动化,在故障发生后,需要能够实现故障自愈,自动修复。  在实现自动化的过程中,需要将监控系统和资产管理系统(CMDB)进行有效结合。资产管理的重要性相信大家都深有体会。作为线上、线下、发布、维护等所有资产信息的唯一入口,需要准确的资产信息。监控系统与资产管理系统有机结合,做到无误报、无漏报、无错监控项,同时发现与资产和监控不符的记录。  对于应用监控,由于环境多样,复杂度高,需要监控系统能够自动发现监控指标,自动配置监控指标项,自动配置告警阈值,需要告警聚合和合并等,比如对于周期性故障,它可以自行修复。  对于未来的发展,希望Zabbix在监控可视化方面能有更好的展示效果,比如自动拓扑生成,实现类似zatree、graphtree的树状图形展示功能,以及更方便的报表分析功能,可以提供链功能等  3。在日常工作中,您推荐哪些软件和开源工具?每个人都提供了帮助。  (1)配置管理开源工具,我推荐ansible和saltstack。Ansible基于ssh协议,没有代理模式。方便快捷,适用于机器初始化、代码发布、集中管理配置等场景。Saltstack是一个socket通信协议,执行效率高,功能模块全面,社区响应快,文档丰富。在大多数情况下,两者可以一起使用。  (2)API离线文档神器推荐Mac下的dash和Windows下的zeal,收集了100多种API离线文档,方便离线查找。  (3)监控系统,我推荐Zabbix,Open-falcon。Open-falcon是一颗冉冉升起的新星。吸收了opentsdb、Zabbix等监控工具的一些长处,维护起来非常方便。它的缺点是目前支持的监控协议种类较少。但一般来说,中大型互联网公司完全可以满足其需求,因为监控对象相对固定。  4。你认为优秀的运维工程师是什么样的?  我认为一个优秀的运维工程师应该具备以下几个特点。相信凭借这些品质,无论在哪里工作,都会很受欢迎。  (1)有一定的视野。只有掌握好业务和技术的人,才能让技术为业务服务。  (2)具有良好的学习能力。能快速掌握新技术,为业务服务。  (3)良好的沟通能力。在运维工作中,工程师经常需要跨部门沟通,与业务上下游沟通,与部门同事、领导沟通。这就需要积极主动地推进工作。  (4)良好的团队合作能力。  (5)掌握一门编程语言,如Python、Perl等,有编码能力的运维工程师工作起来会更加得心应手,因为虽然开源工具很多,但总会有新的需求和需求开源工具无法满足的场景。因此,掌握编码是每个运维工程师的必备技能。  (6)文档能力也是不可或缺的。  5.4月在北京举办的WOT互联网运维与开发者峰会,您将分享哪些内容?  本次峰会主要分享Zabbix监控运维自动化的相关知识点。比如运维基础设施监控怎么做,业务监控怎么做,监控自动化怎么实现,报警涉及到的难点的解决方法,分享我们Zabbix二次开发的工具,等等,总的来说干货还是挺多的,值得期待!