当前位置: 首页 > 科技观察

开源还是商业?十大云运维监控工具评测告诉你答案

时间:2023-03-20 11:17:47 科技观察

随着云计算和互联网的快速发展,大量的应用需要跨越不同的网络终端,广泛接入第三方服务(如如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验要求IT运维管理者时刻保证核心服务的稳定性和可用性,企业运维中的痛点和难点也亟待解决。  1。面向业务的运维不仅关心单点IT资源的运行状态,更关心整个业务系统的健康状态  2。如果企业大量使用API??和模块化应用,那么要关注各个接口的性能变化和指标  3。对于运维主管和企业管理层来说,监控挂在墙上的大屏幕就显得尤为必要了  4。运维需要每周、每月查看报表趋势分析,但是传统运维工具导出数据比较困难  5.需要快速切换,快速找到故障节点,减少业务中断带来的损失  对比分析各种产品的定位、目标用户和功能特性,希望能帮助运维、开发和创业者找到最合适的运维工具。  1.开源运维监控产品  (一)Zabbix  推荐星级:★★★★★  Zabbix是一个基于web的界面,提供分布式系统监控和网络监控功能企业级开源运维平台,也是国内互联网用户使用最广泛的监控软件。CloudWisdom遇到的超过85%的用户都在使用Zabbix作为监控解决方案。  易上手、易用、强大、开源、免费是云智对Zabbix最直观的评价。Zabbix易于管理和配置,可以生成漂亮的数据图。其自动发现功能大大降低了日常管理的工作量。丰富的数据采集方式和API接口,让用户可以灵活采集数据,分布式系统架构支持监控。更多设备。理论上,通过Zabbix提供的插件架构,可以满足企业的任何需求。  用户群体:85%以上的泛互联网企业。  优点:  1.支持多平台的企业级分布式开源监控软件。  2.安装部署简单,灵活集成各种数据采集插件。  3.功能强大,可实现复杂、多条件报警。  4.自带绘图功能,可以将获取的数据绘制成图形。  5.提供多种API接口,支持调用脚本。  6.当出现问题时,可以远程自动执行命令(需要为agent设置执行权限)。  缺点:  1.批量修改项目不方便。  2.社区虽然成熟,但中文资料相对较少,服务支持有限。  3、上手容易,可以实现基础监控,但深入需求需要非常熟悉Zabbix,进行大量的二次定制开发,难度较大。  4.系统层面的报警设置比较多。如果不过滤,会有很多报警邮件;并且需要自己设置自定义项目告警,过程繁琐。  5.缺少数据汇总功能,如果不能查看一组服务器的平均值,需要二次开发。  6.数据报表需要特殊的二次开发定义。(2)Nagios  推荐星级:★★★★☆  Nagios是一个开源的企业级监控系统,可以实现对系统CPU、磁盘、网络等参数以及SMTP的基本系统监控,POP3、HTTP、NNTP等多种基本服务类型。此外,用户还可以通过安装插件和编写监控脚本,实现应用监控,对大量的监控主机和多个对象部署分层监控架构。  Nagios最大的特点就是强大的管理中心。虽然它的功能是监控服务和主机,但是Nagios本身并不包含这部分功能代码。所有的监控和告警功能均由相关插件完成。  用户群:适用于IT环境复杂的企业  优点:  1.错误的服务器、应用程序和设备将自动重启,并自动滚动日志。  2.配置灵活,可以自定义shell脚本,通过分布式监控方式。  3.支持主机冗余监控,多种告警设置。  4.重新加载配置文件的命令不需要干扰Nagios的运行。  缺点:  1.事件控制台的功能很弱,插件的可用性很差。  2.性能、流量等指标处理不当。  3.看不到历史数据,只能看到告警事件,难以追溯故障原因。  4.配置复杂,初学者投入的时间、精力和成本都比较大。#p#  (三)Ganglia  推荐星级:★★★★☆  Ganglia是加州大学伯克利分校发起的开源集群监控项目。它最初设计用于监控数千个网络节点。Ganglia是高性能计算系统下跨平台可扩展的分布式监控系统。它已被广泛移植到各种操作系统和处理器架构中。  用户组:适合大型服务器集群用户。  优点:  1.适用于监控系统性能,通过曲线很容易看到各个节点的工作状态。  2.您可以自定义监控项。监控显示有表格和图片两种,支持手机版。  3.易于部署,分层管理数万台机器,无需逐层添加配置。  缺点:  1.没有内置的消息通知系统。  2、没有告警机制,不能及时报告问题。(4)Zenoss  推荐星级:★★★★☆  ZenossCore是Zenoss的开源版本,商业版是ZenossEnterprise。作为企业级智能监控软件,ZenossCore允许IT管理员依靠单一的Web控制台来监控网络基础设施的状态和健康状况。ZenossCore的强大功能来自深入的库存和配置管理数据库,可发现和管理公司IT环境的各种资产。Zenoss还提供了与CMDB关联的事件和错误管理系统,帮助提高各种事件和提醒的管理效率。  优点:  1.Zenoss的突出特点是它的仪表板,它可以配置许多portlet。  2.每个用户的界面单独管理,自定义仪表板不会影响其他用户。  3.强大的监控功能支持服务器、路由交换机、防火墙、存储、数据库、中间件监控。  4.使用基于HBASE的opentsdb存储任意时间段的数据。  5.将状态监控、性能监控、资源管理和良好的报告机制有机地结合起来。  缺点:  1.资源要求高,即使只管理少数设备,仍然需要消耗大量额外的硬件、内存等资源。  2.对于Windows系统,开源版只提供SNMP,付费版只提供通过WMI检测CPU、Disk、软硬件和性能。  (5)Open-falcon  推荐星级:★★★☆☆  Open-falcon是小米的运维团队,从互联网企业的需求出发,基于多年的运维经验,结合SRE、SA、DEVS使用经验和反馈,开发了一套面向互联网的企业级开源监控产品。  Open-falcon架构  用户群:目前已有数十家企业用户不同程度使用。  优点:  1.自动发现,支持falcon-agent,snmp,用户主动推送,支持用户自定义插件。  2.支持亿级数据采集、告警判断、历史数据存储和周期查询。  3.高效入口,支持策略模板,模板继承覆盖,多种告警方式,支持回调调用。  4.单机支持200万个指标的上报、归档、存储。  5.使用rrdtool的数据归档策略,秒级返回上百个metrics的历史数据。  6.多维数据展示,用户自定义Screen。  7、目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ以及通过各种插件进行交换机监控。  缺点:由于发布时间较短,很多基础服务监控插件(如Tomcat、apache等)暂不支持,很多功能还在完善中。另外,由于缺乏专门的支持,虽然有开放的社区,但解决问题的效率还是比较低的。#p#  二、商业运维监控系统篇  (一)监控宝  推荐星级:★★★★★  监控宝是云智慧为用户提供IT性能监控(IT性能监控)SaaS产品,包括网站监控、服务器监控、中间件监控、数据库监控、应用监控、API监控和页面性能监控等功能。包括免费版、畅享版和企业版,目前约有40万用户。监控宝APP也是国内唯一提供移动监控服务的产品。  用户群体:数十万用户,涵盖电子商务、移动互联网、广告传媒、网络游戏、教育医疗等多个行业,超过30%的金锁、平安、建行信用卡中心、春雨医生、畅游、国家电网、中国电信、滴滴打车、春秋航空、凤凰网等中国互联网百强企业都在使用监控宝。  优点:  1.作为国内最早提供SaaS化服务的网络监控平台,监控宝不仅为初级用户提供免费的标准服务,企业用户也可以按需购买所需的监控告警资源。最大程度降低企业运维成本。  2.监控宝通过全球300多个分布式监控节点主动监控分析网络的稳定性和可用性,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等协议,衡量效果CDN和DNS状态,分析全网和区域的性能趋势。  3、实时抓取深度服务器性能指标,支持Linux/Unix/Windows系统和云平台,支持CPU使用率、CPU平均负载、内存使用率、磁盘IO、磁盘空间使用率、网络流量和系统进程等物理统计统计指标及30多种应用服务,一键开启云主机监控端,无需复杂配置。对于应用服务的监控,监控宝已经支持常见的应用类型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache、Redis。存储层监控支持Hadoop、MySQL、MongoDB、SQLServer、Oracle的健康状态和性能监控。.  4.监控宝是目前国内唯一支持API监控的网络监控产品。通过API接口调用模拟用户的使用过程,支持get、post、put、delete、head、options六种请求方式的实时监控;支持JSON、XML、Text、ResponseStatus校验和Postman脚本导入。  5.Docker监控也是监控宝的专属功能,可以实时监控Docker容器的CPU、内存、网络流量和Swap状态,让开发者和运维人员可以清晰的掌握资源消耗情况使用Docker时的状态。  6.Monitor提供页面性能管理,根据国际标准制定页面性能指标,识别加载元素的状态和正确性,分析全网所有用户的加载响应时间,准确定位问题元素和优化建议。  7.及时有效的告警通知对于运维来说非常重要。监控宝可根据SLA设置报警阈值,第一时间发送报警通知。监控宝涵盖了最全面的告警通知方式:邮件、短信、电话语音、URL回调通知、App推送等。另外,监控宝提供分级告警通知,可以根据告警的不同级别向不同人员推送不同的告警活动,支持企业分级管理!  8.监控宝目前开源其SmartAgent,用户可以根据业务需求定制开发Agent,同时保证用户的数据安全。  9.监控宝提供私有化部署解决方案,满足政府、企业、金融行业专网监控需求。  10.来自Compuware、CA、IBM等企业的资深IT服务专家,5年以上本地化企业级SaaS服务经验,100多人的技术服务团队,为用户提供最好的服务保障。  (2)360网站服务监控  推荐星级:★★☆☆☆  360网站服务监控是一款面向站长的网站监控产品,提供免费的网站和服务器监控。  用户群:个人站长  优点:  1.该服务免费,支持网站HTTP监控、PING监控、域名DNS监控、服务器监控。  2.提供网站访问全景数据和简单的配置信息。  缺点:  1.只支持简单的网站和服务器监控,历史数据保存15天,免费监控点数只有4个。  2.上次产品更新时间为2014年9月,已停止更新和运营支持。  (3)阿里云监控  推荐星级:★★★★☆  阿里云监控是一款免费的网站监控产品,可以监控站点和服务器,并提供多种报警方式:短信、Wish、邮件。  用户群:阿里云用户  优点:  1.与阿里云服务紧密捆绑,让用户自定义数据监控。  2.多个IDC之间的阿里云内网数据传输不占用客户公网资源。  3.支持业务数据的综合统计,多角度反映业务的运行情况。  缺点:  1.全部服务基于阿里云,功能单一,扩展性差。  2.功能不够强大,只能满足基本的监控需求。(4)百度云观察  推荐星级:★★☆☆☆  百度云观察是百度推出的一款云服务产品,类似于360云监控和阿里云监控,主要为网站龙提供免费的一站式网站监控预警服务,涵盖网站运行状态、安全、访问速度等多个方面。  用户群:个人站长  优点:  1.对用户每天访问的站点执行安全检查。  2.云节点覆盖国内主要城市,支持CDN、DNS状态和主机监控。  缺点:  1.需要网站认证。  2.监控点少,功能简单。只能监控网站状态,不支持服务器和应用监控。(5)小蜜蜂网站监测  推荐星级:☆☆☆☆  监控网站或服务器服务器的可用率(Uptime),一旦网站无法连接或服务器出现错误,可以发送告警通知。  使用人群:中小企业站长  优点:  1.小蜜蜂通过节点检测和最后一公里两种模式监控网站可用性,支持多种站点监控类型和不同的网络访问传输协议。  2.提供多样化的监控报警设置,支持站内实时报警信息,支持RSS。  缺点:  1.仅支持基础网站监控,监控点不可选,监控服务不稳定。  2、网站性能历史数据不够详细,无法导出。  随着新技术的不断发展,云服务已经成为互联网企业的必备,但在很长一段时间内都会出现传统物理主机与云主机、私有云与公有云并存的状态。此外,互联网公司发展非常迅速。小米、滴滴出行等很多公司在短短几年内发展起来。因此,选择一款合适的云监控产品与企业一起成长是非常有必要的。