当前位置: 首页 > 科技观察

云计算环境下的监控

时间:2023-03-12 13:51:52 科技观察

21世纪最伟大的发明,既不是创新也不是人工智能,而是人们对新事物越来越多的接受和推崇。在大科技的推动下,智能标志着科技的进步。与此同时,思维方式的改变不断加速人类进步。  近年来,随着云计算技术在国内的推广和普及,涌现出许多优秀的云计算平台,聚合了大量的硬件资源和软件资源,利用虚拟化技术实现服务量的动态伸缩,根据需要的服务。为了保证云平台的正常运行,需要对整个云架构进行多方位的监控,而普通监控软件和网格监控软件都有各自的局限性和适用范围,并不适用于云平台。因此,本文研究并实现了云平台下的监控。该系统解决了对云平台资源运行和用户使用情况的监控,改进和增强了系统的自配置和容错能力,具有重要意义。  目前,云计算平台的研究和应用在学术界和企业界的共同推动下逐渐呈现出快速增长的态势。亚马逊、谷歌、IBM、微软、雅虎、Sun、盛大云计算等国内外企业纷纷推出了自己的云计算平台和解决方案,云计算时代已经到来。从最初的IDC逐渐发展成为面向服务、动态扩展、按需付费的公有云或私有云。云平台的用户范围也在逐渐扩大。未来,企业可以在云计算平台上按需选择适合自己的云服务,快速构建具有企业特色的业务流程管理系统和数据库。这种快速架构体系的新模式,可以合理地充分利用资源,降低成本,从而提升企业的核心竞争力;而政府通过云计算加强部门间信息交流,促进部门间协同办公,利用云计算数据挖掘、并行处理等技术,将大量信息进行分布式存储和科学分析,最终让统一有效地管理数据。  云平台聚合了大量的物理资源和虚拟资源,利用虚拟化技术实现服务量的动态伸缩,按需提供服务。监控在提高云计算提供的服务质量方面发挥着重要作用。为了使云平台能够顺畅地提供服务并正确运行,需要对云平台运行的架构进行多方位的监控,以确保云平台运营商能够了解和掌握整体运行情况,以便及时优化资源性能和可用性。监控往往是通过监控软件来实现的。通过对重要系统资源的监控,排查系统瓶颈和隐患,在严重故障时进行故障的自行处理或人工处理,以满足云平台灵活、高可用的特点。同时,用户在使用云服务的过程中,总会有监控云服务运行的需求,以保证机密数据的安全和计算操作的正确完成。同时,云服务提供商也需要了解用户对云服务的使用情况,以便进行收费,并计算出提供相应服务需要什么样的成本。  2。云监控系统  云计算平台聚合了大量的物理资源和虚拟资源,提供三个层次的服务:IaaS、PaaS、SaaS。供应的顺利进行需要通过云监控系统进行监控。本节主要介绍监控系统的总体架构,分析数据传输采用推拉模式的优缺点。  2.1架构  2.1.1集中式架构  在集中式架构中,每个监控节点安装一个监控代理(Agent)收集节点监控信息,监控服务器负责监控的采集、分析和展示信息。监控代理通过推送方式向监控服务器发送信息参数,或者监控服务器通过拉取方式向监控节点索取信息。    2.1.2梯形架构  在级联架构中,每个监控节点安装一个监控代理(Agent),选择一个采集节点,安装一个资源采集代理(Proxy)。采集节点相当于本地的监控服务器。    2.1.3结构对比  1)安装部署:集中式架构,安装部署方便,只需要在监控节点上统一安装Agent,梯形结构还需要确定组域来监控节点属于哪个,并在采集节点上安装Collect。如果阶梯结构有多层,需要确定采集节点的上层采集节点;  2)可扩展性:在集中式结构中,监控服务器负责收集所有监控节点的数据并进行数据分析,在网络流量和计算能力的限制下,只能应用于小规模的监控,而阶梯结构中的采集节点承担了部分信息采集和计算任务,减轻了监控服务器的负担,因此当节点数量较多时,可以采用多级阶梯结构,具有很强的可扩展性;  3)容错性:集中式架构监控服务器负载大,容易出现灾难性错误,而阶梯式架构减轻了监控服务器的负担。如果池化节点发生故障,则可见错误仅限于其所属的组域;  4)时延:集中式结构时延小,梯形结构监控信息需要通过几层采集节点进行整合分析,所以时延比较大。  2.2推拉模式  2.2.1推模式(PUSH)  由监控节点上的监控代理发起,即监控代理主动发送节点采集到的监控数据。通知消息来了。发送到监控服务器。  2.2.2拉取模式(PULL)  由监控服务器发起,需要监控服务器主动向监控代理请求获取数据,即需要相应的组件主动采集性能参数各监控节点的性能参数获取方法,可以调用各监控节点上代理对象的性能参数获取方法实现。  2.2.3比较  选择哪种模式进行数据传输,需要综合比较实时性、准确性、易用性、可扩展性、开销等,这里的实时性是指监控数据与系统实际运行数据的一致性程度以及变化是否能及时反映。开销是指完成一次监控信息交互所需要的消息数据量。  2.3Zabbix监控研究  2.3.1zabbix简介  Zabbix是一个基于WEB界面的企业级开源解决方案,提供分布式系统监控和网络监控功能。  zabbix可以监控各种网络参数,保证服务器系统的安全运行;并提供灵活的通知机制,让系统管理员可以快速定位/解决各种问题。  zabbix由3部分组成,zabbixserver,可选组件zabbixproxy,可选组件zabbixagent。  zabbix可以通过SNMP、zabbixagent、ping、端口监控等方式提供远程服务器/网络状态监控、数据采集等功能。它可以运行在Linux、Solaris、HP-UX、AIX、FreeBSD、OpenBSD、OSX等平台上。  需要在被监控的目标服务器上安装zabbixagent。主要完成硬件信息或内存、CPU等操作系统相关信息的收集。zabbixagent可以运行在Linux、Solaris、HP-UX、AIX、FreeBSD、OpenBSD、OSX、Tru64/OSF1、WindowsNT4.0、Windows(2000/2003/XP/Vista)等系统上。  zabbixserver可以单独监控远程服务器的服务状态;同时也可以配合zabbixagent轮询zabbixagent主动接收监控数据(agent模式),也可以被动接收zabbixagent发送过来的数据(trapping模式)。  另外,zabbixserver还支持SNMP(v1、v2、v3),可以与SNMP软件(eg:net-snmp)配合使用。  2.3.2zabbix的优势  1)监控系统可以自定义监控内容,可以直接写脚本采集数据。  2)数据应保存在数据库中,以便日后需要时对数据库进行分析计算。  3)无需复杂操作即可方便快捷地为服务器添加监控。  4)数据可视化不是很花哨,但很容易上手。  5)可以定义复杂的告警逻辑,实现Item之间的告警关联。  6)告警需要确认,让运维人员知道有人知道这些告警,并开始处理。  7)报警方式可自定义  8)报警内容可自定义  9)报警后可自动运行部分命令打开  12)监控可视化图表方便参考!  云监控在整个云安全环节中扮演着不可或缺的角色,能够有效帮助云服务商尽快发现问题并解决问题。当然,除了云监控之外,还应该建立安全的数据中心安全事件应急响应机制和流程,实现真正的云安全。未来,新知云将继续邀请技术专家为大家分享更多云安全相关的干货,欢迎持续关注!