以前,企业网络工程师必须为各种连接的服务器、应用程序和终端设备提供网络访问和足够的带宽。从OSI模型的角度来看,这些工具主要针对1-4层网络。由于通过网络的所有流量和数据流共享所有带宽和队列资源,因此更高的OSI层在某种程度上被忽略了。慢慢地,网络设备变得越来越复杂,现在可以对网络中不同的数据流进行识别和区别对待。还可以使用各种服务质量(QoS)和应用层流程整形技术来实现此目标。此外,随着对关键业务应用程序的依赖程度越来越高,网络工程师迫切需要了解OSI模型的更高层次,以便他们能够发现网络、服务器操作系统、虚拟化软件和应用程序本身存在的能力问题或其他问题。然而,要解决这些问题,他们需要一些工具。在很多场景下,网络性能监控工具都是从更传统、更简单的网络监控软件演变而来的。这些监控工具通常使用ICMPping和简单网络监控协议(SNMP)轮询/陷阱来检查网络状态。补充性的、更现代的功能包括监控、基线和对应用程序本身所有状态的智能分析。最先进的网络监控工具还可以完成以下5个功能:1.网络和应用监控2.网络问题分析3.应用数据和流量拦截分析4.虚拟化和操作系统问题检测5.问题根源分析不同网络性能监控供应商以不同的粒度执行这些任务。此外,任务越精确,实施和管理就越复杂。因此,准确了解您自己组织的需求,然后适当平衡粒度和复杂性非常重要。那么,让我们继续分析现代网络性能监控工具的5个常用功能。网络和应用程序监控如前所述,现代网络监控工具已经从使用ICMPping和SNMP协议的网络监控发展为更复杂的工具。来自网络监控服务器的定期ping命令被发送到各种网络、服务器和其他需要监控的终端设备。如果受监控的设备不响应??ping请求,监控工具可能会将设备标记为“关闭”,然后向支持人员发出警报。SNMP从支持该协议的网络和服务器组件收集和组织各种类型的数据。对于网络设备,这通常意味着持续监控特定设备接口状态和数据吞吐量。此外,它还监控硬件状态,包括电源、风扇和内存使用情况等。一些网络性能监控工具还可以收集和响应各种系统日志(Syslog)消息。Syslog是用于记录来自基础设施设备的消息的通用标准。这些消息被发送并存储到一个集中式网络监控工具,进行分析并用于在系统出现故障时通知支持工程师。网络监控工具具有全面的监控能力,不仅可以监控可用性和性能统计,甚至可以监控整个应用层。这种监控通常依赖于配置的软件插件或操作系统设置将监控数据发送回中央监控服务器。虚拟化和操作系统问题检测网络和应用程序之间必然会出现一些问题。这包括虚拟化、服务器操作系统和应用程序所依赖的各种中间件。需要单独监控虚拟机管理程序,以发现可能会降低应用程序层性能的问题。负责管理分布式系统间通信的主要操作系统和中间件也有同样的问题。网络性能监控供应商使用不同的方法来监控这些问题,其中一些支持更多的管理程序、操作系统和中间件软件。网络问题分析除了提供简单的在线/离线状态和使用率信息外,网络性能监控产品还可以执行更复杂的自动化网络故障排除任务。这包括路由协议监控和计划外路由更改的警报。此外,一些产品使用智能来了解各种WAN技术、虚拟堆栈和QoS功能的工作原理。此外,还可以将它们设置为在出现问题时自动发送警报,甚至执行自动修复问题的操作。应用数据和流量的捕获和分析现代网络性能监控工具最重要的任务是解析和分析数据和流量。在网络中,不同的区域可以使用不同的方法捕获数据包,然后进行自动和/或手动分析。最常见的方法是:1.在所有关键网络位置部署分布式数据收集代理。2.使用特定路由器/交换机硬件的数据包捕获功能。分析数据包并执行更精细的应用程序分析是许多企业组织越来越强调的要求。通过使用深度数据包检测技术,网络管理员可以识别更多与应用程序相关且难以检测的通信问题。网络流量收集会整理出进出网卡的数据的IP网络统计信息。一旦将此数据发送到中央服务器并由网络性能监控流量分析工具进行分析,网络支持管理员就能够辨别流量的来源和目的地信息,以及流量在穿越时会遇到的详细QoS策略网络。最终,此数据用于识别网络设备之间的配置问题或各个网络路径上的拥塞问题。根本原因分析在网络性能监控工具上整合分析各种事件数据,可以形成自动化的根本原因分析功能。如果网络出现问题并触发多个组件的事件,许多网络性能监控工具会使用人工智能技术来分析这些事件的关联性,并最终确定问题的根本原因。这是要配置的更复杂的功能之一,因为它需要正确配置所有设备和监控系统。例如,如果设备时间没有通过网络时间协议(NetworkTimeProtocol)同步,那么事件发现的时间就会错误。这会对根本原因分析引擎的准确性产生负面影响。然而,一旦创建并采取了正确的维护措施,自动化的根本原因分析工具可以节省大量的故障排除时间。
