当前位置: 首页 > 科技观察

关于自动化网络监控的真相

时间:2023-03-14 00:30:14 科技观察

在IT领域,似乎人们相信您的业务环境是独一无二的。每个人遇到的特定企业基础架构设计都是经过衡量的,并且本质上是不同的-唯一的例外可能是您以前设计的网络加入当前公司;这些也是特殊的网络,肯定没有现在的环境那么特殊。此时,网络监控最佳实践、通用技术和标准方法将不再适用,或者至少需要对其进行大量修改以满足您IT架构的特定需求。我发现这比系统监控工具更合适。在过去的30年里,我遇到过无数的组织,它们拥有各种不同的服务器、应用程序、网络设备等,并且与其他组织完全不同。同时,他们的监控平台全部采用自主定制技术开发,集成了大量复杂的软硬件。它需要特殊处理,需要由受过专门培训的系统管理员来处理,这些系统管理员是Linux领域的技术专家。供应商无能为力然而,许多系统监控供应商在这方面并没有提供太多帮助——每一个都增加了问题、不确定性、疑虑,并不断销售“特殊API”和“上下文相关的命令集”,这些构成了网络监控最佳实践的基础。所有这些花言巧语听起来都像是来自魔法学校的一套复杂的技能、工具和证书。我认为这是:胡说八道!废话!在我30+年的IT行业经验中,近20年一直关注监控领域——从1998年开始使用市场上每一个重要的监控平台,支持环境小到几台服务器,大到250,000个系统在全球5,000个地点。中间遇到的一些事情我可以很负责任的告诉大家。真的吗?是的,监控很容易。成功的监控是标准化的,但它具有挑战性是的,好的系统监控很简单——监控足够稳定,可以无偏见地收集你需要的统计数据;监控提供有意义的、可操作的警报,而不是噪音;监控需要能够自动采取行动以响应监控操作。这并不神秘。它与子网划分技术一样标准化。然而,这并不容易。监控是一项复杂的任务,并非易事。使监控复杂化的因素之一是自动化。许多IT人员(甚至专家)会说,自动化确实最适合服务器和应用程序领域。换句话说,在网络空间实现自动化的唯一可行方法是冒险进入SDN的未知领域。真相往往是最难得到的。首先,我们可以这样分析:监控不只是一个文件,一个页面,一个屏幕。网络监控的最佳实践是持续、定期和统一地从一系列设备收集各种指标。完成第一部分后,其他一切——报告、警报、账单,甚至自动化——都是副产品。也就是说,好的自动化源于好的监控(因果关系)。例如,如果您有可靠的监控部署,则以下任务很容易:定期收集网络设备配置。接收配置更改信息。从刚刚发送消息的设备收集配置。将“lastgood”配置与刚刚收集的配置进行比较。如果确实发生差异,则强制回退到旧配置并发出警报。通过这种方式,未经适当变更控制而修改的设备将被迫返回到先前的状态,直到新的修改获得批准。看一份数据报告就可以知道,这类问题是40%-80%企业网络故障的根本原因。它干净、简单,最重要的是,它不是手动的。它是自动化的,而且是相当自动化的。还有网络设备自动化的其他例子,我之前也写过其中一些,但对大多数公司来说,监控的最大障碍不是使用错误的工具或技能。主要问题是思路不对——他们认为监控和自动化很复杂很难,普通人做不了这些东西。***,网络监控的实践和自动化只受限于你的想象力,你必须突破思维的束缚才能做到一个好的监控工具,不要把精力浪费在一些不必要的事情上。