当前位置: 首页 > 科技观察

跨混合IT进行有效实时监控的6个步骤

时间:2023-03-21 17:16:26 科技观察

对于数据中心运营,可能很难确定哪些数据是关键数据,哪些数据是背景噪音。筛选数据的能力至关重要,因为数据中心经理必须快速确定哪些警报很重要,哪些可以帮助提供有关其基础设施运行情况的信息。在《Real-time Environmental Monitoring for Your Data Center Management Platforms and Getting Common Data Into Your New Hybrid World》在DataCenterWorld2020上的演讲中,关键环境集团数据中心解决方案总监AndrewGraham和RLETechnologies国际和西方国家销售总监CamRogers介绍了一个框架,可以帮助企业建立真正的-在混合环境中进行时间监控,以有效地管理和扩展您的基础架构。要成功部署实时监控,IT团队应解决五个问题:谁、什么、何时、何地、为什么以及如何。1.弄清楚为什么需要实时监控在IT团队投资任何类型的实时监控之前,他们应该弄清楚为什么数据中心需要实时监控。潜在的原因包括降低成本、提高生产力、简化管理以及减少意外和停机时间。当企业试图将基础设施扩展到本地数据中心之外并将托管和边缘集成为整体基础设施的一部分时,这些原因尤其引人注目。Graham说,随着混合IT的持续增长,运营自己的数据中心的公司发现容量管理是一个巨大的问题。实时监控技术最初旨在提供数据中心基础设施的快照,非常适合帮助IT团队更有效地管理数据中心,并帮助解决日益复杂的设置问题——这涉及多种技术类型。RSPArchitects的负责人RajanBattish说:“实时监控已经取得了长足的进步;它一直都存在。多年来我们看到的是,他们正在机架级别获取信息并尝试通过优化它“基础设施。监控系统开始获取有关数据中心运行情况的数据,它成为自动化和优化的方式。”2.确定谁必须参与当IT团队构建业务用例时,他们必须考虑谁应该参与新的实时监控设置。这包括必须向谁报告问题,系统应该向谁提供信息及时的方式,谁关心设施的状况,谁负责新应用程序的推出,以及哪些团队关心流程改进和有效性。如果企业有外部基础设施,管理员必须说明任何外部可能需要报告的各方,例如托管服务提供商、主机托管和云提供商、合作伙伴和供应商。IT团队必须建立关键的利益相关者,因为这样做会影响报告结构和软件警报。这也减少了报告冗余。“每个利益相关者都有不同的优先事项,IT经理可能有与设施经理不同的需求。应该由他们来决定什么是重要的,什么不是,”罗杰斯说,并补充说企业可以从本地化警报中学习。首先,这些警报不一定与一切相关。“除非你有员工24/7全天候工作,否则当你看不到警报时,问题会很快出现,”他说。“你需要查看设施并将警报发送给合适的人。”3.查看最有用的指标最好的指标是企业有大量数据需要跟踪——尤其是涉及基础设施时。通过实时监控设置,管理人员应该确定哪些指标对他们很重要,哪些可以快速提供信息。“这真的取决于你想要管理和汇集哪些资产,”罗杰斯说。大多数企业依赖于一些通用指标,例如电源使用效率(PUE)、数据中心基础设施效率(DCIE)、节能和IT设备利用率。但管理员应谨慎对待这些指标。PUE是一种广泛使用的指标,但它是基于对IT设施功率和总设备功率的总体估算。如果团队进行IT升级,PUE可能会上升。Graham建议IT管理员将PUE用作内部指标,而不是试图将其与企业外部的其他数据中心进行比较。Graham和Rogers解释说,管理人员可以使用PUE和DCIE以外的指标,例如散热指标,但这些指标可能需要更多数据和分析,从而导致部署率降低。4.确定何时部署监控或扩展容量添加容量或系统应用程序时,这可能很困难,尤其是在IT需求不断变化的情况下。您的团队应该考虑您的监控和管理工具是否有助于内部开发和改进规划、调度和性能。“你不能只考虑何时需要启动和运行设备来推出应用程序,”格雷厄姆说。“您需要从上线之日起开始工作,以涵盖部署过程中每一步所需的所有资源。”实时监控也可以通过针对特定于事件的指标来完成,以帮助日常工作:事件发生的时间、报告的时间以及解决的时间。识别这些时间可以帮助企业更主动地响应事件,尤其是当这些事件随时间显示出模式或以特定时间间隔定期发生时。5.了解基础设施的位置企业还应该考虑应该在哪里部署监控软件和硬件——是在本地数据中心、异地边缘节点,还是托管位置。从内部角度来看,应该有一个持续的过程来跟踪容量和连接的设备。还有来自云提供商的信息,因此IT团队应该询问是否可以在云中跟踪和追溯数据,并确定任何合规性需求——文档或专用应用程序等。通过更准确地了解所有数据和硬件所在的位置在IT设置中,组织可以确定哪种实时监控产品最能满足他们的需求,并且可以支持所有必需的技术类型。这将在部署实时监控时确保一致的性能和高效的容量管理。6.知道如何监控基础架构在IT团队、经理和利益相关者讨论何时、何地和什么内容之后,管理员应该调查企业应该如何部署实时监控和增加基础架构容量。这涉及了解可能影响基础设施增长的因素,例如热点、占地面积不足、停电、缺乏冷却和水资源等。Battish说,大多数企业在部署过程中都面临着挑战,尤其是在让硬件和软件相互通信方面。这使得聚合协议非常重要,因为大多数企业使用多个供应商来构建他们的数据中心基础设施。然而,传感器和协议转换器可以帮助收集数据并提高实时监控能力。罗杰斯说:“传感器有很多选择,所以一定要做好功课,不要把自己锁在无法支持明天及以后所需功能的专有产品中。”行业产品包括用于配电装置和不间断电源的传感器。有线和无线传感器以及一系列软件可以现成购买或根据内部需求定制。这种传感器和软件的组合可以帮助管理员和管理员减少例行补救任务的数量。“当人们不断地解决同样的问题时,这对士气不利,”格雷厄姆说。“我们并不是说每个人都需要一个单一的视图,但他们应该减少冗余,整合并解决正确的问题。监控和管理的转变让人们希望提高效率并在我们的行业中处于领先地位,并专注于更多的优化工作。“