当前位置: 首页 > 科技观察

人工智能提高数据中心可用性和效率

时间:2023-03-18 16:52:19 科技观察

机器学习为数据中心运营商带来更好的散热、功耗和性能。随着企业开始采用大型数据中心运营商和托管服务提供商已经尝试和测试的机器学习技术,人工智能将在数据中心运营中发挥更大的作用。今天的混合计算环境通常跨越本地数据中心、云和配置站点以及边缘计算。企业发现传统的数据中心管理方法并不是最佳的。通过使用人工智能、机器学习,可以简化复杂计算设施的管理。目前,数据中心的人工智能围绕机器学习来监控和自动化设施组件的管理,例如电力和配电元件、冷却基础设施、机架系统和物理安全。在数据中心设施内,越来越多的传感器正在从备用电源、配电设备、开关设备和冷却器等设备收集数据。有关这些设备及其环境的数据将由机器学习算法进行分析,例如,机器学习算法可以了解有关性能和容量的更多信息,并确定适当的响应、更改设置或发送警报。随着条件的变化,机器学习系统会从变化中学习——本质上是通过训练进行自我调整,而不是依赖特定的编程指令来执行其任务。目标是使数据中心运营商能够提高其设施的可靠性和效率,并更加自主地运行它们。然而,获取数据并不是一项简单的任务。施耐德电气数据中心全球解决方案高级总监SteveCarlini表示,基本要求是从主要组件获取实时数据。包括冷水机、冷却塔、空气处理器、风机等设备。在IT设备端,您需要收集服务器利用率、温度和功耗等指标。“计量数据中心不是一件容易的事。”Carlini说,“如果你想尝试做人工智能,你需要从数据中心获取数据,并确保数据中心有很多连接点用于供电和冷却。”IT专业人员习惯于设备监控和实时警报,但在涉及内部设施时则不然。“人们期望来自IT设备的即时通知。但在您的电气系统上,这不是直接可用的数据,”Carlini说。“这是一个不同的世界。”仅在过去十年左右的时间里,第一批数据中心才完全配备了仪表,并使用仪表来监控电源和冷却。在存在计量的地方,标准化往往很困难:数据中心运营商依赖于使用多种通信协议的楼宇管理系统——从Modbus和BACnet到LONworks和Niagara——他们必须满足那些无法共享数据或无法远程控制的设备的需求.“TCP/IP、以太网连接——这些连接以前在动力总成端和冷却端是闻所未闻的,”Carlini说。好消息是,数据中心监控正在发展到高级分析和机器学习所需的深度。服务提供商和托管服务提供商一直非常擅长在机架级别进行监控,尤其是监控能源使用情况。企业开始部署它,具体取决于数据中心的规模,”Carlini说。机器学习让数据中心始终保持凉爽。2016年达美航空数据中心停电导致其在2016年停电三天,国内约有2000个航班停飞,造成1.5亿美元的损失。这正是基于机器学习的自动化技术可以避免的场景。得益于数据中心计量技术的进步和云端数据池的出现,智能系统取代人工流程成为可能。发现数据中心运营中的漏洞并以不可发现的方式提高效率。机器学习驱动的智能的一个简单示例是应用于数据中心消耗品的基于条件的维护策略,例如冷却过滤器。Carlini说,通过监测通过多个过滤器的空气流量,智能系统可以检测某些过滤器是否比其他过滤器堵塞更严重,然后将空气引导至堵塞较少的单元,直到所有过滤器都需要更换。另一个例子是监控UPS系统中电池的温度和放电。智能系统识别在更热的环境中运行并且可能比其他系统运行更频繁的UPS系统,然后将它们指定为备用UPS而不是主系统。”它可以做一些思考。这曾经是手动完成的,但现在机器也可以做到。这些是基本情况,”Carlini说。更高级别的功能是动态冷却优化,这是当今数据中心机器学习最常见的例子之一,尤其是在大型数据中心运营商和托管服务提供商中。供应商之间。动态冷却优化使数据中心管理人员能够根据环境条件监视和控制设施的冷却基础设施。随着设备移动或计算流量激增,建筑物内的热负荷会发生变化。动态调整冷却输出转移热负荷有助于消除不必要的冷却能力并降低运营成本。451Research数据中心技术和生态高效IT渠道研究总监RhondaAscierto表示,托管服务提供商是动态冷却优化的主要采用者。“机器学习对数据中心来说并不新鲜,”Ascierto说。“很长一段时间以来,人们一直试图根据容量和需求来改进冷却,而机器学习可以让你实时做到这一点。”Vigilent是动态冷却优化领域的领导者。其技术优化了数据中心设施中的气流,自动查找和消除热点。Vigilent的创始人、总裁兼首席技术官CliffFederspiel表示,以前,数据中心运营商往往会运行比他们需要的更多的冷却设备。“它通常会以非常高的成本产生半可接受的温度曲线。”如果存在热点,传统的做法是增加更多的冷却能力。实际上,较高的空气速度会产生压差,从而干扰通过设备的气流或阻止热空气返回冷却设备。也许这不直观,有时降低风扇速度可能更有效。Vigilent基于机器学习的技术了解哪些气流设置可以优化每个客户的冷却环境。该公司表示,在需要的地方提供适量的冷却通常可以减少40%的冷却能耗。除了自动化冷却系统外,Vigilent的软件还允许客户使用分析工具来制定有关其设施的运营决策。Federspiel表示:“我们的客户越来越有兴趣使用这些数据来帮助管理他们的资本支出、容量规划和可靠性规划。这为数据中心中大量新型数据相关决策创造了机会。”人工智能使现有流程更好展望未来,数据中心运营商正在努力将动态冷却优化的成功扩展到其他领域。一般来说,适合机器学习的领域是那些需要大量重复性工作的领域。“基于机器学习的新数据中心方法可能会应用于现有的业务流程,因为当您对业务问题和规则有透彻的了解时,机器学习会更好地工作,”Ascierto说。企业已经有了一些监控工具。有一种长期存在的数据中心基础设施管理(DCIM)软件可以提供对数据中心资产、相互依赖性、性能和容量的可见性。DCIM软件具有远程设备监控、电力和环境监控、IT资产管理、数据管理和报表等功能。企业使用DCIM软件来简化容量规划和资源分配,并确保尽可能高效地使用电力、设备和占地面积。“如果您有基本的监控和资产管理,您的预测能力将大有帮助,”Ascierto说。“人们已经在使用自己的数据了。”接下来:将外部数据添加到DCIM组合中。这就是机器学习发挥关键作用的地方。数据中心管理即服务或DMaaS是基于DCIM软件的服务。但它不仅仅是DCIM软件的SaaS版本。DMaaS将进一步收集数据,聚合来自数十个数据中心的设备和设备数据。然后使用机器学习对这些数据进行匿名化、汇总和分析。DMaaS市场的两个早期参与者是施耐德电气和伊顿。两家供应商都从他们在数据中心领域的多年经验中挖掘了大量数据,其中包括设计和构建数据中心、建筑管理、配电以及电力和冷却服务。“施耐德电气和伊顿正在做的将产生重大影响的是一个拥有大量客户数据的数据湖。这对数据中心行业来说非常有趣,”Ascierto说。从广泛的操作环境中捕获此类数据使企业能够将自己的数据中心性能与全球基准进行比较。例如,施耐德的DMaaS产品,称为EcoStruxureIT,与一个数据湖相关联,该数据湖具有来自500多个客户和220万个传感器的基线数据。“你不仅可以使用自己的数据来理解和解决问题。你还可以使用来自数以千计其他设施的数据,包括许多与你的设施非常相似的数据。这是最大的不同,”Ascierto说。例如,预测性和预防性维护可以受益于更深入的智能。“基于其他机器,在具有相似使用水平、相似年龄和相似组件的环境中工作,AI可以提前预测可能发生的故障,”Ascierto说。场景规划是可以从机器学习中获得的另一个好处。有益的过程。例如,如今的公司进行情景规划以估计设备移动对功耗的影响。“这对于机器学习来说几乎是不可能的,”Ascierto说。“但是,通过将机器学习数据、历史数据应用于特定配置和不同设计——确定特定配置或设计结果的能力大大增强。”风险分析和风险对冲计划也将受益于更深入的分析。Ascierto说:“数据中心非常复杂,如今规模如此之大,人类真的很难在其中找到规律,但对机器来说却很容易。”未来,机器学习在数据中心的广泛应用将为企业在决定在何处运行某些工作负载时提供更多建议。“这对组织非常有价值,尤其是当他们围绕最佳执行地点做出决策时,”Ascierto说。“这个应用程序应该在这个数据中心运行吗?还是我们应该使用一个额外的数据中心?”展望未来,智能系统可以承担更复杂的任务,使数据中心能够根据最有效或最可靠的设置动态重组。调整工作量。“复杂的人工智能还有一段路要走,”卡里尼说。同时,对于刚刚起步的企业,他强调了让设备和IT团队更多协作的重要性。Carlini说:“考虑数据中心的所有部分——电力系统、冷却系统和IT管理机房——非常重要。必须努力确保不同领域技术之间的互操作性。同时,企业需要在人员配置方面保持一致。去做吧。“虽然这在技术上很容易做到,但在组织上,仍有很大的改进空间,”他说。