当前位置: 首页 > 科技观察

机器学习如何用于管理数据中心电源?_0

时间:2023-03-21 12:01:14 科技观察

【.com快译】数据中心变得越来越复杂已经不是什么秘密了。有更多类型的硬件和管理软件、更频繁变化的工作负载和公共云。随着边缘计算的出现,情况只会变得更加复杂。业内许多人希望机器学习能让数据中心管理人员更轻松地应对这种复杂情况。几家公司已经在销售使用机器学习算法的数据中心管理软件。有些人从数据中心作为计算机的整体角度来解决这个问题,而另一些人则选择只关注冷却或电力。虽然冷却是当今浪费大量能源的低效数据中心的一个方面,但拥有智能软件工具来管理电气数据中心基础设施具有巨大的好处。一家名为VirtualPowerSystems(VPS)的初创公司正在使用机器学习来消除数据中心中通常所说的“搁浅电源”。数据中心的电气系统设计用于支持比必要更多的电力负载,这种情况并不少见。有时这是为了确保冗余而有意为之,而其他时候则是由于设计者无法预测未来数据中心的使用方式。VPS的“软件定义电源”解决方案使用内置电池的智能电气硬件,包括施耐德电气等合作伙伴的设备,在整个数据中心更合理、更高效地重新分配电力。该公司表示,它可以随着需求的变化动态地重新分配电力。这个名为ICE的软件使用机器学习来集中预测电源需求,包括电池管理和电源尖峰的概率,并将配置模式发送到在数据中心楼层的硬件中运行的推理引擎,然后根据实际情况调整每台机器需要。机架可用的功率负载。VPS的首席技术官KarimullaShaikh告诉我们:“如果你有一个冗余的基础设施,将两根电源线接入机架,你可以这样部署负载,如果出现故障,你可以从一根电缆切换到另一根电缆.totheother.这意味着你最多使用每路50%的容量。如果你使用我们的交换系统,你可以使用100%的负载。如果出现故障,交换系统是智能的,它能够介入并将所有负载转移到电池上,持续一小段时间,然后利用我们的软件将应用程序转移到其他地方或使工作负载离线。”该软件构建的机器学习模型也可以用作模拟器,以查看如果您添加更多服务器或机架,电力传输将受到怎样的影响。但这仅仅是开始。Shaikh表示,VPS正在与一些客户合作,试图完全避免典型的冗余数据中心基础设施设计。它还侧重于数据中心能源之间的动态切换,例如公用电源、燃料电池和间歇性可再生能源。NlyteSoftware的数据中心基础设施管理(DCIM)软件被该公司的首席战略官EnzoGreco比作“数据中心的实时ERP(企业资源规划)”,最近在其解决方案中增加了对IBMWatson的使用.机器学习服务的预测热和电源管理功能。Watson帮助它根据来自传感器、设备和应用程序工作负载信息的数据构建模型。Greco说,在许多情况下收集所有数据已经??相当容易,那么为什么不更频繁地使用它并让它为你所用呢?许多数据中心已经拥有温度和湿度传感器、实时运行服务器数据和功率计。“数据很容易从任何现代设备获得,无论是UPS还是PDU,”他说。机器学习系统可以找到隐藏的模式以及不同系统和端点之间的联系。“我们能够预测未来某个时刻服务器和机架级别的电源异常情况,”Greco说。在稳定状态下,机架可能消耗10kW,但在某个时候,它可能会飙升至15kW。“有了足够的历史数据,可以预测这个机架在未来每小时将消耗15kW的功率。”功率尖峰可能是由机械问题或应用软件引起的。“也许您正在以批处理模式运行SAP,也许您的交易系统正在高峰条件下运行。”他说,如果你能预测电力峰值,你就可以通过移动工作负载、关闭服务器或对UPS电池做一些预防性工作来进行预防。维修准备就绪。Nlyte的大多数客户都在使用机器学习系统来接收有关潜在问题区域的警报。该软件公司还在开发预测性故障和预防性维护模块。“功率和热量是预测故障的两个极好的领先指标,”Greco说。“如果你能预测到电源异常,那就是你可能遇到应用软件问题或机械问题的先行指标。”除了更快地检测异常之外,机器学习还可以帮助运营商更好地了解其数据中心的电气基础设施冗余机制。UptimeInstitute研究副总裁RhondaAscierto告诉我们:“由于一个因素(比如操作习惯的改变),机房的电源冗余可能没有最初设计的那么好。关键是为了确保数据中心的每个部分都处于冗余配置中。尽管这些数据中心的性质不断变化,但仍按您预期的方式运行。”机器学习有望将数据中心可用性策略从被动转变为主动。他解释说:“UPS是被动的,它等到电源出现故障时才切换到正常系统。应用软件故障后恢复,它是被动的。主动的就是不等待;我以后有问题,我会现在就做解决问题。”原标题HowMachineLearningIsUsedtoManageDataCenterPowerToday,作者:MaryBranscombe