当前位置: 首页 > 科技观察

用于数据中心冷却的AI:不仅仅是白日梦

时间:2023-03-19 20:08:51 科技观察

如今,AI遍布数据中心——帮助管理和保护网络、过滤警报和移动工作负载。然而,该行业在将AI应用于运营技术问题而不是IT方面进展缓慢。具体来说,在冷却领域,有时占服务器群总功耗的三分之一。你可能听说过,谷歌使用由DeepMind开发的基于深度学习的推荐引擎,“可持续地”将其数据中心的冷却能耗降低了40%。2018年,该公司更进一步,允许算法在人工监督下自动进行调整。鉴于该行业对排放的担忧以及对人工智能的热情,人们可能希望这一发展到目前为止能得到更广泛的采用。起步缓慢不幸的是,创建此类系统需要结合数据中心的深厚技术专长和前沿的机器学习研究;我们必须记住,DeepMind是一个“月球工厂”,预算看似无限,也没有任何商业产品。由于数据中心代表谷歌的核心业务,该公司不太可能与业界分享其开发成果。将机器学习引入空白空间管理是现有数据中心软件供应商的责任。由于对人工智能技术的普遍不信任,这一过程一直很缓慢,但在过去两年中,谷歌内外出现了一些有前途的案例研究。数据中心运营商报告说,人工智能确实减少了他们用于冷却的能源,减少了他们的能源费用和碳足迹。冷却设备的实时控制为机器学习模型提出了一个合适的问题,这些模型在决策时可能会考虑比人类团队更多的数据,并且可以产生看似非常规甚至违反直觉的解决方案。有大量数据可以为这些模型提供数据:与其他一些工业环境不同,数据中心已经布满了传感器,而且可以轻松添加更多。2020年底,德国工业巨头西门子发布了一份白皮书,强??调了基于人工智能的冷却技术的一些好处。该公司表示,随着IT负载的变化,机器学习使冷却系统能够实时调整其输出,使设备冷却需求与冷却输出相匹配。这是一个有价值的目标,因为它通过避免数据中心普遍存在的过冷问题直接减少了能源使用。该行业喜欢过度谨慎。用于冷却的AI还可以最大限度地减少员工监督和现场人员的需要,允许将员工分配给其他关键任务并减少需要访问的人数,这在大流行期间尤其重要,因为现场访问是非常重要。西门子自己的AI冷却方法结合了两种产品:DemandFlow,专注于冷冻水输送的监测和控制,以及称为WhiteSpaceCoolingOptimization(WSCO)的平台,收集温度和供气传感器数据,并计算气流保持机架每个通道的正确温度所需的调整。去年12月,该平台被部署到巴黎第一个经过Tier4认证的数据中心,该数据中心是为法国国有银行CaissedesDép?ts建造的。该设施预计将以1.2的电源使用效率(PUE)运行。西门子的WSCO是与一家名为Vigilent(前身为FederspielControls)的迷人公司合作开发的,这是一家总部位于奥克兰的小公司,专注于一件事,而且只专注于一件事——关键任务冷却。Vigilent开发了(并申请了专利)一种由监督学习驱动的动态冷却管理系统,可以控制设备,很像DeepMind开发的系统。该软件通过持续分析传感器数据了解环境变化,并根据历史行为提出建议。它可以确定建筑物中每个crh单元的贡献,并指出哪些单元在浪费冷却工作。Vigilent承诺其节能水平与谷歌实验中的节能水平相似,并声称在500多个安装中平均降低了38%的冷却功率。该公司不仅向西门子提供机器学习技术,还向ABB、日立Vantara和施耐德电气等众多DCIM和BMS软件供应商提供机器学习技术。另一家在自动化冷却管理人工智能方面处于领先地位的公司是中国企业集团华为。去年,该公司推出了iCooling,这是一项基于云的服务,它使用深度学习来处理传感器数据,找到不同设备和系统参数之间的关系,并将泵、冷却器和冷却塔的输出与IT负载进行比较以进行匹配。该公司声称,当部署??在其自己的云数据中心之一时,该服务可将电源使用效率(PUE)提高8%。中国移动在试用iCooling时,将其中卫工厂的总用电量减少了3.2%,即超过400,000千瓦时。随着系统不断从数据中学习,预计将产生更大的节能效果。关于AI用于数据中心冷却的讨论与围绕AI的可持续性的更广泛辩论相关联:CapgeiniResearch最近的一份报告估计,AI的创新应用可能需要三到五年的时间。年内将全球温室气体排放量减少16%。凯捷在报告中确定了一些积极的人工智能用例,并指出在不中断业务运营的情况下识别缺陷和预测设备故障的能源优化平台和算法将产生最大的影响。随着人工智能在其他行业的成功部署,用于冷却和其他数据中心基础设施管理的人工智能将成为下一件大事——这只是将理论转化为实践的问题。西门子在白皮书中警告说:“人工智能有望在未来几年重塑数据中心的运营。”“但是,数据中心今天需要准备就绪,明天才能生效。”