随着数据中心工作负载的激增,越来越多的企业开始关注人工智能(AI),希望通过技术帮助他们减轻IT团队的管理负担,并在同时提高效率,削减开支。AI承诺将工作负载实时自动转移到最高效的基础设施,无论是在数据中心内还是在由本地、云和边缘环境组成的混合云设置中。随着人工智能改变工作负载管理,未来的数据中心可能看起来与今天的设施大不相同。一种可能的情况是由远程管理员管理的小型互连边缘数据中心的集合。专注于商业和技术趋势的组织InfosysKnowledgeInstitute负责人JeffKavanaugh表示,由于各种因素,包括更激烈的竞争、通货膨胀和大规模预算削减,许多组织正在寻找减少数据中心运营的方法费用。方法。“人工智能和自动化已被证明是工作量管理的强大工具,因为它使员工从耗时和平凡的任务中解放出来,使他们能够专注于实际需要人类完成的工作,”他说。大多数数据中心经理已经在使用各种传统的非人工智能工具来协助和优化工作负载管理。然而,专业服务公司毕马威(KPMG)的咨询主管肖恩肯尼(SeanKenney)表示,这些工具往往是被动的,而不是主动的。“他们对数据中心的问题做出反应,但他们不会收集数据来确定任何减少问题行为的先见之明,”他指出。伊利诺伊大学芝加哥分校生物医学和健康信息科学临床助理教授SanketShah认为,人工智能现在已准备好帮助发现自己没有可靠方法来预测或规划未来需求的数据中心经理。“借助人工智能,可以更有效地分配容量和马力,使组织能够扩展并变得更加敏捷,”他解释道。“对于数据需求快速变化的[managers]来说,它将使某些流程自动化并在必要时转移权力最终会降低成本。”使用人工智能技术管理数据中心的想法并不新鲜。例如,谷歌在2014年披露,它正在利用通过收购英国人工智能专家DeepMind获得的技术,加强其多个站点的数据中心设施和设备管理。如今,AI工作负载管理领域已大大扩展,包括许多初创公司,例如DLabs、digitate、RedwoodSoftware和TidalSoftware。较大的公司如思科(Cisco)、IBM和VMware也开始进入该市场。与人工智能的大多数事物一样,工作负载管理技术也在迅速发展。华盛顿大学信息学院副教授BillHowe指出:“有很多选择和限制,通常有减轻它们的方法。”工作量管理可能比程序更具挑战性。”满足需求对于大多数数据中心经理来说,首要任务是优化运营以满足高峰需求。然而,无论他们如何周密地计划和准备,需求的高峰和低谷往往仍不在他们的控制范围之内。商业咨询和咨询公司凯捷北美公司人工智能工程副总裁古萨姆贝利亚帕表示:“人工智能可以带来的独特改进是它了解工作负载模式,并将这些需求与数据中心的容量相匹配。”人工智能管理承诺将数据中心团队从一系列单调、重复的任务中解放出来,包括服务器管理;安全设置;计算、内存和存储优化;负载平衡;以及电力和冷却分配。技术市场ABIResearch的首席分析师LianJyeSu咨询公司表示:“所有这些任务都可以通过人工智能实现自动化或增强。机器收集数据并发现监控参数中的异常。”人工智能还可以帮助更早地预测故障和中断,这可以帮助数据中心管理团队减少停机时间和保持集群健康,”他补充道。“人工智能还可以实现更好的温度和电压管理,从而直接降低运营成本和d帮助减少碳足迹。”Ramamoorthy表示,虽然可以使用各种人工智能方法,但工作负载管理工具应始终确保模型预测是完全可解释的。他解释说:“与其他领域相比,人工智能系统在数据中心工作负载管理中做出的决策通常是由一个或多个团队共同做出的。”因此,AI模型决策应该是可解释的,让IT团队能够更好地理解模型决策的意图并采取相应的行动。“AI模型的准确率可以高达80%到85%,因此它还可以通过正确解释AI模型的决策来帮助人类团队做出明智的决策,”他指出。给定一个决策的置信度分数,它对于有效的工作量管理也很有用。人工智能和机器学习开发公司Tanjo的联合创始人兼首席执行官理查德博伊德表示,随着人工智能和机器学习工具变得越来越普遍,组织意识到只有当人类智能与这些技术相结合时,它们才能发挥最佳作用,而不是比竞争。“机器无法在很多方面取代人类,但在某些领域机器肯定比人类好得多,”他说。“一旦人工智能和机器学习流行起来,并且工人适应了这种新的伙伴关系,人们的看法就会改变。”戴尔科技公司AI战略总监BronsLarson表示,数据中心可以使用AI/ML来提高性能并优化配置和部署。“AI/ML支持资源和工作负载的动态编排,以优化资源利用率并更好地管理成本,”他说。Larson补充说,所有AI解决方案,无论是应用程序还是供应商,都需要专业知识来正确配置和优化价值。“首先要正确捕获和评估用于训练和测试的数据,并管理部署的模型以防止漂移和偏差。”此外,基于规则的人工智能可以通过智能策略控制和预定义配置帮助自动化资源优化和合规性。“通过从日常运营中收集的数据,基于机器学习的人工智能可以进一步增强数据中心运营的其他方面,而这些方面以前需要深厚的领域专业知识,”苏指出。“例如,数据中心的安全性可以通过自学习威胁检测和监控算法得到增强。”“可以通过将所需资源用于正确的方向来优化负载平衡、电力和冷却分配功能。”人工智能还可以简化数据管理。“企业越来越多地发现自己被与关键利益相关者相关的大量数据所包围,”卡瓦诺说。“使用人工智能,组织可以确保这些大量数据得到有效和准确的管理。”在人工智能的帮助下,团队可以比以往更快、更准确地执行任务,例如数据质量分析或提取数据以进行预测.“这对组织来说至关重要,因为他们需要最准确的数据来做出明智的决策。”人工智能包随着人工智能的成熟,现在出现的是一种软件驱动的方法,它可以将不同的元素结合在一起,并最大限度地减少人工干预。例如,Howe指出,在典型的数据库系统中,需要进行大量配置才能使操作高效运行,例如索引表、跨服务器分区数据、为某些类型的查询分配内存以及调整优化器以“适合”您的计算平台和预期工作量。“人工智能可以帮助我们从大量历史数据中学习规则和程序,了解哪些时间表适用于哪些任务,而不是让我们试图弄清楚所有事情,”他解释道。“有了人工智能,人类IT领导者和团队可以自由地专注于业务问题,而不必担心基础设施细节,”Belliappa说。“从AI的角度来看,我们使用的大多数模型都是自学集成模型,这些模型结合了技术并在从他们管理的工作负载模式中学习时不断优化。规划和部署在AI开始发挥其管理魔力之前,IT和业务领导者需要习惯于将关键管理职责移交给一款软件。Shah承认:“根据规模和内部知识库,这可能相当困难。最终,组织如何处理从人工负载管理到手动负载管理的转变取决于其技术成熟度、运营规模和数据中心的动态。”Card“缺乏现代基础设施来有效利用数据的孤立企业将举步维艰”Vano说。另一方面,越来越多的AI供应商为特定类型的企业提供工具,这增加了几乎任何类型和规模的组织都能够顺利过渡的可能性。他预测:“随着公司“随着它的成熟,配置和部署的便利性将不断提高。”如果人工智能有致命弱点,那就是该技术对数据中心系统和实践中相对微妙的变化的反应。Howe解释说:“大多数AI技术都是关于寻找稳定的模式,假设环境是固定的。”如果你以模型看不到的方式改变环境,它会很高兴地告诉你错误的答案。“在部署更改之前仔细规划可以帮助减轻此类担忧。虽然支持人工智能的数据中心工作负载管理已经被许多大型企业常规使用,特别是谷歌、亚马逊和微软等超大规模企业,但即将到来的技术现在才开始慢慢涌现Belliappa认为,数据中心管理者将很快面临一个艰难的选择:继续依赖传统的数据中心管理技术和实践,还是“大力投资AI驱动”,从长远来看,AI驱动的管理是随着技术进步、成本下降和采用者信心增强,预计将成为主流。Shah预测:“在未来4到6年内,您将看到AI数据中心工作负载管理技术成为标准选择。”“我认为这种趋势发展非常迅速很快,”Howe说。“长期以来,数据中心已经实现了很多自动化,而这些(AI)技术提供了利用大量data提供者提供了更好的方法。他预测,使用人工智能学习方法的自动化工作负载管理将“很快普及”。Kavanaugh说,行业观察人士越来越期望人工智能在未来三到四年的某个时候开始主导数据中心管理,尽管大多数大流行病驱动的加速可能有助于推动这一时间表向前发展。“很快,数据中心将能够实现几乎所有操作的自动化,从网络安全到维护再到监控,”他预测道。随着数据量呈指数级增长,以及我们在企业中发现AI的新用途,我们的工作负载及其管理将继续发展。“
