当前位置: 首页 > 科技观察

数据中心人工智能:永不止步

时间:2023-03-18 13:48:05 科技观察

中国信息通信研究院(CAICT)数据显示,2010年至2020年这十年间,中国数据中心行业发展迅猛,中国互联网数据中心(IDC)市场规模已连续三年保持30%以上的年复合增长率,2020年达到1494.2亿元。面对数据中心市场的繁荣发展,中国政府正式将数据中心纳入国家战略建设范围。2020年4月的“新基建”,凸显了这个市场日益增长的重要性。  虽然数据中心通常有30-200名员工(取决于数据中心的规模和项目的预期用途),但这些员工中只有一小部分负责IT方面的事情。除了更换设备(也称为“代客操作”)外,只要没有停电,这些员工就没什么事可做。因此有传言说数据中心光线昏暗、凉爽并发出“催眠”的嗡嗡声,使它们成为完美的睡眠场所。  其实,与电费、网络通讯费等其他运营成本相比,数据中心的人力资源成本大多可以忽略不计。  数据中心已经达到了先进的自动化水平,只是因为它依靠更少的人来运营。很多传统业务还在探索哪里需要自动化,但这个问题对于数据中心来说就很简单了,因为数据中心有明确的关键性能指标,比如缩短的周期时间、部署频率/速度和每个流程的速度。平均处理时间等  人工智能有助于进一步降低成本  我们究竟如何降低数据中心成本,以及哪些成本?简而言之,“削减开支并优化开支”。让我们来看看以下场景。  一些常见的问题已经有了解决方案:数据中心的人工智能(AI)可以在数据中心发生故障时帮助加快根本原因分析,并可以通过预测分析来防止硬件故障,或者更准确地说,能够指示何时更换设备可防止故障率达到阈值。  此外,人工智能可以大大提高基础设施的利用率。机器可以在更短的时间内看到更多的价值,因此在优化利用率,以及产能规划等方面都远远优于人类。  尽管如此,数据中心服务经理们还是百感交集。一些任务,比如初始配置和持续编排,已经高度自动化,可以完全交给人工智能而不用担心。但是有些任务,比如配置和补丁管理,乍一看可能很简单,但实际上却相当复杂。由于变量太多,数据中心需要就何时打补丁、打补丁等做出单独的决定,这对机器来说绝非易事。  中期,AI可以在测试环境中打补丁,自己模拟真实的用户行为,评估补丁是否会对产品使用产生负面影响,但目前还没有到这个阶段。  介于两者之间的是一些特殊的用例,例如已经应用了机器学习的健康和性能监控。我们可以称之为可观察性,下一步就是使用正确的人工智能。  因此,智能运维(AIOps)成为了这个领域的热词。Gartner曾预测,2025年全球AIOps市场规模有望达到31.2744亿美元,2020-2025年复合年增长率为43.7%。  鉴于数据中心市场本身的规模,可能很难找到合适的解决方案。许多组织仍在寻找“最佳解决方案”,而不是退后一步思考他们真正想要实现的目标。问题是每个AI解决方案的评估成本都很高,采用具有某种群体智能的AI系统要比从头开始开发它以获得自定义版本要好得多,即使现有的现成框架也是如此没有例外。另请注意,在AI解决方案的评估阶段,完全有必要进行适当的监控。  哪里有光,哪里就有阴影  与每一项新技术或用例一样,对人工智能既有合理的担忧,也有不必要的抵制。对于自动化,主要的问题是缺乏时间来开发和测试自动化脚本,尤其是在没有足够的专业投入的情况下。  还有一个问题就是信任,这和部署AI的时候是一模一样的。我们中的大多数人可能都认为我们只能靠自己做好一份工作。这与将任务交给机器时会出现的心理是一样的,而AI的出现突然让人们更加害怕失去控制。  集成问题  集成解决方案并将其链接到现有解决方案是复杂且具有挑战性的。开发人员在这方面可以提供很大的帮助,即使在部署阶段之后也是如此。数据中心可以尝试使用低代码或无代码。这两项最新技术使没有开发知识的管理员能够通过创建简单的应用程序来提供更多定制服务,而无需学习深厚的编码知识。  同时,一些构建块可以通过用户界面流程图“匹配”基础设施和服务管理。这将为进一步的自动化开辟道路,并有望在不久之后看到“低代码AI界面”(我编造的流行词)。  因此,数据中心管理当前面临的挑战是评估低代码平台的总体成本,以及网络或基础设施管理员不工作的时间,并将其与临时雇用开发人员的成本进行比较基础。