当前位置: 首页 > 科技观察

宕机、人员配备给数据中心带来了巨大的挑战

时间:2023-03-19 22:49:40 科技观察

根据UptimeInstitute最近发布的一项研究,数据中心正在努力提高其物理基础设施的弹性,并在竞争激烈的劳动力市场中招聘熟练的员工,以避免代价越来越高的宕机。同时,尽管数据中心面临着迫在眉睫的可持续性问题,但仍有许多企业没有跟踪数据中心的关键指标。服务器更新周期越来越长根据Uptime的说法,服务器的使用寿命越来越长,通常超过供应商建议的三到五年。在Uptime2015年的调查中,34%的受访者表示他们的服务器已经运行了五年或更长时间。到2022年,这一比例将攀升至52%。Uptime认为生命周期的增加有几个原因。半导体可用性、元件短缺导致价格上涨和交货时间增加都是主要因素。此外,购买力较低的小型组织经常被要求推迟不必要的升级。新的IT硬件通常会提高数据中心的效率,但正常运行时间表明这些效率激励措施正在放缓,这一趋势也可能反映出服务器能效增长放缓。Uptime表示,代际变化,尤其是在占市场大部分的英特尔驱动服务器中,提供的性能和能源改进比以前低得多。当然,使用替代(基于AMD和ARM)处理器的更高效服务器的供应仍然有限。数据中心中断成本攀升虽然有一些数据中心中断的明确指标,但Uptime警告说它们可能会被误解。总体而言,正常运行时间追踪到每个站点的中断次数稳步改善。到2022年,60%的受访运营商表示他们在过去三年中经历过一次停电,低于2021年的69%和2020年的78%。根据Uptime的数据,历史上被认为是关键/关键的停电约占运营商的20%所有停电,到2022年下降到14%。尽管每个站点的停电次数和严重停电次数减少,但全球停电总数同比增加。好的一面是,中断频率的增长速度没有全球数据中心足迹增长的速度快。根据Uptime的说法,虽然有关中断的指标可能难以解释,但一个趋势很明显:中断的成本越来越高。特别是,损失超过100万美元的停电次数正在增加。当被问及最近一次停电的成本时,25%的受访者表示,此次停电的直接和间接成本超过100万美元,其中15%的受访者表示2021年的停电损失达数百万美元。此外,2022年有45%的受访者表示他们最近的停机成本在100,000美元到100万美元之间,而2021年这一比例为47%。为什么停电成本会增加?这可以归因于多种因素,包括通货膨胀、罚款、违反服务水平协议以及劳动力成本、召回和更换零件——但最大的单一原因是商业经济活动对数字服务的依赖程度越来越高。数据中心关键IT服务的丢失通常会立即转化为业务中断和收入损失。电力问题仍然是停电的主要原因根据Uptime研究数据,现场电力问题仍然是大量站点停电的最大原因。2022年44%的受访者表示,电力是他们组织上次发生高影响事件或停电的主要原因。另一个最常见的原因是网络问题,占调查数据的14%。其他值得注意的原因包括冷却故障(13%)、IT系统问题(13%)以及SaaS、托管和云提供商等第三方提供商的问题(8%)。无法在多个云中备份应用程序企业越来越有信心将云用于关键任务工作负载。2019年,74%的受访者表示他们不会将关键任务工作负载放在公共云中。到2022年,这一比例下降到63%。与此同时,Uptime报告称充分意识到公共云提供的服务的弹性的受访者比例从14%上升到21%。根据Uptime的说法,组织越来越有信心将云用于任务关键型工作负载,部分原因是人们认为运营弹性的可见性有所提高。然而,其他数据表明云用户也有一些担忧,主要问题是可用区。根据Uptime的说法,可用区通常具有冗余电源和网络,云提供商建议用户将他们的工作负载分布在多个可用区,以防一个可用区出现中断。数据表明,企业并没有像他们应该的那样努力推动。当被问及如果主要云提供商在单个可用区发生中断的潜在影响时,35%的受访者表示这将导致严重的性能问题或停机,而另有49%的受访者表示这将是轻微的性能问题或预计停机。不难发现,用户似乎对云可以处理任务关键型工作负载更有信心,但超过三分之一的用户正在构建易受相对常见的可用性区域中断影响的应用程序。数据中心人员配置问题恶化据Uptime称,随着全球数据中心的数量和规模不断增长,职位空缺的数量也在不断增加。据估计,全球劳动力需求将从2019年的约200万全职员工增长到2025年的近230万。其中一些数据中心工作是需要专业技能的新类别。该报告显示,员工短缺正在影响全球几乎所有数据中心的工作角色。在北美和西欧等成熟的数据中心市场,大部分现有劳动力都在老化,许多专业人员预计将在大约同一时间退休,从而导致数据中心工作人员人手不足但经验丰富。在2022年的调查中,53%的数据中心运营商表示在2022年难以找到合格的员工,高于2021年的47%和2018年的38%。此外,在大多数情况下,42%的数据中心运营商表示员工招聘存在问题由竞争对手。这比2018年的17%有了显着增长。未能跟踪环境数据根据Uptime,大多数受访者表示他们报告了数据中心的整体用电量和用电效率(PUE),但许多人仍未跟踪关键环境数据指标。例如,预计大多数数据中心运营商将很快被要求报告碳排放量,但许多人还没有准备好遵守。在调查的受访者中,63%的人表示他们相信他们所在地区的当局会要求他们在未来五年内公开报告环境数据,但只有37%的人收集和报告了碳排放数据(高于2021年的33%),而且只有39%目前报告他们的用水量(低于2021年的51%)。Uptime报告称,新的法律、标准和要求将迫使运营商解决这些差距,并在未来几年建立更严格的可持续性跟踪和报告实践。注:2022年全球数据中心调查包括来自800家数据中心所有者和运营商的回复,以及来自全球700家数据中心供应商、设计师和顾问的意见。原文地址:https://www.networkworld.com/article/3674127/survey-outages-staffing-challenge-data-centers.html原作者:AnnBednarz