【.com快译】熄灯数据中心的想法已经存在多年,但为什么要运行这样的数据中心?他们是未来的方式吗?Lights-out数据中心实际上是无人值守的数据中心,是完全自动化的数据中心设施,可以更显着地节约能源和管理成本。“熄灯”这个词可以追溯到1955年PhilipKDick发表的一篇短篇小说。例如,在制造业中,飞利浦在荷兰的一家工厂在少数质检员的监督下生产剃须刀;而日本发那科一家生产工业机器人的工厂,可以长时间关闭空调和暖气系统,不影响机器人的生产。.当一个熄灯数据中心最初建成运行时,其计算机系统仍然需要定期维护和保养。现场工作人员不得不经常进入机房重置服务器或重新连接交换机。但这正在改变,今天的IT组件变得越来越可靠。软件定义网络(SDN)意味着通过软件重新配置服务器或连接网络。虚拟化使工作负载独立于物理服务器,而自动化意味着可以远程进行重置和调整。多年来,传统数据中心一直有运营人员管理和维护数百甚至数千台服务器。除非更换硬件或修复故障,否则通常不会进入机房。数据中心的机械和电气设备是自动化的,而空调和冷却系统也可以无人值守运行,并提示工程师或制造商进行预防性维护。传统数据中心“浪费”了更多的空间和能源,因为需要为操作人员提供工作环境和条件,设置满足安全和生理需求的安全入口、卫生间等设施。Lights-out数据中心于2011年首次亮相,当时美国互联网服务提供商AOL宣布它正在采取积极的方法,推出名为ATC的小型无人值守数据中心。AOL技术副总裁、微软前数据中心专家MikeManos在博文中称赞了lights-out数据中心的想法,认为该技术可以从根本上改变一切。熄灯数据中心的炒作和炒作但十年过去了,AOL早已不复存在,数据中心仍然需要运营商来运行和维护。但是熄灯数据中心的想法一直存在,在这样的数据中心里往往可以安装机架,预装服务器。数据中心设计人员指出,如果不需要人员操作和维护,数据中心的机架和服务器等IT设备可以部署得更紧凑,运行温度更高,冷却费用也大幅降低。从空气中提取氧气可以防止火灾并减少腐蚀。但事实证明,大型数据中心设施仍然需要配备人员。全球数据中心可靠性权威机构UptimeInstitute长期以来一直建议数据中心运营商需要准备好应对出现的任何问题。该机构的技术专家RichardF.VanLoo在2015年的简报中说:“对于需要在TierIII或TierIV数据中心设施中进行关键任务操作的组织,我们建议至少有一个或两个数据中心运营商拥有现场工作人员24/7全天候工作,拥有适当数量的数据中心人员是可靠运营的关键。”lights-out数据中心的发展自此发生了一些变化,尤其是在较小的数据中心提供商中,例如EdgeConneXInc.EdgeConneX首席信息官LanceDevin表示:“我们的业务建立在lights-out数据的基础上中心。我们通常部署功率容量为2MW的数据中心,而不是功率容量为100MW的大型数据中心。因为我们公司负担不起在数据中心运营。雇用更多工程师、安保人员、维护人员的成本。”EdgeConneX运行分段管理系统,让客户控制IT硬件,而EdgeConneX管理电源和冷却基础设施。但这样的数据中心并不是完全熄灯,EdgeConneX具有远程控制安全性,因此可以通过蜂鸣器通知客户或运营商的操作人员。拥有和运营大型数据中心设施的运营商不需要这样做。但他们需要具备远程管理数据中心的能力,这在2020年的冠状病毒疫情中得到了验证。随着许多组织的员工在家远程工作,数据中心采用的远程控制服务激增运营商。数据中心运营商QTSDataCenters的首席技术官BrentBensten表示,由于大流行,在封锁的前三周内,该公司远程管理门户(服务交付平台或SDP)的登录量增加了30%,而用户在在系统上花费的时间增加了一倍。虽然允许工作人员进入数据中心,但需要彼此远离,并且发现数据中心仍然可以在较少的人为干预下运行,但我看到了远程管理的更多价值。“COVID-19加速了远程管理平台和工具的采用,因此以前在现场完成的工作可以远程完成,”Bensten说。“熄灯运营以解决技能短缺问题?在许多情况下,‘熄灯’是降低数据中心技能要求的一种方式,既可以作为削减成本的措施,也可以解决难以找到熟练员工的问题。”在一篇博文中,施耐德电气的工程师StevenCarlini解释了为什么每个数据中心在未来都将成为无人值守的数据中心。在这篇文章中,他指出,企业应该让自己的数据中心关闭,其中一个原因是为了应对疫情的封锁,另一个原因是为了解决技能短缺。卡里尼说:“熄灯和无人值守的说法可能并不完全准确,因为安保人员很可能会在现场工作。他建议数据中心应该聘请具有机械技能的安保人员,并让他们进行即插即用的硬件更换,一些公司已经在尝试使用Zoom视频软件来指导人员进行维护和维修。中心的概念已经演变为数据中心不需要更多技能的概念。水下数据中心的探索所以,做灯-out数据中心真的存在并起作用吗?也许有一些数据中心是这样运作的,也许有些公司对此保密,并且可能已经失败了(比如AOL的ATC数据中心)。但是人们在业界都知道一个众所周知的案例,微软作为试点部署的一个水下数据中心已经运行了两年,数据中心的功率容量为240kW,并没有由于数据中心沉没在海底,因此不需要工作人员现场访问和维护。一个名为ProjectNatick的微软研究团队在2018年将12个服务器机架部署在一个压力容器中,并将它们沉入苏格兰海岸外的海底。两年来,这个水下数据中心的服务器运行没有受到任何影响,唯一的通讯方式就是电源和网线。数据中心运行864台服务器和27.6PB存储设备主要处理来自Azure云平台的工作负载。这个无人值守的数据中心部署在一个充满惰性氮气的密封罐中。微软最终打捞出“SSDC-002”水下数据中心。ProjectNatick水下数据中心负责人大卫·卡特勒表示:“该水下数据中心已经无人值守运行了25个月零8天,运行结果令人满意。”可靠性和摩尔定律法律水下数据中心服务器的可靠性大约是传统数据中心同类服务器的七倍。ProjectNatick水下数据中心使用了一批二手服务器,其中135台运行在陆基传统数据中心,其余855台服务器部署在这个水下数据中心。“在地面上的135台服务器中,有八台服务器在两年内出现故障,”卡特勒说。“在水下数据中心的855台服务器中,只有6台服务器宕机。这些服务器都执行相同的任务。并且没有进行任何维护,但传统数据中心的振动和氧气环境使其相对不可靠。”反对运行lights-out数据中心的主要论点是服务器和存储需要定期更换,不是因为服务器和存储设备的硬件磨损,而是因为它们变得过时。几十年来,IT硬件一直遵循着摩尔定律(随着技术的进步,硬件性能每18个月翻一番),采用新的服务器仅在能源成本方面就可以在三年内收回投资。芯片技术现在已经接近极限,摩尔定律即将到来UptimeInstitute的研究主管RabihBashroush说:“在更换使用寿命长达9年的服务器时,仍然有充分的理由来节省能源。”Cutler预测,这将使数据中心运营商更注重部署和运营无人值守的数据中心,他说,“服务器在数据中心整个生命周期的成本中占了很大比例。”在后摩尔定律时代,没有理由每两年更换一次IT设备。”在边缘采用lights-out数据中心虽然传统数据中心仍然需要运营商来管理,但新的应用场景和边缘计算领域可能会出现要求运营无人值守的数据中心。物联网等新技术的发展以及流媒体和远程工作应用程序的日益普及导致数据中心用户对高度分布式、低延迟资源的需求。这意味着部署大量靠近人和数据源的小型数据中心设施。大多数边缘数据中心比微软ProjectNatick的水下数据中心小得多,有的甚至安装在灯柱上。除非能够完全取消现场访问和操作,否则边缘数据中心可以在维护成本方面变得难以承受。“就像我们所做的那样,通常有一个熄灯数据中心,”卡特勒说。“边缘计算设施最终自行运行。”旨在使AOL的服务更贴近客户的计算设施。卡特勒表示,随着技术的进步和发展,light-out数据中心的发展可能比人们想象的要快,将成为数据中心行业的一种趋势。原标题:什么是熄灯数据中心?,作者:PeterJudge
