当前位置: 首页 > 科技观察

事故保密影响数据中心运维安全

时间:2023-03-14 19:27:55 科技观察

日前,数据中心行业专家得到了一个可以提高数据中心可靠性的简单建议,就是增加数据中心的冗余设施。数量级。如果数据中心行业能够被说服和采纳。专家认为这是不现实的。可靠性不是绿色问题,但它肯定与能源效率相互作用。这两种需求往往是相互冲突的,而更高的可靠性通常意味着数据中心在储备区储存更多的柴油,甚至在整个热备设施中部署更多的设备,这将增加企业的碳足迹。但所有这些在可靠性方面的努力都会导致碳的浪费,这实际上可能是在浪费时间。许多人可能对其数据中心的可靠性感到困惑,关键设施专家EdieAnsent就此发表了一篇发人深省的演讲。安森在报告中指出,有时硬件会出现故障,这并不常见,但数据中心的故障通常是由于人为错误,或者是因为忽视了数据中心设施的设计、测试、维护或运营等细节。.他接着列举了一些经典的数据中心事故,比如某数据中心的备用柴油储罐忘记密封,结果导致柴油机没有及时启动,因为少了一个20大的零件。-分硬币。当故障发生时,电力系统从飞轮切换发电机组,但其输出频率开始漂移。这会为其变压器线圈饱和的静态转换开关创建“异相”条件。在另一个示例中,由两个飞轮UPS系统冗余备份的数据中心发生故障。当Ancent被叫去调查时,他马上就知道问题出在哪里,因为他在其他数据中心也遇到过。可以预测和预防此类故障,但前提是先前故障调查的结果已经公布。由于数据中心故障调查通常是在保密协议(NDA)下进行的,如果公开这些信息,将使那些存在此类问题的公司受益,但实际上由于保密性,通常不会发布这些信息。今天,由于技术的进步,复杂的系统可以变得非常可靠。那些成熟的行业,比如航空业,可以做到10万到20小时无故障,而这个数字对于数据中心行业来说是一个耻辱,因为还没有达到。“数据中心的可靠性还有改进的空间,只是因为人们不同意共享它,”Ancent说。航空公司被迫通过法律来分享事故调查的结果。它们受到严格监管,因为如果发生故障,乘客的生命将危在旦夕。这不适用于数据中心,尽管随着数据中心基础设施承担更重要的人类安全功能,这种情况可能会发生变化。行业不希望严格监管。但在这次会议上,安森特有了一个想法。即在共享匿名数据库的基础上,发生过事故的数据中心可以共享自己的故障。通过实际调研,数据中心行业人士可以从案例中学习和借鉴。这个想法如果得以实施,可能会在数据中心可靠性方面带来真正的突破。实现这一点将是一场艰苦的战斗,但它应该赢得业内人士的支持,因为无论谁想要削减数据中心成本,无论是浪费电力、金钱还是能源。