当前位置: 首页 > 科技观察

理论无用,专业的数据中心运营重在实践

时间:2023-03-18 13:28:32 科技观察

为了最大限度地延长数据中心的正常运行时间,许多组织试图通过采用各种方法来管理其数据中心运营来降低风险。它的基本要求很可能表明一定程度的可靠性或鲁棒性得到保证。组织要求将最新的技术创新融入到数据中心的设计和建设中,这确实有助于数据中心的持续服务交付,但这里需要强调“可能”二字。数据中心运营专业化,更重要的是运营性能的关键,不是理论上能做到什么,而是能否在现实中付诸实践。不要过于复杂多年来,经验证明,过于复杂的设计和规范实际上会增加数据中心停机的可能性,因为不必要的复杂系统在发生故障时可能难以维护和修复。调查显示,75%的数据中心宕机是由人为错误造成的,因此最明智的做法是暂时不采用不成熟的新技术,避免复杂的设计,简单地实施更易于操作和维护的系统。工程师如果能利用他们在设计、调试和运营数据中心时学到的知识,就能更好地避免故障情况并安全运营。以运营和经验为主导的数据中心运营商能够将这些知识重新投入到数据中心的设计和建设中。例如,事实证明,管理任何类型风险的最有效方法是尽可能避免单点故障。目的是在数据中心设施内升级为大问题之前遏制相对较小的问题,但不幸的是,并非所有单点故障都是显而易见的。例如,如果工作人员使用楼宇管理系统(BMS)远程启用/禁用关键设备,一个简单的软件故障可能会关闭正常运行的设备,导致租户无法使用服务。因此,优良作法建议最好让事情保持简单,并在客户使用该服务之前测试每种失败的可能性。当然,解决方案越简单,就越有可能在满载集成系统测试(IST)期间测试所有可能的场景。现实一点,一些数据中心运营商最终会根据其履行情况进行评判,未能满足服务水平协议(SLA)只会导致运营目标缺失并触发处罚条款。确保服务水平协议(SLA)切实可行且可实现的最佳方式是采用以工程为主导的方法来管理运营。换句话说,将服务级别协议(SLA)视为工程的数字功能,而不是合同的协商要素。客户充分了解数据中心停机时间或故障间隔时间(MTBT)非常重要。必须考虑设计和调试决策对服务水平协议(SLA)和运营效率的影响。例如,减少安装数据中心冷却管道的成本和时间可能被认为是实现更早完工日期的最佳方式,但塑料管道可能具有成本效益,但它们也更容易开裂,最终可能破坏冷却系统。普通手术。经验表明,使用塑料管道不值得冒险,因为数据中心运营商可以解释在大多数情况下部署昂贵的钢管需要额外的时间和成本。经验表明,数据中心运营商需要更加透明地了解不同系统、方法和认证的优势和劣势。他们需要听取客户的要求,然后解释和证明他们的建议,即使这意味着接受建议将实施替代行动方案,如果这符合客户的最佳利益,则可以考虑。他们应该将SLA视为交付,并准备好在技术或操作上不可行时重新协商SLA承诺。毕竟,减少可能阻碍灾难恢复能力或效率的任何潜在基础设施弱点或操作复杂性的唯一方法是数据中心运营商利用他们的设计、调试和管理经验,并最终听取专业人士的建议。