数据中心租户如果在签订数据中心托管合同后感到后悔和后悔,将是非常痛苦的。因为管理不善的数据中心会遇到随机停机或中断,这将影响租户的日常业务交互,影响其在客户中的声誉,并可能损坏租户的昂贵设备并使租户付出更多代价。而移动数据中心是劳动密集型的,因此不稳定且昂贵。如何在混乱中挽救自己的业务,做出正确的选择,成为用户头疼的问题。但是如何选择呢?在每个数据中心设施中,它都声称拥有一支专家团队,拥有广泛的安全措施、一致的可用性、高密度计算能力以及抵御自然灾害的能力。似乎无法区分好数据中心和坏数据中心。因此,在企业做出选择之前,应考虑三大类标准:运营管理、设备和基础设施以及商业信誉。每个类别都列出了一些问题,这些问题将挖掘出令人遗憾的重要细节,这些细节可以区分数据中心,从而帮助您的业务蓬勃发展。1.运营管理(1)数据中心能否隐藏在显示更好历史记录的维护窗口后面,或者避免因违反服务水平协议(SLA)而受到经济处罚?了解数据中心如何以及为何使用维护窗口有助于经常发现潜在问题、关键系统设计、容量管理和运营能力。一些数据中心过度使用或操纵他们的维护窗口,以便看起来与其可用性更加一致或避免SLA惩罚。停机时间通常是最终用户停机时间,无论是计划内维护窗口还是计划外维护窗口。在这里,可以查看过去五年的定期计划,以及紧急或计划外维护窗口的报告。使用什么类型的维护窗口?可以查看一个或两个(如果是冗余或2N冗余)电路以确保服务级别协议不受影响。另外,客户的维护窗口多久关闭一次?是否有任何维护窗口会导致客户意外停机?维护窗口是否有排除数据中心持续关键系统可用性和正常运行时间的历史记录?这些问题的答案将有助于阐明企业数据中心的维护窗口程序以及它们如何影响您的业务。(2)主要专业是数据中心托管?需要注意的是,除了提供托管服务外,数据中心提供商还提供IT管理服务和通信服务。起初,数据中心提供商提供多种服务听起来很方便,但当数据中心试图成为所有人的一切时,它们为客户提供的服务质量就会受到影响。数据中心托管服务提供商,主要专注于提供数据中心基础设施服务工作,为客户提供优质便捷的服务。数据中心提供商一般不提供自己的竞争服务,以吸引最好的服务提供商并与这些公司合作在数据中心提供服务。供应商可以选择并获得他们需要的有竞争力的价格。(3)数据中心如何减少人为错误?人为错误仍然是影响数据中心持续正常运行的最重要因素。相反,人们普遍认为,人为错误是不可避免的,但可以通过规划和设计来减轻,有效减少或消除人为错误的唯一途径是正确的管理、正确的经营策略和良好的经营心态相结合.培养以任务为中心的员工队伍并将这种做法扩展到整个数据中心组织可以创造有利于持续运营的环境。与任何数据中心运营一样,如果外包某部分运营有困难,请询问是否将此运营和维护活动外包给供应商或第三方。如果是这样,它的所有权和责任就会丢失,服务质量也会受到影响。数据中心运营团队应该自己处理,而不是外包,但是如果自己解决,就必须要求自己的团队具备一定的技能、经验和资质。因此,团队的每一位成员都应该不断接受培训,尤其是要减少或消除错误并确保更高水平的服务交付流程和程序。此外,还应该有针对所有操作过程控制和文档的使用、验证、修订和批准的业务策略和实践。这些程序应该详细说明所有内容,包括清洁标准、变更管控、风险缓解、服务请求和问题的通知、升级和解决等。在了解数据中心应提供的运营策略和心态后,运营的判断措施可以简化团队以减少人为错误。2.设备和基础设施(1)数据中心是否有维护和生命周期政策?做好设备管理。请问数据中心设备是如何选型、调试、鉴定、测试和维护的?它的生命周期策略是否已经建立?预防性和预测性维护策略是否到位?它们能否结合起来进行有意义的测试和趋势分析?所有设备数据中心是否作为一个整体进行检查?(2)是否有有效管理数据中心日常运营的DCIM?数据中心是否有一个全面的数据中心基础设施管理(DCIM)系统,可以持续准确地监控和收集关键系统中的所有关键和数据?如何规划和管理关键系统基础设施?全面的DCIM对于高度可靠的数据中心至关重要,因为它持续监控所有关键系统。它使运营团队能够了解不断变化的条件、特定参数的趋势以及主动管理功能。通过采用有效的DCIM,运营商可以做出明智的决策,以保持数据中心平稳、连续地运行。拥有多个DCIM可提供对数据中心变化的可见性,但每个DCIM都应具有一些关键功能。DCIM应监控和管理数据中心的各个组件和系统容量。它应具有阈值警报和自动警报、自动升级、仪表板视图、集成仪表板计划管理以及预测性维护和趋势分析功能,并应显示实时用电效率(PUE)、分支回路用电量和输送温度和湿度测量。因此,运营团队需要一个能够提供这些重要数据点和功能的DCIM。(3)目前使用的机电系统容量如何?在数据中心,有时无法有效测量或管理单个组件和系统的容量。一些数据中心烧毁了它们的冗余能力,当设备可能出现故障或级联时,无法使用冗余或故障转移。数据中心运营团队需要了解关键电气和冷却系统所有可用组件的负载,熟悉数据中心配电系统和机械(冷却)配电系统,并有效管理这些系统,并了解如何分配冷却和电力的政策和程序是什么。如果数据中心的负载已经超过不间断电源(UPS)系统容量的90%,数据中心将没有足够的容量来提供用户服务,存在连锁故障的风险。因此,在预选过程中探索数据中心的容量管理和当前可用能力,避免数据中心供应商在迁移或迁移业务时无法满足用户业务增长需求的风险。(4)数据中心所在地是否受到自然灾害的威胁?数据中心采取了哪些措施来减轻灾害的影响?尽管没有哪个数据中心能免受自然灾害的影响,但可以通过选址来减轻或消除某些风险。通常,人们会避免将数据中心全部集中在一个区域,或者在周期性遭受自然灾害的区域,即使这是便于企业管理和运营的位置。例如,美国中西部的数据中心容易受到龙卷风的影响,而沿海地区的大多数数据中心则容易受到飓风、地震和洪水的影响。如果有这种可能的话,这些数据中心有一定的概率会受到地震的影响,那么这些数据中心有没有制定一些应对措施呢?那些位于平原的数据中心能否应对100-500年一遇的洪水?这些数据中心的数据中心是在FEMA预测最大洪水的水位以上的位置吗?数据中心提供商是否针对所有自然灾害采取了预防措施?它是否有适当的策略和措施来维持数据中心的正常运行时间?三个商业信誉(1)是否有办法实时查看客户的持续服务水平和/或服务水平协议(SLA)?通常,数据中心提供商为客户提供一定级别的服务。数据中心方法通常需要报告对服务级别协议(SLA)的遵守情况。要求数据中心提供商提供具有透明度和可见性的服务的参数。这应该是达到约定服务水平的必要条件。(2)数据中心是否获得认证?而那些获得众多认证证书的数据中心,都会有各自的优势和劣势,但还是有一定的意义,可以帮助数据中心运营商感受到设施和服务性的重要性。人们经常询问数据中心是否经过认证审核,并定期要求查看保密协议下的认证证明和审核指南。有关所提供服务的质量、可靠性和安全性分析的信息非常宝贵(3)数据中心和供应商的财务状况和承诺如何?运行数据中心的成本非常昂贵。数据中心提供商需要确保数据中心设施资金充足,不能仅仅依赖少数大租户。这些租户可以随时终止合同并导致数据中心关闭或提供商至少削减成本,这将影响服务交付的质量。因此,有必要审阅数据中心提供商的财务报告,了解当前或未来的业务计划,分析托管提供商或自己租赁的物理结构、建筑物和房地产的情况,以及数据中心提供商是否出售自己的数据中心计划?如果数据中心提供商的资产负债表、损益表或未来的努力看起来可疑,那么是时候做出响应并及早计划了。(4)目前数据中心提供商提供的100%连续关键系统的可用性和正常运行时间是多少?数据中心的可用性和正常运行时间将不仅仅基于关键系统设计和冗余设施。数据中心设计固然重要,但无法避免人为错误和管理不善。重点是数据中心的设计、管理和运营的结果。当前数据中心供应商提供的100%电气和机械(冷却)关键系统的可用性有多长?数据中心供应商对数据中心连续关键系统的可用性和正常运行时间有不同的定义。还了解正常运行期间包含或排除的维护窗口的历史记录。在数据中心的运营过程中,哪些设备经历了计划内或计划外的停机事件?如果有任何计划外停机事件,请询问客户是否收到通知,以及他们是否提供了详细准确的报告以确定停机事件的根本原因报告。还应提供行动报告和未来缓解计划中解决方案的详细信息。还要知道数据中心持续关键系统的正常运行时间记录信息,才能知道用户数据中心潜在合作伙伴的重要信息,结果不言自明。结语阐述了数据中心的运营、管理、设备、基础设施和商业声誉,以便数据中心成为有益的商业伙伴。当单个数据中心可以安全可靠地完成其工作时,您的数据和应用程序将更加安全,您的用户也将比以往任何时候都更容易信任您。一旦您确信找到了可以提供高可靠性、降低风险并提供持续正常运行时间的高质量数据中心,那么您就可以放心地与数据中心提供商签订合同。
