托管提供商主要提供数据中心空间、电力、冷却、物理安全,但托管服务也面临数据中心停机期间响应时间较慢的潜在劣势。采用托管服务的组织必须仔细规划重要数据的存储位置,并遵守服务水平协议,以最大限度地减少托管数据中心服务中断的影响。当然,组织可以自己构建和运营本地数据中心,拥有、构建和维护基础设施和设备,雇用员工,执行政策和运行应用程序,并设置处理任何中断所需的优先级。组织领导者知道出现问题时该找谁,员工也可以关注组织的利益。对于作为托管服务提供商客户的组织,这些控制权交给托管服务提供商,他们负责故障排除并与客户保持联系。但托管服务提供商通常是为自身商业利益而运营的企业,有时无法满足托管客户的需求。是什么导致托管数据中心停机?以远程管理数据中心为核心的托管服务提供商通常可以将数据中心停机时间追溯到许多可能影响本地数据中心的相同问题。停机的原??因通常分为四类:电力、人员、灾难和连通性。(1)电源。托管服务提供商通常会在其数据中心内实现更大的弹性,例如备用电源系统。其备用电源包括为服务器和机架设备供电的不间断电源(UPS),以及在公用事业停电时可为数据中心设施供电的工业级备用发电机。但是,UPS故障、发电机启动或维护不当以及备用电源系统的其他问题可能会导致托管客户在公用事业停电期间的业务中断。(二)人员。人为错误是数据中心停机的主要原因。示例包括错误配置的路由器、服务器、身份验证系统以及硬件和软件基础设施中可能阻止客户访问系统的其他错误。内部和外部攻击或其他恶意活动(例如拒绝服务攻击)也可能破坏或中断客户托管的工作负载。(3)灾难。客户期望托管数据中心设施更具弹性和可靠性,因此通常希望远离自然灾害(飓风、洪水、地震等)和人为灾害(火灾、车祸和战争)。虽然谨慎的托管措施应该可以降低这种风险,但不可能完全避免和消除可能使托管数据中心设施瘫痪或毁坏的不可预见的灾难。(4)连接。托管服务本质上是远程执行的,WAN或Internet连接对于托管服务提供商至关重要。大多数托管服务提供商允许客户使用一个或多个可用的电信提供商的服务。电信基础设施并不完善,也不是100%可靠,这可能会导致使用某些电信服务的客户的连接中断。在这种情况下,由电信提供商(而不是托管提供商)来恢复服务,但对这些托管客户的影响可能与火灾或洪水一样严重。内部和外部场所故障排除作为托管数据中心客户的组织在解决托管数据中心发生的故障时可能特别具有挑战性,因为问题解决过程首先取决于识别/确定问题,然后确定托管数据中心提供商(或客户)对故障和纠正措施负责。传统托管数据中心例如,假设客户的工作负载在传统托管数据中心设施中运行,托管提供商仅提供空间、电力、冷却和其他服务。如果数据中心设施发生故障(例如停电),客户将依赖托管服务提供商提供电力服务,托管服务提供商将根据服务条款负责查找和纠正电源问题现行服务水平协议(SLA)。根据问题的严重程度,修复过程可能需要数小时甚至数天。但是,客户仍将对部署到托管服务提供商的所有服务器、存储、网络和其他业务设备负责。服务器、存储子系统、网络交换机的故障,甚至应用程序故障(软件错误)都可能是停机的原因。客户将使用系统管理工具来监控和报告硬件和软件的状态,他们有责任定位和解决问题,可能通过重启服务器、更换服务器或其他可能的修复。如果客户确实负责修复,他们将面临完成工作的挑战。修复故障应用程序并对其进行故障排除可以亲自动手,部署人员和执行修复中涉及的实际工作可能需要数小时。在某些情况下,托管服务提供商的员工会在客户支付额外费用的情况下提供协助。托管或托管在托管数据中心或托管场景中,托管提供商提供数据中心空间、服务器、存储、网络和客户从托管提供商租用的其他基础设施。但是,托管提供商对整个基础架构负全部责任,客户不必接触或关注托管提供商的基础架构。如果托管设施或计算资源发生故障,托管提供商必须处理并发出中断通知,然后根据服务水平协议(SLA)中指定的条款排除故障并修复故障。在这种情况下,客户通常会通过已建立的支持渠道(例如电子邮件、电话或门户网站)将故障(例如,应用程序无法正常运行)通知托管服务提供商。如果问题实际上出在客户的应用程序而不是托管提供商的基础设施(即托管数据中心设施正常运行,但客户的应用程序出现崩溃或其他异常),那么托管提供商没有义务确定是否客户的应用程序运行正常。客户必须进行监控以跟踪应用程序运行状况或了解应用程序性能。当应用程序出现问题时,客户的IT团队可以选择远程重启应用程序,或者请求托管服务提供商帮助采取纠正措施。托管数据中心支持的类型当出现问题时,组织必须找到快速且经济高效的方法来解决它们,同时保持行业标准或法规遵从性所需的数据完整性和工作负载安全性。客户可获得四种类型的支持:(1)员工。当客户在托管设施中部署自己的设备时,他们可能会聘请自己的IT人员来管理和维护设备,而不是托管提供商。这有助于确保IT任务的执行符合客户的最大利益,但为他们的员工前往远程托管数据中心可能既费时又费钱。(2)远程控制。客户可以雇用托管服务提供商的员工来协助完成各种IT任务。这些任务可能包括物理设备故障排除、更换、配置。通常在紧急情况或请求的基础上进行远程操作,其费用将添加到客户的每月账单中。(3)远程管理。现代IT系统管理工具擅长通过网络访问硬件设备以执行常见的管理任务。这些工具通常可以重启服务器、重启应用程序、迁移虚拟机以及备份和恢复数据。远程管理在管理日常任务方面非常有效,无需客户派员工到托管数据中心工作。(4)托管服务。托管服务提供商通常会提供客户可以参与的一系列服务,例如托管电子邮件。某些服务费用可能会添加到每月托管费用中,某些服务(例如备份)可能会产生额外费用。但是,托管服务提供商通常会参与添加新服务、更改现有服务或减少或消除不需要的服务。减轻数据中心托管设置中的不确定性托管提供商可能会给客户带来额外的不确定性和复杂性。在偏远地区运营的托管设施可能会受到地缘政治不确定性和安全问题的影响。托管服务提供商管理成本的愿望可能会减少支持人员的数量,从而可能降低他们的响应能力。来自托管服务提供商的合并和请求会影响他们的日常运营。客户可以通过仔细的应急计划和广泛的监控来缓解这些托管问题。常见步骤包括:工作负载适用性。必须评估每个应用程序在托管数据中心的适用性。由于合规性、安全性、性能或其他问题,并非所有应用程序都适合托管。一些工作负载应保留在本地数据中心。遣返。如果托管服务失败或证明托管不适合应用程序,迁移到托管数据中心的每个工作负载都应该有遣返措施,应用程序可以在组织的本地数据中心恢复。备份和灾难恢复。托管工作负载不保证可用性。关键工作负载可能需要对托管服务进行额外投资,以建立备份和灾难恢复框架,以确保应用程序在托管服务中运行时的可用性。默认情况下,托管服务提供商不提供此类服务。详细监控。使用应用程序性能监控和关键工作负载工具等监控工具来跟踪应用程序的运行状况和性能,以及托管提供商及其资源的可用性。了解托管提供商的服务级别协议(SLA)并使用监控结果来验证托管提供商是否遵守服务级别协议(SLA)。请求帮忙。托管服务提供商将提供各种支持服务台。客户应该清楚地了解可以提供哪些帮助、如何请求帮助以及在必要时如何采取行动并及时采取纠正措施。归根结底,托管服务提供商是客户的业务合作伙伴(而非员工),托管服务提供商提供的资源和服务不能想当然。客户负责管理在托管数据中心环境中运行的自己的工作负载,并且需要能够与托管提供商合作以维护每个工作负载的可用性和性能。
