毫无疑问,对于数据中心运维团队来说,机房搬迁是一项艰巨的任务。即便是在数据中心的整个生命周期中,也没有比机房搬迁更艰巨的任务了。从某些角度来看,机房搬迁比初期数据中心的建设和运营更加复杂,风险更大。但是,随着企业业务的增长,机房的整体寿命越来越近,或者仅仅因为某些因素导致机房无法更新,机房的搬迁往往是不可避免的。复杂性或困难不是逃避的理由。如何规划好并圆满完成机房搬迁任务,是IT运维团队的一项必要职责。考虑到现在线上业务的重要性,数据已经成为很多企业的核心资产,机房搬迁的首要任务并不是简单的保证硬件迁移的成功——实际上,硬件迁移的优先级并不高——但要确保“业务连续性”和“数据安全”两大核心目标的顺利实施。机房搬迁的一切规划都需要围绕这两个核心目标进行。本文试图梳理从搬迁准备-搬迁实施-后续处理等角度阐述机房搬迁过程中的诸多环节和关键点,为有此需求的企业和团队提供全面的参考。机房搬迁只有做好前期准备工作才能顺利实施。1制定搬迁计划cationplan搬迁计划是贯穿整个数据中心搬迁从规划到最终成功的总体规划,也是搬迁活动顺利完成的基本保障。搬迁计划不一定是一个,可以是分阶段的多个计划。不一定由IT部门单独制定,可以由包括外包团队在内的多个业务部门共同完成。一份合格的搬迁方案以保障业务连续性和数据安全为核心,应包括以下几个方面:(一)业务连续性和数据安全评估分级处理方案。虽然业务连续性很重要,但机房搬迁难免会造成业务中断。因此,应优先保障重点业务的连续性,对无法线上迁移的业务和非重点业务,考虑线下处理方案。对于系统数据,应制定详细的备份方法和备份时间计划。另外,系统和业务的依赖关系、工作量安排、网络割接的实施等,在这个环节也要充分考虑。需要注意的是,新旧机房的网络拓扑和网络配置不一定一致,需要提前制定相应的规划。(2)承担机房规划方案。若搬迁至租赁的IDC机房,需根据业务需求对机房空间、制冷、供电、安全措施等进行全面考察,提前规划IT设备布局根据实际情况。另外,IDC机房的地理位置也很重要,影响运维工程师实现现场运维的及时性。如果搬迁到自己的机房,则需要对制冷、供电、网络、安全措施等进行前期完善部署。(3)硬件设备迁移计划。制定详细的设备清单、停机流程、搬迁顺序、搬迁后的设备布置表和人员安排,并制定完整的拆装工具配置和设备运输计划。与业务连续性相比,硬件设备的迁移应该有所取舍,在成本控制的范围内进行简化。(4)搬迁前后的试验计划。搬迁前,需要对系统环境和业务流程进行全面测试。无论是线上业务的延续,还是搬迁后软硬件的重新部署,都需要制定有效的计划。迁移后,需要对新环境进行全面测试,涉及所有业务部门。重点是与搬迁前的系统容量进行对比,尤其是峰值处理容量、弹性容量等。(五)应急预案。应急的关键还是要提前准备。故障可能发生在硬件、系统、网络等多个环节,必须做好应急预案。如果可能,可以提前准备好临时设备和备用系统。同时,应对应急体系的有效性进行测试验证。2新机房的准备工作在确认新机房的制冷、供电、安保等基础设施没有问题后,就要进行搬迁的准备工作。(1)确认设备布置。提前规划机柜、网络设备、配电设备的摆放位置,规划搬运、运维、扩容、安装过程的空间,确保搬迁顺利进行。(2)提前准备好综合布线。布线工作尽量在搬迁前安排好,并做好全面的布线点位表。需要提前测试电源和网络,以确保可以立即使用。(3)新旧机房网络互联。在线业务迁移需要稳定的网络支持。需要提前测试机房网络的速度和稳定性,有条件的可以租用专线。(4)服务器部署。对于一些在线迁移的核心业务,需要提前部署服务器。3备份工作备份时间应尽可能接近停机时间,有条件的应提供两个独立的备份,以防止搬迁过程中发生意外。4、分工与沟通数据中心由IT部门运维,但其业务负荷与企业各部门密切相关。要完成业务的顺利迁移,需要与各相关业务部门充分沟通,听取意见,并邀请相关人员配合。根据业务部门的反馈,IT部门需要对搬迁方案进行相应的调整和优化。每个部门都应该是搬迁过程中的参与者,而不是被动的接受者。搬迁工作需要提前分工,分小组、分个人负责。搬迁要统一指挥,各组人员也要记住过程,对结果负责。搬迁实施5搬迁时间的确认和通知IT部门要给出明确的搬迁时间和期限,各业务部门要根据搬迁时间和流程妥善处理业务,外部业务要做好沟通与客户。只有在公司内部使用的业务系统才可以考虑在周末和节假日搬迁。对于持续对外访问的业务系统,可以考虑夜间搬迁。6.业务宕机为保证业务的连续性,业务应尽可能在线上迁移。通过建立稳定的网络链接,将系统、应用程序和数据迁移到新服务器以减少停机时间的影响。需要关机迁移的业务,必须严格按照计划执行,确保备份成功后按照关机步骤关机,确认服务器关机后断电断网.禁止在断电、断网前自行拆卸IT硬件。7硬件拆装和运输拆装和运输是机房搬迁中硬件丢失风险最大的环节。如果需要拆卸运输大量设备,最好聘请专业的IT设备运输公司来处理。尤其是服务器的包装堆放,更需要咨询服务器厂商确认,以免因震动、挤压、静电等原因造成不必要的损失。在拆卸、装卸、安装过程中,要做好设备的标识、标识工作,并派专人对设备进行登记和检查。在进行下一步之前,需要对每个链接进行计数。8设备上电及测试按照设备布局表布置好服务器、网络设备、配电设备等硬件后,连接线缆和网线,为设备上电,保证各业务系统的启动。IT运维团队和各业务部门按计划进行系统恢复和业务上线测试,包括供电稳定性、网络稳定性、服务器状态、数据完整性、业务可用性等。对于重要的第三方系统和应用,应提前与供应商沟通,协同测试和调整。后续工作搬迁工作的完成,各业务系统的正常运行,对于IT团队来说,只是一个新的开始。9新的运维系统因为在搬迁的过程中,服务器配置、网络设置、硬件设备都会发生一定的变化。新环境的运维系统。10设备的再利用和回收IT硬件设备是公司的重要资产。状况良好的旧设备可以继续在线使用,部分可以作为备用设备使用。对于已达到使用寿命或性能不能满足新要求的设备,应考虑报废回收。目前市场上已有非常成熟的IT设备回收系统,可以帮助企业实现废旧设备的变现变现。企业在回收废旧设备的过程中,一定要做好数据安全工作。尤其是服务器和其他包含硬盘和其他记录介质的产品。目前,服务器回收产业链比较完整。有的服务器翻新后会转卖,有的服务器拆解回收的时候也会考虑一些硬盘二次利用。但简单的删除或格式化并不能彻底擦除数据,硬盘购买者通过技术手段恢复数据的可能性始终存在。因此,需要反复读写硬盘,以免数据被盗。如果对保密性要求较高,应将硬盘物理销毁后再回收。
