数据中心需要全年不间断运行,提供7*24小时全天候服务。一旦出现中断,势必影响业务,有时成本是按秒计算的。对于一些大型的互联网数据中心来说,几分钟的中断就可以减少上千万的收入,所以他们对数据中心的故障是零容忍的。但是,再好的设备也不可能永远不出问题,尤其是随着运行时间的延长,各种设备开始老化,软件缺陷不断暴露。有各种各样的问题,但是我们可以使用各种冗余设计。及时将业务切换到备机环境,让业务继续运??行,再进行问题排查。问题解决后,切换回业务。切换过程在用户层面是感知不到的,数据中心的各种应用依然可以正常访问。网络设备在数据中心起到设备互联的作用。没有网络就不能称为数据中心,可见网络设备对数据中心的重要性。网络设备在运行过程中也会出现各种问题,往往需要通过软件升级来解决。那么如何不间断地升级网络设备呢?本文将一一讲解。网络设备,尤其是大型网络设备,往往由多块板卡组成,每个问题出现的位置也不一样。借鉴Windows解决问题和打补丁的方式,网络设备也可以打补丁。通过对正在运行的网络设备应用新补丁,可以解决一些软件已知问题。由于打了补丁,大多数情况下不需要重启设备,直接通过补丁替换原程序中有问题的函数,程序就可以调用没有问题的新函数运行,从而解决了问题。这种方法并不总是有效,因为很多功能都是在设备刚启动的时候初始化的,后面无法通过打补丁的方式进行更新修改,所以需要考虑冷打补丁的方式。所谓冷补丁,还是通过补丁。但是原程序无法调用patch中的new函数,patch函数无法生效,所以需要用patch启动,启动时更新初始化函数来解决问题。平时我们在使用电脑的时候,有时在关机的时候,经常会收到“请不要关机,程序正在更新”的提示。这是下载冷补丁的过程。为了解决原有系统程序掉线的问题,所有的冷补丁都是这样加载的。补丁是对原程序的修复,解决原程序运行中出现的各种问题,也是网络设备解决问题??的主要途径。上面说了,并不是所有的补丁都可以做成热补丁,有些问题只能用冷补丁来解决,这显然不能满足数据中心的要求。解决问题需要重启设备,这势必会影响业务。因此,很多网络设备厂商设计了很多服务持续升级的技术,下面将详细介绍。首先,热补丁自然被认为是一种不间断的服务升级技术,也是目前使用最广泛的技术。使用起来简单有效,但是热补丁不能解决所有问题,有很大的局限性。二是升级网络系统的某个流程或功能。比如网络设备的OSFP路由有问题。但是,要解决这个问题,必须对原有的实现功能进行彻底的修改。单纯修改一两个功能根本解决不了问题。此时需要升级OSPF路由进程。.现在大部分网络操作系统都可以支持这种升级,通过杀掉原来的进程,重新启动一个新的进程,其他进程的功能保持不变。这样其他进程的功能就不会受到任何影响。即使影响OSPF进程,也可以先配置静态路由,业务通过静态路由运行,再升级OSPF进程。升级后删除静态路由,继续使用OSPF路由运行服务。通过进程升级的方式,可以在不重启设备的情况下保持设备正常运行。任何过程中的任何问题都可以通过这种方式解决,也可以解决很多热补丁解决不了的问题。第三,网络设备软件的更新速度非常快,大约每年都会出现一个新的软件版本。因此,长期运行的网络设备所使用的软件,与最新的软件版本会有较大差异。新软件通常会解决许多过程和模块问题。这时候通过进程升级是行不通的,只能对软件进行整体升级。这时候就出现了一种叫做持续版本升级的技术。高端网络设备采用双主模式运行,起到数据备份的作用。不间断服务的版本升级正是利用了这一点,可以对主控板进行一个一个的升级,达到更新软件的目的。具体步骤为重启升级备用主控板。由于业务是在主控板上进行的,所以业务不会受到影响。兼容主控板旧软件。然后将业务切换到备用主控板,重启并升级主用主控板的软件,待主用主控板up后,再将业务切换回主用主控板,完成软件版本升级。升级。这个过程实现起来其实非常复杂,尤其是要保证跨度非常大的两个版本是兼容的,主备倒换的时候不影响业务。***,由于网络设备的业务板没有备份,如果业务板有问题,需要在一台设备上完成版本切换。可以将两台功能完全相同的设备虚拟成一台设备进行统一管理。这是当前数据中心网络中主流的技术实现方式,是网络虚拟化的重要组成功能。有了虚拟化,其中任何一个都可以升级,只要在升级前业务切换到其他设备上,就可以升级。在软件方面,还是要保证新旧版本的兼容。本次升级过程中,业务继续正常转发。通过这些不间断升级技术,数据中心网络可以长时间不间断运行。即使发现问题,也可以通过不间断技术及时升级软件。大多数数据中心在大型网络设备之间或数据中心之间没有业务备份,因为这种备份需要大量的资金和人力来维护,这种不间断升级技术得到了数据中心客户的广泛支持。
