天下武林,唯快不破!运维应急响应,唯快不破!当内外部监管处罚力度以分??钟计算时,应急响应分秒必争!实现快速的应急响应,将危机漂亮地化为英雄,好的架构设计,清晰的处置方式,让你立于不败之地!注意以下是史上最完整的ADG架构和改动,以及处置思路,全部来自实际生产运维的血腥总结!很好的收藏和反复参考价值!1、什么是OracleADG简单来说,ADG是Oracle的一种容灾架构,可以保证在主站点(经常使用RAC架构)出现异常时,应急响应切换到备ADG站点继续提供服务。主备站点之间的距离可以是同一个机房??,同一个数据中心,同一个城市,也可以异地,都可以实现ADG容灾架构。因为ADG往往配置为手动切换,而不是自动切换模式。因此,人工切换的效率直接体现了应急响应的效果!2.OracleADG基本部署架构以负载均衡+应用服务器+OracleRAC(ADG)三层结构为例。基本架构如下图所示。当OracleRAC主库出现问题时,通过failover切换到ADG库继续提供服务。但是只有一个failover命令是不够的,因为在这个过程中,数据库对外服务的地址发生了变化,从原来的主库地址IP1变成了adg的地址IP2。此时前端应用服务器与数据库的连接实际上是失效的,无法对外提供正常的服务。对于数据库的地址,无论是否更改,都会在架构规划上带来相应的变化,下面会一一说明。三、架构规划变更、适用场景变更1、RAC地址和ADG服务地址在同一网段。应急操作思路Failover切换到adg数据库,修改ADG数据库IP2为主库地址IP1,验证业务是否恢复。注意,这种情况下,如果应用服务器支持重连,那么不需要再做任何操作,服务就会恢复正常。如果应用服务器不支持重连操作,则需要重新启动应用服务器。变化2、RAC和ADG在不同网段,RAC和ADG使用同一套应用服务器应急响应操作思路failover切换到ADG库,修改应用服务器数据源,改为adg库IP2的地址重启应用服务器集群连接ADG库验证业务是否恢复需要注意的是,如果应用服务器数量较少,可以快速完成应用服务器的重启,恢复业务。但是,如果应用服务器数量较多,且处于业务高峰期,那么在一个接一个重启应用服务器的过程中,高并发的业务量会压垮重启后的应用服务器,从而导致故障的服务恢复正常。变化3,RAC和ADG在不同网段,各自部署一套应用服务器,用于应急响应操作思路failover切换到ADG数据库业务更改访问地址2验证业务是否恢复注意如果业务人员数量是大,很难一一通知他们改变访问地址,会影响处置效率。变化4,RAC和ADG在不同网段,各自部署一套应用服务器,负载均衡,统一服务访问地址。应急处理操作思路failover切换到ADG库将负载均衡点切换到ADG库的应用服务器集群验证业务是否恢复总结思维导图如下
