经常有朋友问,MySQL双主的一致性,今天简单说一下。为什么MySQL采用双主架构?MySQL最常见的集群架构是主从同步、读写分离的主从架构。这样可以扩展数据库的读性能,保证读库的高可用,但是此时写库还是单点的。为了保证MySQL写库的高可用,可以在一个MySQL数据库集群中设置两个主库,设置双向同步,以冗余写库的形式保证写库的高可用。MySQL双主架构会存在哪些问题?如果MySQL双主架构同时提供服务,可能会造成数据一致性问题。由于数据同步存在时间差,并发写入可能会导致数据同步失败,导致数据丢失。举个栗子:如上图,假设主库使用autoincrement作为自增主键:两个MySQL主库之间可以通过双向同步来保证主库的高可用;数据库中现有记录主键为1、2、3;主库1插入一条主键为4的记录,同步数据到主库2;在数据同步成功之前,主库2也插入了一条记录。由于数据没有同步成功,插入记录生成的主键也是4,同样同步数据到主库1;主库1和主库2都插入了一条主键为4的记录,双主同步失败,数据不一致;两个主库生成的主键在mysql层面能保证吗?应该没有冲突吧?可以,只需要为两个主库的自增ID设置不同的初值即可;设置相同的增长步长;如上图所示:可以通过两个MySQL主库之间的双向同步来保证主库的高可用;库1的自增初值为1,库2的自增初值为2,增长步长为2;库1插入数据的主键是1/3/5/7,库2的主键是插入数据的主键是2/4/6/8,不冲突;数据双向同步后,两个主数据库将包含所有数据;如上图,两个主库最终会包含1/2/3/4/5/6/7/8的所有数据,即使一个主库宕机,另一个主库也能保证写入的高可用图书馆。上述解决方案取决于数据库的配置。应用程序能否保证数据的一致性?答案是肯定的,应用程序使用统一的ID生成器,保证ID生成不冲突。如上图所示,调用者在插入数据时,也可以通过引入一个全局唯一的ID来解决这个问题,而不是依赖于数据库的自增。画外音:如何生成一个全球唯一的涨势ID,不用扩容。造成不一致的根本原因是保证高可用的两个主要库对外提供了服务。如果只有一个主库对外提供服务,另一个主库平时不提供服务,只有当主库宕机时才提供服务。是否排除上述数据不一致?答案是悲观的,还是不行。使用虚拟IP+keepalived的方式保证数据库主库的高可用。通常只有一个主库提供服务,也可能会出现数据不一致的情况。如上图所示:可以通过两个MySQL主库的双向同步来保证主库的高可用;只有主库1对外提供写服务;两个主库设置相同的虚拟IP,主库1挂掉或网络异常时,虚拟IP会自动漂移,备主库顶上,保证主库高可用;在切换过程中,由于虚拟IP没有变化,切换过程对调用方是透明的,但在极端情况下,仍然可能会出现数据不一致的情况。如上图所示:为两个MySQL主库设置双向同步,可以保证主库的高可用,设置相同的虚拟IP;网络抖动前,主库1向上游提供写服务,插入一条记录,主键为4,数据同步到备主库2;突然主库1网络异常。库2插入了一条记录,生成了一条主键为4的记录,导致数据不一致;有什么办法可以缓解以上问题?虚拟IP漂移,双主同步延迟造成的数据不一致,本质上是需要在双主同步数据后,实现虚拟IP偏移。使用内网DNS检测缓解以上问题:使用内网域名连接数据库,例如:db.kg.org;masterdatabase1和masterdatabase2设置双主同步,不使用同一个虚拟IP,而是分别使用ip1和ip2;一开始db.kg.org指向ip1;使用小脚本轮询ip1主库的连通性;当ip1主库异常时,脚本延时x秒,等待主库2同步数据,然后解析db.kg.org到ip2;应用重连内网域名,自动连接ip2主库,保证数据一致性;画外音:本质上,这是一个可用性和一致性妥协的问题。总结MySQL主库的高可用,主库的一致性,以及一些小技巧:双主同步是保证写库高可用的常用方式;设置相同的步长和不同的初值可以避免自增产生冲突的主键;依托于数据库,业务调用方自己生成一个全球唯一的ID是一个很好的方式;双主保证写库的高可用,只有一个写库提供服务,不能完全保证一致性;可以在主库实现内网DNS检测1出现问题后,延迟一段时间,然后切换主库,保证数据一致性,但是牺牲了几秒的高可用;【本文为专栏作者《58神剑》原创稿件,转载请联系原作者】戳这里,阅读更多本作者好文
