当前位置: 首页 > 科技观察

分布式锁用Redis还是Zookeeper?_1

时间:2023-03-19 23:48:21 科技观察

为什么要用分布式锁?在讨论这个问题之前,我们先来看一个业务场景。图片来自Pexels为什么要使用分布式锁?系统A是电子商务系统,目前部署在一台机器上。系统中有用户下单的接口,但用户在下单前必须先查看库存,确保库存充足后才能为用户下单。由于系统具有一定的并发性,商品的库存会提前保存在Redis中,用户下单时会更新Redis的库存。此时的系统架构如下:但这会造成一个问题:如果在某个时刻,Redis中某商品的库存为1,此时有两个请求同时过来,其中一个是requests执行到上图中的第3步,更新后的数据库库存为0,但第4步还没有执行。而另一个请求执行到第2步,发现库存还是1,继续执行第3步,结果卖了2件,但实际上库存只有1件。显然错了!这是一个典型的库存超卖问题。至此,我们很容易想到一个解决方案:将步骤2、3、4用一把锁锁住,这样它们执行完之后,另一个线程就可以进来执行步骤2了。根据上图,在执行步骤时2、使用Java提供的Synchronized或者ReentrantLock进行加锁,执行完第4步后释放锁。这样,2、3、4这三个步骤就被“锁定”了,多个线程只能串行执行。但是好景不长,整个系统的并发量飙升,一台机器都搞不定了。现在添加一台机器,如下图:添加机器后,系统变成如上图,天哪!假设两个用户的请求同时到达,但是落在了不同的机器上,这两个请求是不是可以同时执行,或者会不会出现库存超卖的问题。为什么?因为上图中的两个A系统运行在两个不同的JVM中,所以它们加的锁只对自己JVM中的线程有效,对其他JVM中的线程无效。所以,这里的问题是:Java提供的原生锁机制在多机部署场景下失效,因为两台机器加的锁不是同一个锁(两个锁在不同的JVM)。那么,只要保证两台机器加的锁是同一把锁,问题不就解决了吗?至此,分布式锁就该隆重登场了。分布式锁的思想是:在整个系统中提供一个全局唯一的“东西”去获取锁,然后各个系统在需要加锁的时候会去向这个“东西”去获取锁,这样不同systems得到的可以认为是同一个锁。至于这个“东西”,可以是Redis,也可以是Zookeeper,也可以是数据库。文字描述不是很直观,我们看下图:通过上面的分析,我们知道在分布式部署系统的情况下使用Java原生的锁机制,在超卖库存场景下是无法保证线程安全的,所以我们需要使用分布式锁方案。那么,如何实现分布式锁呢?然后往下看!基于Redis实现分布式锁上面分析了为什么要使用分布式锁。这里我们就具体看看分布式锁落地的时候应该怎么处理。①一种常见的解决方案是使用Redis作为分布式锁。使用Redis作为分布式锁的思路大致是这样的:在Redis中设置一个值表示加锁,然后在释放锁的时候删除Key。具体代码如下://获取锁//NX表示key不存在则成功,key存在则返回false。说明,这两条指令不是原子的//需要使用redis的lua脚本支持特性,redis执行lua脚本是原子的ifredis.call("get",KEYS[1])==ARGV[1]thenreturnredis.call("del",KEYS[1])elsereturn0end这个方法有几个关键点:一定要使用SET键值NXPX毫秒命令。如果没有,先设置值,再设置过期时间。这不是一个原子操作,在设置过期时间之前可能会崩溃,从而造成死锁(Key***存在)。值必须是唯一的。这是因为在解锁的时候,在删除Key之前需要验证Value和被锁的一致。这时候就避免了一种情况:假设A获得了锁,过期时间为30s。35s后,锁已经自动释放,A去释放锁,但是此时B可能获取到锁。客户端A无法删除B的锁。除了考虑客户端如何实现分布式锁,还需要考虑Redis的部署。Redis有三种部署方式:单机模式Master-Slave+Sentinel选举模式RedisCluster模式使用Redis作为分布式锁。缺点是如果采用单机部署方式,会出现单点问题,只要Redis失效。锁定将不起作用。使用Master-Slave模式,加锁时只有一个节点被加锁。即使通过Sentinel实现高可用,如果Master节点出现故障,发生主从切换,此时也可能会出现锁丢失的问题。基于以上考虑,Redis的作者也考虑到了这个问题,他提出了RedLock算法。这个算法的意思大概是这样的:假设Redis的部署方式是RedisCluster,一共有5个Master节点。通过以下步骤获取锁:获取当前时间戳,单位为毫秒。尽量在每个Master节点上依次创建锁,并且过期时间设置得短一些,一般为几十毫秒。尝试在大多数节点上建立锁,比如5个节点需要3个节点(n/2+1)。客户端计算建立锁的时间。如果建立锁的时间小于超时时间,则建立成功。如果加锁失败,则依次删除加锁。只要别人创建了分布式锁,你就得不停地轮询来尝试获取锁。不过这样的算法还是比较有争议的,可能还会有很多问题,并且不能保证加锁过程一定是正确的。②另一种方式:Redisson另外要实现Redis的分布式锁,除了基于RedisClient原生API实现外,还可以使用开源框架:Redission。Redisson是一个企业级开源的RedisClient,同样提供分布式锁的支持。我也非常推荐大家使用,为什么呢?回想一下我上面说的,如果我写代码通过Redis设置一个值,是通过下面的命令来设置的:SETanyLockunique_valueNXPX30000这里设置的超时时间是30s,如果超过30s还没有完成业务逻辑,Key就会过期,其他线程可能会获取锁。这样一来,第一个线程还没有执行完业务逻辑,第二个线程进来的时候也会出现线程安全问题。所以还是要维护这个过期时间,太麻烦了~来看看Redisson是怎么实现的吧?先感受下使用Redission的爽快:Configconfig=newConfig();config.useClusterServers().addNodeAddress("redis://192.168.31.101:7001").addNodeAddress("redis://192.168.31.101:7002")。addNodeAddress("redis://192.168.31.101:7003").addNodeAddress("redis://192.168.31.102:7001").addNodeAddress("redis://192.168.31.102:7002").addNodeAddress("redis://192.168.31.102:7003");RedissonClientredisson=Redisson.create(config);RLocklock=redisson.getLock("anyLock");lock.lock();lock.unlock();就这么简单,我们只需要通过其API中的Lock和Unlock可以完成分布式锁,帮助我们考虑了很多细节:Redisson的所有指令都是通过Lua脚本执行的,Redis支持Lua脚本的原子执行。Redisson设置Key的默认过期时间为30s。如果客户端持有锁超过30s怎么办?Redisson中有一个Watchdog的概念,翻译过来就是看门狗,它会在你获取到锁后每隔10s帮你设置Key超时时间为30s。这样即使一直持有锁,也不会出现Key过期其他线程获取锁的问题。Redisson的“看门狗”逻辑确保不会发生死锁。(如果机器宕机,看门狗也会宕机。此时Key的过期时间不会延长,30s后会自动过期,其他线程可以获取锁)下面是它的一点实现代码://加锁逻辑privateRFuturetryAcquireAsync(longleaseTime,TimeUnitunit,finallongthreadId){if(leaseTime!=-1){returntryLockInnerAsync(leaseTime,unit,threadId,RedisCommands.EVAL_LONG);}//调用lua脚本,设置一些key,过期时间RFuturettlRemainingFuture=tryLockInnerAsync(commandExecutor.getConnectionManager().getCfg().getLockWatchdogTimeout(),TimeUnit.MILLISECONDS,threadId,RedisCommands.EVAL_LONG);ttlRemainingFuture.addListener(newFutureListener(){@OverridepublicvoidoperationComplete(未来未来)throwsException{if(!future.isSuccess()){return;}LongttlRemaining=future.getNow();//lockacquiredif(ttlRemaining==null){//看门狗逻辑scheduleExpirationRenewal(threadId);}}});returnttlRemainingFuture;}RFuturetryLockInnerAsync(longleaseTime,TimeUnitunit,longthreadId,RedisStrictCommand命令){internalLockLeaseTime=unit.toMillis(leaseTime);returncommandExecutor.evalWriteAsync(getName(),LongCodec.INSTANCE,command,"if(redis.call('exists',KEYS[1])==0)then"+"redis.call('hset',KEYS[1],ARGV[2],1);"+"redis.call('pexpire',KEYS[1],ARGV[1]);"+"returnnil;"+"end;"+"if(redis.call('hexists',KEYS[1],ARGV[2])==1)then"+"redis.call('hincrby',KEYS[1],ARGV[2],1);"+"redis.call('pexpire',KEYS[1],ARGV[1]);"+"returnnil;"+"end;"+"returnredis.call('pttl',KEYS[1]);",Collections.singletonList(getName()),internalLockLeaseTime,getLockName(threadId));}//看门狗最终会在这里调用privatevoidscheduleExpirationRenewal(finallongthreadId){if(expirationRenewalMap.containsKey(getEntryName())){return;}//这个任务会延迟10sexecutionTimeouttask=commandExecutor.getConnectionManager().newTimeout(newTimerTask(){@Overridepublicvoidrun(Timeouttimeout)throwsException{//这个操作会将key过期时间重置为30sRFuturefuture=renewExpirationAsync(threadId);future.addListener(newFutureListener(){@OverridepublicvoidoperationComplete(Futurefuture)throwsException{expirationRenewalMap.remove(getEntryName());if(!future.isSuccess()){log.error("Can'tupdatelock"+getName()+"expiration",future.cause());return;}if(future.getNow()){//rescheduleitself//递归调用该方法延长过期时间scheduleExpirationRenewal(threadId);}}});}},internalLockLeaseTime/3,TimeUnit.MILLISECONDS);if(expirationRenewalMap.putIfAbsent(getEntryName(),newExpirationEntry(threadId,task))!=null){task.cancel();}}另外,Redisson也提供对Redlock算法的支持,其用法也很简单:RedissonClientredisson=Redisson.create(config);RLocklock1=redisson.getFairLock("lock1");RLocklock2=redisson.getFairLock("lock2");RLocklock3=redisson。getFairLock("lock3");RedissonRedLockmultiLock=newRedissonRedLock(lock1,lock2,lock3);multiLock.lock();multiLock.unlock();总结:本节分析具体实现使用Redis作为分布式锁的ion方案及其一些局限性,然后介绍R的Redis客户端框架edisson,这个是我推荐大家用的。会比自己写代码省心。很多细节都是基于Zookeeper来实现分布式锁。在常见的分布式锁实现方案中,除了使用Redis来实现外,还可以使用Zookeeper来实现分布式锁。锁。在介绍Zookeeper(以下用ZK代替)实现分布式锁的机制之前,先简单介绍一下ZK是什么:ZK是一个提供配置管理、分布式协作、命名的中心化服务。ZK模型是这样的:ZK包含一系列称为Znodes的节点,就像一个文件系统,每个Znode代表一个目录。那么Znode有一些特性:有序节点:如果当前有一个父节点为/lock,我们可以在这个父节点下创建一个子节点,ZK提供了一个可选的有序特性。比如我们可以创建一个子节点“/lock/node-”并指定顺序,那么ZK在生成子节点的时候会自动根据当前子节点的个数加上一个整数序号。也就是说,如果是第一个创建的子节点,则生成的子节点为/lock/node-0000000000,下一个节点为/lock/node-0000000001,以此类推。临时节点:客户端可以创建一个临时节点,ZK会在会话结束或会话超时后自动删除该节点。事件监听:在读取数据的时候,我们可以同时在节点上设置事件监听。当节点数据或结构发生变化时,ZK会通知客户端。目前ZK有以下四种事件:节点创建节点删除节点数据修改子节点更改,每个线程通过在ZK中创建临时有序节点获取锁,比如在/lock/目录下。节点创建成功后,获取/lock目录下的所有临时节点,然后判断当前线程创建的节点是否是所有节点中序号最小的节点。如果当前线程创建的节点是所有节点中序号最小的节点,则认为获取锁成功。如果当前线程创建的节点不是所有节点中序号最小的节点,则在该节点序号的前一个节点上添加事件监听器。比如当前线程获取到的节点序号是/lock/003,那么所有节点的列表就是[/lock/001,/lock/002,/lock/003],那么在节点/锁/002。如果锁被释放,它会唤醒下一个序号的节点,然后重新执行步骤3,判断自己的节点序号是否最小。比如/lock/001被释放,/lock/002监控时间。此时节点集合为[/lock/002,/lock/003],则/lock/002为序号最小的节点,获得锁。整个过程如下:具体实现思路是这样的。至于代码怎么写,比较复杂,这里就不贴了。Curator介绍Curator是ZK开源的客户端,同样提供了分布式锁的实现。它的用法也比较简单:InterProcessMutexinterProcessMutex=newInterProcessMutex(client,"/anyLock");interProcessMutex.acquire();interProcessMutex.release();实现分布式锁的核心源码如下:privatebooleaninternalLockLoop(longstartMillis,LongmillisToWait,StringourPath)throwsException{booleanhaveTheLock=false;booleandoDelete=false;try{if(revocable.get()!=null){client.getData().usingWatcher(revocableWatcher).forPath(ourPath);}while((client.getState()==CuratorFrameworkState.STARTED)&&!haveTheLock){//获取当前所有节点的排序集合Listchildren=getSortedChildren();//获取当前节点的名称StringsequenceNodeName=ourPath.substring(basePath.length()+1);//+1toincludetheslash//判断当前节点是否为最小节点else{//没有获取到锁,为当前节点的前一个节点注册一个监听器StringpreviousSequencePath=basePath+"/"+predicateResults.getPathToWatch();同步(这个){统计=client.checkExists().usingWatcher(watcher).forPath(previousSequencePath);if(stat!=null){if(millisToWait!=null){millisToWait-=(System.currentTimeMillis()-startMillis);startMillis=System.currentTimeMillis();if(millisToWait<=0){doDelete=true;//timedout-deleteournodebreak;}wait(millisToWait);}else{wait();}}}//elseitmayhavebeendeleted(i.e.lockreleased).Trytoacquireagain}}}catch(Exceptione){doDelete=true;throwe;}finally{if(doDelete){deleteOurPath(ourPath);}}returnhaveTheLock;}其实Curator实现分布式锁的底层原理和上面分析的差不多。这里我们用一张图来详细描述一下它的原理:总结:本节介绍了ZK实现分布式锁的方案和ZK开源客户端的基本使用,并简单介绍了它的实现原理。两种方案的优缺点对比在学习了分布式锁的两种实现方案后,本节需要讨论一下Redis和ZK的实现方案各自的优缺点。对于Redis的分布式锁,它有以下缺点:获取锁的方式简单粗暴。如果获取不到锁,它会继续尝试获取锁,这会消耗性能。也就是说,Redis的设计定位决定了它的数据不是强一致的,在某些极端情况下,可能会出现问题。锁模型不够健壮。即使使用Redlock算法来实现,在一些复杂的场景下,也不能保证其实现100%没有问题。有关Redlock的讨论,请参阅如何进行分布式锁定。Redis分布式锁,其实是需要不断尝试获取锁,比较消耗性能。但另一方面,使用Redis实现分布式锁在很多企业中非常普遍,大多数情况下不会遇到所谓的“极其复杂的场景”。因此,使用Redis作为分布式锁也是一个很好的解决方案。最重要的一点是Redis具有高性能,可以支持高并发的获取和释放锁操作。对于ZK分布式锁:ZK天然的设计定位是分布式协同和强一致性。锁模型健壮,易于使用,适用于分布式锁。如果拿不到锁,只需要加一个监听器,不用一直轮询,性能消耗小。但是ZK也有缺点:如果更多的客户端频繁的申请锁和释放锁,ZK集群的压力会更大。总结:综上所述,Redis和ZK各有优缺点。我们可以将这些问题作为技术选型的参考因素。一些建议根据前面的分析,实现分布式锁的两种常见方案:Redis和ZK,各有优缺点。我该如何选择?个人更喜欢ZK实现的锁:因为Redis可能存在隐患,可能导致数据不正确。但是,如何选择取决于公司的具体场景。如果公司有ZK集群条件,优先选择ZK实现,但如果公司只有Redis集群,没有条件搭建ZK集群。那么就可以用Redis来实现了。另外,系统设计者可能在系统已经有了Redis,又不想再引入一些外部依赖的情况下选择Redis。这是系统设计人员根据架构来考虑的。中华石山:十余年BAT架构经验,一线互联网公司技术总监。带领数百人团队开发过亿级大流量高并发系统。多年工作积累的研究手稿和经验总结,现整理成文,一一传授。微信公众号:石山的建筑笔记(ID:shishan100)。