ConsistentHashAlgorithm及Java实现

时间：2023-03-15 00:40:14 科技观察

ConsistentHashAlgorithm是麻省理工学院于1997年提出的一种分布式哈希（DHT）实现算法，其设计目标是解决互联网中的热点（Hotspot）。)问题，初衷和CARP很像。一致性哈希纠正了CARP使用的简单哈希算法带来的问题，使分布式哈希（DHT）真正应用于P2P环境。一致性哈希算法针对动态变化的Cache环境下判断哈希算法好坏提出了四种定义：1.平衡：平衡是指哈希结果尽可能的分布到所有的缓存中去，使得所有的缓存空间可以使用。许多哈希算法都可以满足这个条件。2.单调性：单调性是指如果某些内容已经通过哈希分配给相应的缓冲区，则系统会添加一个新的缓冲区。散列的结果应该能够保证原来分配的内容能够映射到原来的或者新的buffer，而不会映射到oldbufferset中的其他buffer。3.传播：在分布式环境中，终端可能看不到所有的缓冲区，而只能看到一部分。当终端要通过哈希过程将内容映射到缓冲区时，不同终端看到的缓冲区范围可能不同，导致哈希结果不一致。最后的结果是相同的内容被不同的终端映射到不同的缓冲区。在缓冲区中。这种情况显然应该避免，因为它会导致相同的内容存储在不同的缓冲区中，降低系统存储的效率。分散定义为上述情况发生的程度。一个好的哈希算法应该能够尽可能避免不一致，也就是尽量减少分散。4、负载：负载问题其实是换个角度看色散问题。由于不同的终端可能将相同的内容映射到不同的缓冲区，因此不同的用户也可能将特定的缓冲区映射到不同的内容。与去中心化一样，这应该避免，所以一个好的哈希算法应该最小化缓冲负载。在分布式集群中，增删机器，或者机器故障后自动退出集群，是分布式集群管理最基本的功能。如果使用常用的hash(object)%N算法，那么一台机器增删改查后，很多原始数据就找不到了，严重违背了单调性原则。下面主要讲解一下一致性哈希算法是如何设计的：环哈希空间按照常用的哈希算法，将对应的key哈希到一个有2^32个桶的空间，即0~(2^32)-1中数空间。现在我们可以将这些数字首尾相接，想象一个闭环。如下图所示，数据经过一定的哈希算法处理后映射到环上。现在我们通过特定的Hash函数计算出object1、object2、object3、object4这四个对象对应的key值，然后散列到Hash环中。如下图所示：Hash(object1)=key1;散列（对象2）=键2；散列（对象3）=键3；哈希（对象4）=键4；分布式中通过hash算法将机器映射到环上集群中新增机器的原理是使用与对象存储相同的Hash算法将机器映射到环上（一般机器的hash计算使用机器的IP或机器的唯一别名作为输入值），然后按顺时针方向计算，将所有对象存储在离你最近的机器中。假设有NODE1、NODE2、NODE3三台机器，通过Hash算法得到对应的KEY值，映射到环上。示意图如下：Hash(NODE1)=KEY1;散列（NODE2）=KEY2；散列（NODE3）=KEY3；从上图可以看出object和machine在同一个hash空间，所以顺时针转object1存放在NODE1，object3存放在NODE2，object2和object4存放在NODE3。在这样的部署环境中，哈希环不会发生变化。因此，通过计算对象的哈希值，可以快速定位到对应的机器，从而找到对象的真实存储位置。机器的删除和添加普通的哈希取余算法最不合适的地方是在机器添加或删除后，大量的对象存储位置将变得无效，这对单调性有很大的不满。让我们分析一下一致性哈希算法是如何工作的。1.节点（机器）的删除以上面的分布为例，如果NODE2出现故障被删除，object3会按照顺时针的迁移方式迁移到NODE3，这样只有object3的映射位置发生了变化，其他object没有变化已更改。如下图：2.添加节点（机器）如果在集群中添加一个新的节点NODE4，通过相应的哈希算法得到KEY4，映射到环上，如下图：通过顺时针迁移的规则，那么object2已经迁移到NODE4，其他object仍然保持原来的存储位置。一致性哈希算法通过对节点的增删分析，保持单调性，同时最小化数据迁移。这样的算法非常适合分布式集群，避免了大量的数据迁移，减轻了服务器的压力。平衡性根据上面的图解分析，一致性哈希算法满足了单调性和负载均衡的特点，也满足了一般哈希算法的去中心化性，但这并不能算是它被广泛应用的原因，因为它缺乏平衡性。下面将分析一致性哈希算法是如何满足平衡的。哈希算法不保证平衡。比如上面只部署了NODE1和NODE3的情况下（删除了NODE2的图片），object1存放在NODE1中，而object2、object3、object4都存放在NODE3中。不平衡状态。在一致性哈希算法中，为了尽可能满足平衡，引入了虚拟节点。——“虚拟节点”（virtualnode）是实际节点（机器）在哈希空间中的副本（replica）。一个实际节点（机器）对应若干个“虚拟节点”，这个对应的编号也成为“副本编号”，“虚拟节点”在哈希空间中按哈希值排列。以上面只部署了NODE1和NODE3的情况（NODE2被删除的图片）为例，之前的对象在机器上分布很不均匀。现在我们以2份（副本数）为例，使得整个哈希环中有4个虚拟节点，***对象映射关系图如下：根据上图映射对象关系：object1->NODE1-1，object2->NODE1-2，object3->NODE3-2，object4->NODE3-1。通过虚拟节点的引入，对象的分布比较均衡。那么在实际操作中，真实对象查询是如何进行的呢？对象从哈希到虚拟节点到实际节点的转换如下：“虚拟节点”的哈希计算可以使用对应节点的IP地址加上数字后缀。例如，假设NODE1的IP地址是192.168.1.100。在引入“虚拟节点”之前，计算缓存A的哈希值：Hash("192.168.1.100");引入“虚拟节点”后，计算“虚拟节点”节点NODE1-1和NODE1-2的哈希值：Hash("192.168.1.100#1");//NODE1-1Hash("192.168.1.100#2");//NODE1-2Java实现：publicclassShard{//S类封装了本机节点的信息，如名称、密码、ip、端口等privateTreeMapnodes;//虚拟节点privateListshards;//真实机器节点privatefinalintNODE_NUM=100;//每个机器节点关联的虚拟节点数publicShard(Listshards){super();this.shards=shards;init();}privatevoidinit(){//初始化一致性哈希环nodes=newTreeMap();for(inti=0;i!=shards.size();++i){//每个真机节点需要关联一个虚拟节点finalSshardInfo=shards.get(i);for(intn=0;ntail=nodes.tailMap(hash(key));//找一个virtual节点沿环顺时针方向if(tail.size()==0){returnnodes.get(nodes.firstKey());}returntail.get(tail.firstKey());//返回虚拟节点对应真机节点信息}/***MurMurHash算法是一种高性能的非加密HASH算法，*与传统的CRC32、MD5、SHA-1相比（这两种算法都是加密的HASH算法，本身复杂度非常高）高，性能损失在所难免)*等HASH算法速度要快很多，据说这种算法的碰撞率很低。*http://murmurhash.googlepages.com/*/privateLonghash(Stringkey){ByteBufferbuf=ByteBuffer.wrap(key.getBytes());intseed=0x1234ABCD;ByteOrderbyteOrder=buf.order();buf.order(ByteOrder.LITTLE_ENDIAN);longm=0xc6a4a7935bd1e995L;intr=47;longh=seed^(buf.剩余()*m);longk;while(buf.remaining()>=8){k=buf.getLong();k*=m;k^=k>>>r;k*=m;h^=k;h*=m;}if(buf.remaining()>0){ByteBufferfinish=ByteBuffer.allocate(8).order(ByteOrder.LITTLE_ENDIAN);//大端版本，dothisfirst://finish.position(8-buf.remaining());finish.put(buf).rewind();h^=finish.getLong();h*=m;}h^=h>>>r;h*=m;h^=h>>>r;buf.order(byteOrder);returnh;}}【本文为专栏作家“王森峰”原创稿件，转载请注明出处】

上一篇：SQL优化极简规则，还有谁不会？_0

下一篇：对Web开发者有用的上传HTML文件的10个技巧

ConsistentHashAlgorithm及Java实现相关文章

世界机器人大会8月开幕，将增设学术交流会及论文集

三星CES2019发布会回顾！新品涉及IoT、智能家居、笔记

Apple Watch定价策略解读及未来假设

2015年上半年可穿戴设备市场分析及趋势解读

苏宁冷链物流触手可及，速度与新鲜尽在掌握！

2015年CES智能硬件8大亮点预览（附品牌及场地）

Apple Watch 一季度出货量 150 万台，不及小米

苹果面临着一项尴尬的任务，智能手表的大规模普及或许要等到明年

小米手环功能分析及购买指南（附产品对比）

企业家被“掏空”，智能硬件虚假普及后会发生什么？

【深度解读】国内智能跑鞋市场现状及趋势分析

解读可穿戴设备热潮背后的征兆以及行业未来的危机

探讨VR-AR医疗发展现状及应用场景

莫博士谈可穿戴设备普及的关键

小米VR眼镜玩具版公布售价49元，参数及功能解读

虚拟现实行业现状及未来发展趋势

2018年智能锁行业现状及发展趋势分析

为什么 Fitbit 和 Apple Watch 不及格？

来自IFA的最新消息！华为智能手表售价及上市时间公布

潜水艇！ 6家水下无人机初创公司及其产品应用

最新推荐

1运营商新挑战：eSIM卡距离普及还有多远？

2迪顶科技newifi雾计算入选“四川省优秀区块链产品及应用案

3激光电视不断升级改进，但现在谈普及还为时过早

4虚拟现实产品需要多长时间才能像智能手机一样普及？

5可穿戴医疗设备的普及将扩大对稀有金属的需求

6可穿戴设备的大麻烦！涉及7个伦理问题？

7健身房行业的颠覆者！微盾技术及其指静脉识别

8华为荣耀零手环售价及上市时间公布

9为了普及VR，就算掏钱也要拼命卖Oculus Rift！

10中国智能穿戴市场规模分析及前景预测

猜你喜欢

1让高通措手不及的是，华为推出了全新的麒麟芯片

2销量不及预期！华硕也想逃离智能手表阵营？

3国家重点发展智能家居及智能家居产业

4超级详细的总结！ 2014年可穿戴设备市场及产业链分析

5【深入】2016年VR行业发展及大事

6斑猫智能安防及智能照明系统解决方案

7酷博科技与迪加全面强强联手，家庭医生服务惠及百万用户

8软与硬的结合！谷歌为何大力推动VR眼镜普及？

9独家对话谷歌眼镜之父！智能眼镜将在15年内普及

10准备爆炸！ 2018年VR头显市场及技术分析

11虚拟现实普及背后，这7个问题需要解决

12能治颈椎病吗？解读VR普及后的尴尬

13华为数字化平台将AI变成“共享经济”，让数字化触手可及

14华为Watch美国购买及开箱体验！真正超越苹果的智能手表

15风火中标耀华街道政务及信息指挥中心建设信息设备及系统采购项目

16可穿戴数据中心及其面临的技术难题

17高通-瑞芯微-三星-意法半导体等厂商VR主控芯片及解决方案汇

18盘点可穿戴设备及智能手环主流供应链厂商

19可穿戴设备普及时代还要多久才能到来？

20移动智能可穿戴设备行业发展现状及趋势