大数据生态之zookeeper（原理）-创新互联

1. 集群的角色描述：

目前创新互联公司已为上千的企业提供了网站建设、域名、虚拟空间、绵阳服务器托管、企业网站设计、平湖网站维护等服务，公司将坚持客户导向、应用为本的策略，正道将秉承"和谐、参与、激情"的文化，与客户和合作伙伴齐心协力一起成长，共同发展。

大数据生态之zookeeper（原理）

角色	描述
领导者（leader）	领导者负责进行公布决议，主要处理写请求
跟随者（follower）	Follower用于接收客户端请求并向客户端返回结果（只能处理读请求，如果接收到写请求，将写请求转发给leader），当leader宕机时，发起选主，有投票和被投票权
观察者（observer）	Observer可以接收客户端连接，将写请求转发给leader节点，帮助follower减轻读的压力。但Observer不参加选举和被选举。Observer的目录是为了扩展系统，提高读取速度
客户端	请求发起方

2. zookeeper的选主过程

（1）全新集群的选主：

根据启动的顺序和id进行选主（过半机制：集群中超过半数的集群可使用时，才开始选主）

以hadoop01（id=1）—hadoop02（id=2）---hadoop03（id=3）----hadoop04（id=r）----hadoop05（id=5）为例：

当hadoop01启动时，此时只有它一台服务器，，他发出取的报告没有任何相应，所有它的选举一直是looking状态。
Hadoop02启动：它与最开始启动的hadoop01进行通信，相互交换自己的选举结果，由于两者都没有历史数据，所以id值较大的服务器胜出，但是由于没有达到超过半数以上的服务器同意选举它（这个例子中的半数以上是 3），所有hadoop01、hadoop02还是继续保持looking状态。
Hadoop03启动，根据前面的分析，服务器 3 成为服务器 1,2,3 中的老大，而与上面不同的是，此时有三台服务器(超过半数)选举了它，所Hadoop03它成为了这次选举的 leader
服hadoop04启动，根据上面的分析，理论上，hadoop04应该是服务器中id大的，但是由前面已近有超过半数的服务器选举了hadoop03，所以hadoop04只能是follower
Hadoop05启动，与hadoop04一样，也是follower

zookeeper server的三种工作状态：

LOOKING：当前 Server 不知道 leader 是谁，正在搜寻，正在选举
LEADING：当前 Server 即为选举出来的 leader，负责协调事务
FOLLOWING：leader 已经选举出来，当前 Server 与之同步，服从 leader 的命令

（2）非全新集群的选主

leader 已经选举出来，当前 Server 与之同步，服从 leader 的命令，但是由于某种原因主节点宕机：

此时我们根据三个维度来选主：数据version、serverid、逻辑时钟。

数据version：数据新的version就大，数据每次更新，同时会更新它的version
Serverid：就是我们配置的 myid 中的值，每个机器一个
逻辑时钟：这个值从0开始，每一次选举对应一个值，也就是说，如果在同一次选举中，这个值应该一致，逻辑时钟越大，说明这一次选举leader人的进程更新，也就是每次选举拥有一个 zxid，投票结果只取 zxid 最新的

选举的标准：

逻辑时钟小的选举结果被忽略，重新投票
统一逻辑时钟后数据version大的胜出
逻辑时钟统一，version也相同，，server id 大的胜出。

根据以上的规则，快速选出集群的主节点。

3. zookeeper写数据的流程：

客户端发送写入数据的请求，这个请求最终会被leader处理
leader会先写入数据，写入完成之后通知follower进行数据的同步
follower就会开始进行数据的同步（并行，多台follower并行同步）
每一个follower只要数据同步完成就会向leader发送数据同步成功信息
leader接收到超过半数以上的成功信息后，则认为这次写数据成功
其他节点慢慢进行同步，在数据同步的过程中，不对外提供读写服务

4. zookeeper的数据的同步过程

follower连接leader并发送自己大的zixd
leader进行对比，将自己大的zxid和follower发送过来的zxid进行对比，如果leader的zxid大于follower的，则通知follower进行数据同步
follower发送数据同步请求
leader确定当前的follower的数据同步点（从follower大的zxid到leader大的zxid之间数据需要同步）
follower开始同步数据，这个过程不对外提供读写服务。
follower同步完成，发送消息给leader
leader就会修改当前的follower的状态为update，这个时候follower就可以接受客户端的读写请求，但是只能读，如果是写入请求，需要转发给leader

5. ZooKeeper 中各个角色的工作职责

（1）Leader

恢复数据
维持与follower的心跳，接收follower请求并判断follower的请求消息类型
根据不同的消息类型，进行不同的处理

（2）follower

向leader发送请求（同步数据，写入请求）
接收leader的消息并进行相应的处理
接收client的读写请求，如果是写入的请求转发给leader处理
返回client的读请求，查询的结果

另外有需要云服务器可以了解下创新互联scvps.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

名称栏目：大数据生态之zookeeper（原理）-创新互联
文章链接：http://cqcxhl.com/article/ddcddg.html

重庆分公司，新征程启航

大数据生态之zookeeper（原理）-创新互联

其他资讯