《从Paxos到Zookeeper》——第四、七章:基本概念及原理

目录

第四章 Zookeeper与Paxos

4.1 Zk是什么

4.1.1 Zk特性

4.1.2 Zk基本概念

4.1.2.1 集群角色(Follower, Leader, Observer)

4.1.2.2 数据模型

4.1.2.3 ZNode(数据节点)

4.1.2.4 Session(会话)

4.1.2.5 ACL(Access Control Lists)

4.1.2.6 Watcher(事件监听器)

4.2 ZAB协议

第七章 Zookeeper技术内幕

7.1 系统模型

7.1.1 数据模型

7.1.2 节点特性

7.1.2.1 节点分类

7.1.2.2 节点数据

7.1.3 版本(version、cversion、aversion)

7.1.4 Watcher——数据更变的通知

7.1.5 ACL——保障数据的安全

本章重点:

  • 集群角色(Follower, Leader, Observer)
  • ZNode:持久/临时 + 顺序
  • 版本:version、cversion、aversion
  • Watcher机制
  • ACL权限管理机制

第四章 Zookeeper与Paxos

4.1 Zk是什么

  • 2010年11月正式成为 Apache 顶级项目

  • Zk是一个分布式数据一致性的解决方案,提供了高效且可靠的分布式协调服务。

    • 应用程序可以基于它实现诸如数据发布/订阅,负载均衡,统一命名服务,分布式协调通知,配置管理,分布式锁,分布式锁等分布式的基础服务(第六章会详细提及)

  • ZooKeeper 并没有直接采用 Paxos 算法,而是采用了名为 ZAB(Zookeeper Atomic Broadcast) 的一致性协议

4.1.1 Zk特性
  • 顺序一致性:所有客户端看到的服务端数据模型都是强一致的;从一个客户端发起的事务请求,最终都会严格按照其发起顺序被应用到 ZooKeeper 中(可见下文:原子广播)

  • 原子性:所有事务请求的处理结果在整个集群中所有机器上的应用情况是一致的,即整个集群要么都成功应用了某个事务,要么都没有应用(可见下文:事务)

  • 单一视图:无论客户端连接的是哪个 Zookeeper 服务器,其看到的服务端数据模型都是一致的

  • 高性能:ZooKeeper 将数据全量存储在内存中,所以其性能很高。需要注意的是:由于 ZooKeeper 的所有更新和删除都是基于事务的,因此 ZooKeeper 在读多写少的应用场景中有性能表现较好;如果写操作频繁,性能会大大下滑

  • 高可用:ZooKeeper 的高可用是基于副本机制实现的,此外 ZooKeeper 支持故障恢复(可见下文:选举 Leader)

4.1.2 Zk基本概念
4.1.2.1 集群角色(Follower, Leader, Observer)
  • 没有沿用Master / Slave概念,引入Follower, Leader, Observer三种角色

角色

职责

Leader

  • 读写:

    • 提供读写服务:只有Leader会处理集群中所有的写请求,保证数据的一致性

  • 负责维护着系统的最新状态,发起并维护与各 Follwer 及 Observer 间的心跳,并负责将状态变更同步给Follower和Observer节点

  • 所有的写操作必须要通过 Leader 完成再由 Leader 将写操作广播给其它服务器

  • 一个 Zookeeper 集群同一时间只会有一个实际工作的 Leader

Follower

  • 提供读服务;接受写请求,但不能直接处理,而需要将写请求转发给 Leader 处理

  • 响应 Leader 的心跳

  • 将写请求转发给 Leader 处理,并且负责在 Leader 处理写请求时对请求进行投票

Observer

  • 提供读服务;接受写请求,但不能直接处理,而需要将写请求转发给 Leader 处理

  • 响应 Leader 的心跳

  • 不参与投票

4.1.2.2 数据模型
  • ZooKeeper 的数据模型是一个树形结构的文件系统(ZNode Tree),树中的节点被称为 ZNode。每个节点上都可以保存数据,并挂上子节点

  • 模型的根节点为 /

  • 节点由斜杠(/)进行分割路径,例如/foo/path1

4.1.2.3 ZNode(数据节点)
  • ZNode 通过路径被引用,ZNode 节点路径必须是绝对路径

  • 每个ZNode上都会保存自己的数据内容,及一系列属性信息,大小被限制在 1MB 以内

  • ZNode 两种类型

    • 临时节点(EPHEMERAL)生命周期和客户端会话绑定,会话失效后,这个客户端创建的所有临时节点都会被删除

    • 持久节点(PERSISTENT):持久节点一旦被创立,除非客户端主动删除,否则会一直存在 ZooKeeper 上

  • ZNode 属性

    • SEQUENTIAL:ZNode 上还有一个特殊属性 (SEQUENTIAL,也称顺序标志)。如果在创建 ZNode 时,设置了SEQUENTIAL,那么 ZooKeeper 会使用计数器为该ZNode的节点名后面添加一个单调递增的整型数字(该数字由父节点维护),即 zxid。ZooKeeper 正是利用 zxid 实现了严格的顺序访问控制能力

    • Stat(版本):Zk为每个ZNode维护了一个叫Stat的数据结构,里面记录了这个ZNode的三个数据版本,分别是version(当前ZNode的版本),cversion(当前ZNode子节点的版本),aversion(当前ZNode的ACL版本)

4.1.2.4 Session(会话)
  • 在Zk中,客户端启动时,首先通过一个 TCP 长连接连接到 ZooKeeper 服务集群,端口默认2181

  • Session 从第一次连接开始就已经建立,之后客户端通过心跳检测机制来与服务端保持有效的会话状态。通过这个连接,客户端可以发送请求并接收响应,同时也可以接收到 Watch 事件的通知。

  • 一旦客户端与一台服务器建立连接,这台服务器会为这个客户端创建一个新的会话。每个会话都会有一个超时时间,若服务器在超时时间内没有收到任何请求,则相应会话被视为过期(这段时间内如果连回来了仍视为有效)一旦会话过期,就无法再重新打开,且任何与该会话相关的临时 ZNode 都会被删除

4.1.2.5 ACL(Access Control Lists)

ZooKeeper 采用 ACL策略来进行权限控制。Zk定义了5种权限,每个 ZNode 创建时都会带有一个 ACL 列表,用于决定谁可以对它执行何种操作

  • CREATE:允许创建其子节点

  • READ:允许从节点获取数据并列出其子节点

  • WRITE:允许为节点设置数据

  • DELETE:允许删除其子节点

  • ADMIN:允许为节点设置权限

ACL 依赖于 ZooKeeper 的客户端认证机制。ZooKeeper 提供了以下几种认证方式

  • digest: 用户名和密码 来识别客户端

  • sasl:通过 kerberos 来识别客户端

  • ip:通过 IP 来识别客户端

4.1.2.6 Watcher(事件监听器)
  • Watcher(事件监听器)是Zk的一个重要特性。Zk允许用户在指定ZNode上注册一些Watcher,并在特定事件触发时,Zk服务端会将事件通知到注册的客户端。该机制是Zk实现分布式协调服务的重要特性。

4.2 ZAB协议

全称Zookeeper Atomic Broadcast(原子消息广播协议),与Paxos算法类似。比较复杂,不赘述。


第七章 Zookeeper技术内幕

7.1 系统模型

介绍五方面:数据模型、节点特性、版本、Watcher、

7.1.1 数据模型
  • 树:ZooKeeper 的数据模型是一个树形结构的文件系统(ZNode Tree),树中的节点被称为 ZNode,每个节点上都可以保存数据,并挂上子节点

  • 事务ID

    • 在Zk中,事务是指能改变服务器状态的操作。一般包括节点创建,节点删除,节点内容更新,客户端会话创建,客户端会话失效 等操作

    • 对于每一个事务请求,Zk会为其分配一个全局事务ID,用ZXID表示,通常是64位数字。每一个ZXID对应一次更新操作,可以根据值识别出各个操作的执行顺序

7.1.2 节点特性
7.1.2.1 节点分类

在Zk中,节点类型可以分为三类:持久节点(P),临时节点(E),顺序节点(S)节点有以下特性

节点特性

备注

默认

持久(P) / 临时(S)

必选,二选一

持久(P)

顺序(S)

是 / 否

非顺序

具体在节点的创建过程中,通过组合使用,可以生成以下四种组合型节点类型

  • 持久节点(Persistent):被创建后一直存在于服务器上,直至被删除操作主动清除。最常见的节点。

  • 持久顺序节点(Persistent_Sequential):在创建节点时可以设置这个标记,则每个父节点会维护其子节点的先后顺序。即在创建过程中,自动为节点加上一个数字后缀,作为节点名,上限是Integer.MAX

  • 临时节点(Ephemeral)

    • 临时节点的生命周期与客户端会话Session绑定在一起,会话失效,则节点被自动清理

    • Zk规定了不能基于临时节点来创建子节点,即临时节点只能是叶子节点

  • 临时顺序(Ephemeral_Sequential):在临时节点的基础上,添加了顺序的特性

7.1.2.2 节点数据

节点的存储包含两部分

  • 用户写入节点的数据内容

  • 节点自身的一些状态信息,这些状态信息存在Stat的结构体中,包括事务ID、版本信息、子节点个数

7.1.3 版本(version、cversion、aversion)
  • Zk为数据节点引入了版本version的概念,Zk中每个数据节点都有三类版本号,对节点的任何操作都会引起这三个版本号的变化

    • version:当前数据节点数据内容的修改次数

    • cversion:当前数据节点子节点的修改次数

    • aversion:当前数据节点ACL更变的修改次数

  • 以version为例

    • 节点第一次创建时,version=0;对数据内容更变后,version=1

    • 需要注意的是,即使前后的数据内容没变,version依然会变,version强调的是更变次数

  • Zk设计version的目的:基于CAS乐观锁的思想进行更新

    • 从源码来看,request里会带上请求的version,Zk服务端处理request时会校验version

      • request中的version=-1:表示客户端不要求使用乐观锁,因此会忽略版本对比;

      • request中的version!=-1:表示客户端要基于乐观锁更新

        • Zk服务端会比较请求的version和当前节点的currentVersion,一致则更新,不一致就抛异常

7.1.4 Watcher——数据更变的通知
  • 在Zk中,引入了Watcher来实现分布式数据的发布/订阅功能,整体通知如下

    • ①客户端向Zk服务器注册Watcher,并将Watcher存储在自身的WatcherManager中

    • ②Zk服务器触发Watcher事件后,向客户端发送通知

    • ③客户端线程从WatcherManager中取出对应的Watcher对象,执行回调逻辑

  • 整体代码与逻辑:不罗列了

  • Watcher特性总结如下

    • 一次性:一旦一个Watcher被触发,Zk会将其移除。因此开发者需要反复注册。这种设计有利于减轻服务端压力

    • 客户端串行执行:客户端Watcher回调是一个串行同步的过程,因此保证了顺序

    • 轻量:Watcher通知非常轻量,只会告诉客户端发生了某种事件,不会传达事件详情。这点需要客户端收到事件后主动重新拉取。有利于网络和内存开销

7.1.5 ACL——保障数据的安全
  • ACL的重要性:通过ACL(Access Control List)权限控制机制保障数据的安全

  • ACL介绍:可以从三方面理解该机制:权限模式(Scheme),授权对象(ID),权限(Permission),通常使用 "scheme:id:permission" 来标识一个有效的ACL信息

  • 权限模式(Scheme):权限验证过程中使用哪个策略,开发人员使用最多的是以下四种权限

    • IP:针对IP地址维度进行控制

      • 例1:"ip:192.168.0.110":表示控制权限只针对这个IP

      • 例2:"ip:192.168.0.1/24":表示针对192.168.0.*这个IP段进行权限控制

    • Digest:最常用的,类似于"username:password"的形式

      • Zk会对其进行编码,将这种形式编码成无法辨识的字符串,避免明文

    • World:开放者模式,不校验权限,权限对所有用户开放

      • 可以看作是特殊的Digest模式,即"world:anyone"

    • Super:也是一种特殊的Digest模式,相当于管理员(超级用户)模式,超级用户可以操作所有节点

  • 授权对象(ID):与上述的权限模式配合使用。在不同的scheme下,id是不同的。见下图

  • 权限(Permission):权限就是通过了权限检查后可以被允许执行的操作。在Zk中操作可分以下5类

    • CREATE:允许 授权对象 创建该节点的子节点

    • READ:允许 授权对象 从该节点读取数据 或 子节点列表 等

    • WRITE:允许 授权对象 对该节点进行更新操作

    • DELETE:允许 授权对象 删除该节点的子节点

    • ADMIN:允许 授权对象 为该节点设置ACL权限

  • ACL的管理

    • ACL设置:在Zk服务端有两种方式能对ACL进行设置

      • 方式

        例子

        方式一:创建节点的同时设置ACL参数,命令格式如下:【create [-s] [-e] path data acl】

        方式二:通过setAcl命令,单独对已存在的节点进行设置:【setAcl path acl】

    • 如何使用Super模式

      • Super模式由来:如果一个持久数据节点的创建者客户端已下线,那么该如何清理?需要一个超级管理员

      • 使用方式:

        • 在ZK服务器上开启Super模式:在服务端启动时,添加以下属性

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/319572.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Git系列:如何为不同的Git仓库设置不同的配置项?

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

【云原生】Docker 的网络通信

Docker 的网络通信 1.Docker 容器网络通信的基本原理1.1 查看 Docker 容器网络1.2 宿主机与 Docker 容器建立网络通信的过程 2.使用命令查看 Docker 的网络配置信息3.Docker 的 4 种网络通信模式3.1 bridge 模式3.2 host 模式3.3 container 模式3.4 none 模式 4.容器间的通信4.…

RabbitMQ之生产批量发送

为什么要用生产批量发送? 批量发送消息,可以提高MQ发送性能。但是 RabbitMQ 并没有提供了批量发送消息的 API 接口,使用 spring-amqp 的 BatchingRabbitTemplate 实现批量能力。 SimpleBatchingStrategy 发送策略满足以下规则会进行发送: ba…

开源模型应用落地-LangChain高阶-Tools工具-集成agents(四)

一、前言 LangChain 的 tools 是一系列关键组件,它们提供了与外部世界进行交互的能力。通过适当的使用这些组件,可以简单实现如执行网络搜索以获取最新信息、调用特定的 API 来获取数据或执行特定的操作、与数据库进行交互以获取存储的信息等需求。 本章…

图像处理的一些操作(1)

图像处理 1.安装PIL,skimage库1.1导入skimage库中的oi模块和data模块 2.读取图像文件2.1读取图像文件2.2 以灰度模式读取图像2.3 查看示例图像的目录路径2.4 读取chelsea图片2.5 加载示例图片并保存2.6 获得加载图片的信息2.6.1 输出图片类型2.6.2 输出图片尺寸2.6.…

idea生成双击可执行jar包

我这里是一个生成xmind,解析sql的一个main方法,可以通过配置文件来修改有哪些类会执行 我们经常会写一个处理文件的main方法,使用时再去寻找,入入会比较麻烦,这里就可以把我们写过的main方法打成jar包,放到指定的目录来处理文件并生成想要的结果 1.写出我们自己的main方法,本地…

Reactor模型详解

目录 1.概述 2.Single Reactor 3.muduo库的Multiple Reactors模型如下 1.概述 维基百科对Reactor模型的解释 The reactor design pattern is an event handling pattern for handling service requests delivered concurrently to a service handler by one or more inputs.…

《ElementUI 基础知识》el-tabs header 监听鼠标中键滚动时左右滑动(ElementPlus同样适用)

前言 收到需求,可监听 el-tabs 头在鼠标 hover 时。滑动鼠标中键,可左右滑动! 效果 鼠标中键上下滑动时;向上滑,向左移动;向下滑,向右移动; 实现 代码56 - 60行,添加…

服务器IP选择

可以去https://ip.ping0.cc/查看IP的具体情况 1.IP位置--如果是国内用,国外服务器的话建议选择日本,香港这些比较好,因为它们离这里近,一般延时低(在没有绕一圈的情况下)。 不过GPT的话屏蔽了香港IP 2. 企…

【数学建模】矩阵微分方程

一、说明 我相信你们中的许多人都熟悉微分方程,或者至少知道它们。微分方程是数学中最重要的概念之一,也许最著名的微分方程是布莱克-斯科尔斯方程,它控制着任何股票价格。 ​​ 股票价格的布莱克-斯科尔斯模型 微分方程可以由数学中的许多…

【Python项目】基于DJANGO的【医院体检预约系统】

技术简介:使用Python技术、DJANGO框架、MYSQL数据库等实现。 系统简介:系统采用了在线预约和挂号的方式,用户可以通过网站进行预约和挂号操作。同时,系统还提供了医生的详细介绍和评价,方便用户选择医生。 研究背景&a…

Linux系统编程--信号与管道

1、信号与管道是什么? 首先了解信号与管道的意义,我们需要了解Linux系统中进程之间是如何通信的。Linux操作系统下,以进程为单位来分配或者管理资源,进程之间不能直接访问资源,因此,要求进程间的资源和信息…

word中取消分页符或分段符前后的空格

在Word中,有时候,我们添加分页符后,从分页符后面的文字就全部掉到了下一页,那么如何避免呢? 选择word选项--高级,然后下滑到下面,将“取消分页符或分段符前后的空格”选中,如下图所…

【Linux】进程间通信 - 管道

文章目录 1. 进程间通信介绍1.1 进程间通信目的1.2 进程间通信发展1.3 进程间通信分类 2. 管道2.1 什么是管道2.2 匿名管道2.3 用 fork 来共享管道原理2.4 站在文件描述符角度 - 深入理解管道2.5 站在内核角度 - 管道本质2.6 管道读写规则2.7 管道特点 3. 命名管道3.1 匿名管道…

C 408—《数据结构》图、查找、排序专题考点(含解析)

目录 Δ前言 六、图 6.1 图的基本概念 6.2 图的存储及基本操作 6.3 图的遍历 6.4 图的应用 七、查找 7.2 顺序查找和折半查找 7.3 树型查找 7.4 B树和B树 7.5 散列表 八、排序 8.2 插入排序 8.3 交换排序 8.4 选择排序 8.5 归并排序和基数排序 8.6 各种内部排序算法的比较及…

Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理

原文地址:meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch 了解在 CPU 上部署 Meta* Llama 3 时如何减少模型延迟 2024 年 4 月 19 日 万众期待的 Meta 第三代 Llama 发布了,我想确保你知道如何以最佳方式部署这个最先进的&…

堆栈打印跟踪Activity的启动过程(基于Android10.0.0-r41),framework修改,去除第三方app的倒计时页面

文章目录 堆栈打印跟踪Activity的启动过程(基于Android10.0.0-r41),framework修改,去除第三方app的倒计时页面1.打印异常堆栈2.去除第三方app的倒计时页面3.模拟点击事件跳过首页进入主页 堆栈打印跟踪Activity的启动过程(基于Android10.0.0-r41)&#x…

UNI-APP_拨打电话权限如何去掉,访问文件权限关闭

uniapp上架过程中一直提示:允许“app名”拨打电话和管理通话吗? uniapp配置文件:manifest.json “permissionPhoneState” : {“request” : “none”//拨打电话权限关闭 }, “permissionExternalStorage” : {“request” : “none”//访…

深度解析Java 9核心新特性

码到三十五 &#xff1a; 个人主页 < 免责声明 > 避免对文章进行过度解读&#xff0c;因为每个人的知识结构和认知背景都不同&#xff0c;没有一种通用的解决方案。对于文章观点&#xff0c;不必急于评判。融入其中&#xff0c;审视自我&#xff0c;尝试从旁观者角度认清…

ruoyi漏洞总结

若依识别 黑若依 :icon hash"-1231872293 绿若依 :icon hash"706913071” body" 请通过前端地址访 " body" 认证失败&#xff0c;无法访问系统资源 " 如果页面访问显示不正常&#xff0c;可添加默认访问路径尝试是否显示正常 /login?redi…