Redis - 主从复制

文章目录

目录

文章目录

前言 

1. 配置

建立复制

断开复制

传输延时

2. 主从拓扑结构

一主一从

一主多从

树状

三. 原理

数据同步 psync

replicationid/replid(复制id)

master_replid 和 master_replid2

offset (偏移量)

psync 运行流程

全量复制

部分复制

实时复制

总结


前言 

在分布式系统中为了解决单点问题,通常会把数据复制多个副本部署到其他服务器,满足故障恢 复和负载均衡等需求。Redis 也是如此,它为我们提供了复制的功能,实现了相同数据的多个 Redis 副本。复制功能是高可用 Redis 的基础,哨兵和集群都是在复制的基础上构建的。

1. 配置

建立复制

参与复制的 Redis 实例划分为主节点(master)和从节点(slave)。每个从结点只能有⼀个主节点, 而一个主节点可以同时具有多个从结点。复制的数据流是单向的,只能由主节点到从节点。配置复制 的方式有以下三种:

  • 1. 在配置文件中加入 slaveof {masterHost} {masterPort} 随 Redis 启动生效。
  • 2. 在 redis-server 启动命令时加入 --slaveof {masterHost} {masterPort} 生效。
  • 3. 直接使用 redis 命令:slaveof {masterHost} {masterPort}生效

修改配置主要是修改从机的配置. 主机配置不变 

第一步: 拷贝一份主节点配置文件给从节点, 并命名为 redis-slave.conf

第二步: 编辑配置文件,修改其 daemonize 为 yes。 

第三步: 通过redis-server指定配置文件 启动redis主节点和从节点  通过参数slaveof 配置该从节点归属的主节点

第四步: 启动redis客户端,观察主从关系

从运行结果中看到复制已经工作了,针对主节点 6379 的任何修改都可以同步到从节点 6380 中,复制 过程如图所示。

 

可以通过 info replication 命令查看复制相关状态。

主节点

role:master  #当前节点
connected_slaves:1 #从节点个数
slave0:ip=127.0.0.1,port=6380,state=online,offset=856,lag=0 #具体的一个从节点信息
master_replid:bdbc3e2ea45bb93bae7a5062892e3018b3e1d7dc #标识当前节点的id
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:856
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:856

从节点

role:slave
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:8
master_sync_in_progress:0
slave_repl_offset:898
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:bdbc3e2ea45bb93bae7a5062892e3018b3e1d7dc
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:898
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:898

断开复制

slaveof 命令不但可以建立复制,还可以在从节点执行 slaveof no one 来断开与主节点复制关系。 例如在 6380 节点上执行 slaveof no one 来断开复制。

断开复制主要流程:

1)断开与主节点复制关系。

2)从节点晋升为主节点。

从节点断开复制后并不会抛弃原有数据,只是无法再获取主节点上的数据变化。

传输延时

主从节点一般部署在不同机器上,复制时的网络延迟就成为需要考虑的问题,Redis 为我们提供 了 repl-disable-tcp-nodelay 参数用于控制是否关闭 TCP_NODELAY,默认为 no,即开启 tcpnodelay 功能,说明如下: 

  • 当关闭时,主节点产生的命令数据无论大小都会及时地发送给从节点,这样主从之间延迟会变小, 但增加了网络带宽的消耗。适用于主从之间的网络环境良好的场景,如同机房部署。
  • 当开启时,主节点会合并较小的 TCP 数据包从而节省带宽。默认发送时间间隔取决于 Linux 的内 核,一般默认为 40 毫秒。这种配置节省了带宽但增大主从之间的延迟。适用于主从网络环境复杂 的场景,如跨机房部署

2. 主从拓扑结构

Redis 的复制拓扑结构可以支持单层或多层复制关系,根据拓扑复杂性可以分为以下三种:一主一 从、一主多从、树状主从结构。

一主一从

一主一从结构是最简单的复制拓扑结构,用于主节点出现宕机时从节点提供故障转移支持。当应用写命令并发量较高且需要持久化时,可以只在从节点上开启 AOF,这样既可以保证数据 安全性同时也避免了持久化对主节点的性能⼲扰。但需要注意的是,当主节点关闭持久化功能时,如果主节点宕机要避免自动重启操作。

一主多从

一主多从结构(星形结构)使得应用端可以利用多个从节点实现读写分离。对于 读比重较大的场景,可以把读命令负载均衡到不同的从节点上来分担压力。同时一些耗时的读命令可以指定一台专门的从节点执行,避免破坏整体的稳定性。对于写并发量较高的场景,多个从节点会导致主节点写命令的多次发送从而加重主节点的负载

树状

树形主从结构(分层结构)使得从节点不但可以复制主节点数据,同时可以作为其他从节点的主 节点继续向下层复制。通过引入复制中间层,可以有效降低住系统按负载和需要传送给从节点的数据量。数据写入节点 A 之后会同步给 B 和 C 节点,B 节点进一步把数据同步给 D 和 E 节 点。当主节点需要挂载等多个从节点时为了避免对主节点的性能干扰,可以采用这种拓扑结构。

三. 原理

 复制过程流程图

数据同步 psync

Redis 使用 psync 命令完成主从数据同步,同步过程分为:全量复制和部分复制。

  • 全量复制:一般用于初次复制场景,Redis 早期支持的复制功能只有全量复制,它会把主节点全部 数据一次性发送给从节点,当数据量较大时,会对主从节点和网络造成很大的开销。
  • 部分复制:用于处理在主从复制中因网络闪断等原因造成的数据丢失场景,当从节点再次连上主节点后,如果条件允许,主节点会补发数据给从节点。因为补发的数据远小于全量数据,可以有效避 免全量复制的过高开销。

PSYNC 的语法格式

PSYNC replicationid offset
# 如果 replicationid 设为 ? 并且 offset 设为 -1 此时就是在尝试进⾏全量复制.
# 如果 replicationid offset 设为了具体的数值, 则是尝试进⾏部分复制.

replicationid/replid(复制id)

主节点的复制 id. 主节点重新启动, 或者从节点晋级成主节点, 都会生成一个 replicationid. (同一个节点, 每次重启生成的 replicationid 也会变化). 从节点在和主节点建立连接之后, 就会获取到主节点的 replicationid.

master_replid 和 master_replid2

master_replid2保留上一个主节点的id(如果有的话),可以根据这个id找回上一个主节点

offset (偏移量)

参与复制的主从节点都会维护自身复制偏移量。主节点(master)在处理完写入命令后,会把命令的字节长度做累加记录,统计信息在 info replication 中的 master_repl_offset 指标中。

psync 运行流程

1)从节点发送 psync 命令给主节点,replid 和 offset 的默认值分别是 ? 和 -1.

2)主节点根据 psync 参数和自身数据情况决定响应结果:

  • 如果回复 +FULLRESYNC replid offset,则从节点需要进行全量复制流程。
  • 如果回复 +CONTINEU,从节点进行部分复制流程。
  • 如果回复 -ERR,说明 Redis 主节点版本过低,不支持 psync 命令。从节点可以使 sync 命令进行全量复制。

全量复制

流程图

1)从节点发送 psync 命令给主节点进行数据同步,由于是第⼀次进行复制,从节点没有主节点的运行 ID 和复制偏移量,所以发送 psync ? -1。

2)主节点根据命令,解析出要进行全量复制,回复 +FULLRESYNC 响应。

3)从节点接收主节点的运行信息进行保存。

4)主节点执行 bgsave 进行 RDB 文件的持久化。

5)主节点发送 RDB 文件给从节点,从节点保存 RDB 数据到本地硬盘。

6)主节点将从生成 RDB 到接收完成期间执行的写命令,写入缓冲区中,等从节点保存完 RDB 文件后,主节点再将缓冲区内的数据补发给从节点,补发的数据仍然按照 rdb 的二进制格式追加写入到收到的 rdb 文件中. 保持主从一致性。

7)从节点清空自身原有旧数据。

8)从节点加载 RDB 文件得到与主节点一致的数据。

9)如果从节点加载 RDB 完成之后,并且开启了 AOF 持久化功能,它会进行 bgrewrite 操作,得到最 近的 AOF 文件。

我们会发现全量复制是一件高成本的操作:主节点 bgsave 的时间, RDB 在网络传输的时间,从节点清空旧数据的时间,从节点加载 RDB 的时间等。所以一般应该尽可能 避免对已经有大量数据集的 Redis 进行全量复制。

部分复制

部分复制主要是 Redis 针对全量复制的过高开销做出的⼀种优化措施,使用psync replicationId offset 命令实现。当从节点正在复制主节点时,如果出现网络闪断或者命令丢失等异常情况时,从节点 会向主节点要求补发丢失的命令数据,如果主节点的复制积压缓冲区存在数据则直接发送给从节点, 这样就可以保持主从节点复制的一致性。补发的这部分数据⼀般远远小于全量数据,所以开销很小。 整体流程如图所示。

1)当主从节点之间出现网络中断时,如果超过 repl-timeout 时间,主节点会认为从节点故障并终断 复制连接。

2)主从连接中断期间主节点依然响应命令,但这些复制命令都因网络中断无法及时发送给从节点,所以暂时将这些命令滞留在复制积压缓冲区中。

3)当主从节点网络恢复后,从节点再次连上主节点。

4)从节点将之前保存的 replicationId 和 复制偏移量作为 psync 的参数发送给主节点,请求进行部分复制。

5)主节点接到 psync 请求后,进行必要的验证。随后根据 offset 去复制积压缓冲区查找合适的数据, 并响应 +CONTINUE 给从节点。

6)主节点将需要从节点同步的数据发送给从节点,最终完成一致性。

复制积压缓冲区

复制积压缓冲区是保存在主节点上的一个固定长度的队列,默认大小为 1MB,当主节点有连接的从节点(slave)时被创建,这时主节点(master)响应写命令时,不但会把命令发送给从节点,还会写入复制积压缓冲区中。

实时复制

主从节点在建立复制连接后,主节点会把自己收到的修改操作 , 通过 tcp 长连接的方式, 源源不断的传输给从节点. 从节点就会根据这些请求来同时修改自身的数据. 从而保持和主节点数据的一致性。

另外, 这样的长连接, 需要通过心跳包的方式来维护连接状态. (这里的心跳是指应用层自己实现的心跳, 而不是 TCP 自带的心跳)

1)主从节点彼此都有心跳检测机制,各自模拟成对方的客户端进行通信。

2)主节点默认每隔 10 秒对从节点发送 ping 命令,判断从节点的存活性和连接状态。

3)从节点默认每隔 1 秒向主节点发送 replconf ack {offset} 命令,给主节点上报自身当前的复制偏移量。

如果主节点发现从节点通信延迟超过 repl-timeout 配置的值(默认 60 秒),则判定从节点下线,断 开复制客户端连接。从节点恢复连接后,心跳机制继续进行。


总结

以上就是这篇博客的主要内容了,大家多多理解,下一篇博客见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/417758.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

echarts多个环形图

echarts图表集 var dataValue [{name:今日待分配方量,value:49}, {name:今日已分配方量,value:602}, {name:今日完成方量,value:1037}]var piedata1 [{name: 1#拌和机,value: 20},{name: 2#拌和机,value: 22},{name: 3#拌和机 ,value: 17},{name: 4#拌和机,value: 18},{name…

基于“SRP模型+”多技术融合在生态环境脆弱性评价模型构建、时空格局演变分析与RSEI 指数的生态质量评价及拓展应用

近年来,国内外学者在生态系统的敏感性、适应能力和潜在影响等方面开展了大量的生态脆弱性研究,他们普遍将生态脆弱性概念与农牧交错带、喀斯特地区、黄土高原区、流域、城市等相结合,评价不同类型研究区的生态脆弱特征,其研究内容…

【JAVA基础】StringUtils.isEmpty、StringUtils.isBlank()、Objects.isNull()三者区别

📝个人主页🌹:个人主页 ⏩收录专栏⏪:日常经验 🌹🌹期待您的关注 🌹🌹,让我们共同进步! 总是区分不清楚这几个的差别:我们来直接验证一下&#…

活动系统开发之采用设计模式与非设计模式的区别-数据库设计及代码设计

1、数据库ER图 2、应用框架选用 PHP语言对应的thinkphp6.1应用框架 3、功能代码设计(后端) a、父类Base.php i:控制登录,只能登录后管理员才能操作; ii:控制按钮权限,管理员不仅要登录,且必须要有对应菜单…

【操作系统】进程同步之共享内存

进程的线程共享进程资源,而进程共享计算机资源。 在某种程度上,多进程是共享物理内存的。 由于操作系统的进程管理,不同的进程有自己独立的内存空间,互不干扰。 但是共享内存可以打破这个限制。 共享内存允许不相关的进程访问同…

Linux云计算学习笔记11 (计划任务)

一.基本概念 在Linux操作系统中,除了用户即时执行的命令操作以外,还可以配置在指定的时间、指定的日期执行预先计划好的系统管理任务(如定期备份、定期采集监测数据)。试想一下,如果系统要求在业务不那么繁忙的半夜进行…

【2024数学建模国赛赛题思路】C题第四套思路已出丨仅供参考

问题一思路分析 假定各种农作物未来的预期销售量、种植成本、亩产量和销售价格相对于2023年保持稳定,每季种植的农作物在当季销售。如果某种作物每季的总产量超过相应的预期销售量,超过部分不能正常销售。请针对以下两种情况,分别给出该乡村…

免费申请aws一年免费服务器使用教程

由于近期要测试一个公网项目,对比之下,选择了aws服务器,免费使用一年。 准备:一个visa信用卡即可,需要一个外网邮箱(我这边使用的hotmail) 注册的步骤不再赘述,切记几个点&#xff0…

景联文科技:专业图像采集服务,助力智能图像分析

景联文科技是专业数据服务公司,致力于为人工智能企业提供从数据采集、清洗到标注的全流程解决方案。协助客户解决AI开发过程中数据处理环节的关键问题,助力企业实现智能化转型。 1.多样化的图像采集服务 景联文科技提供多样化的图像采集服务&#xff0c…

udp网络通信 socket

套接字是实现进程间通信的编程。IP可以标定主机在全网的唯一性,端口可以标定进程在主机的唯一性,那么socket通过IP端口号就可以让两个在全网唯一标定的进程进行通信。 套接字有三种: 域间套接字:实现主机内部的进程通信的编程 …

Kettle发送邮件功能如何配置以实现自动化?

kettle发送邮件如何设置?Kettle配置发送邮件的方法? Kettle发送邮件功能能够帮助用户在数据处理过程中自动发送电子邮件,极大地提高了工作效率。AokSend将详细介绍如何配置Kettle发送邮件功能,以实现自动化操作。 Kettle发送邮件…

C++笔记19•数据结构:红黑树(RBTree)•

红黑树 1.简介: 红黑树,是一种二叉搜索树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或 Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路 径会比其他路径长出俩倍…

使用百度飞桨PaddleOCR进行OCR识别

1、代码及文档 代码:https://github.com/PaddlePaddle/PaddleOCR?tabreadme-ov-file 介绍文档:https://paddlepaddle.github.io/PaddleOCR/ppocr/overview.html 2、依赖安装 在使用过程中需要安装库,可以依据代码运行过程中的提示安装。…

MySQL Email验证流程详解:从注册到激活!

MySQL Email通知系统搭建教程!如何从MySQL发送邮件? MySQL Email验证是一个至关重要的环节,它确保了用户注册过程的安全性和有效性。AokSend将详细介绍从用户注册到MySQL Email激活的完整流程,帮助开发者更好地理解和实现这一功能…

视频编码与传输 学习笔记 1 一些视频压缩算法的介绍

大概是这么个结构: 说白了,就是视频太大,不压缩不行,因此我们会用压缩比非常夸张但对于视频来说效果很好的压缩方法先对视频压缩(source coding)然后把压缩后的视频发出去,要看的时候再解压。 就…

青岛实训 8月22号 day34

一、回顾 1.主从复制(高可用) 2.传统的主从复制 3.gtids事务型的主从复制 4.注意 1)server_id唯一 2)8.X版本需要get_ssl_pub_key 3)5.X不需要 4)change master to 5)stop | start slave 5.非…

HIVE 数据仓库工具之第二部分(数据库相关操作)

HIVE 数据仓库工具之第二部分(数据库相关操作) 一、Hive 对数据库的操作1.1 创建数据库1.1.1 创建数据库语法1.1.3 示例 1.2 使用数据库1.2.1 使用数据库语法1.2.2 示例 1.3 修改数据库1.3.1 修改数据库的语法1.3.2 示例 1.4 删除数据库1.4.1 删除数据库…

Aloudata CAN 发布:真正实现企业指标的管理、研发与消费一体化

对于企业的运营和管理来说,集自动化数据生产、业务化数据语言、智能化数据分析的指标管理方案至关重要。 指标是对业务过程和结果的度量,正如德鲁克所说,“如果无法度量就无法管理”。 指标管理痛点爆发,管、研、用一体方案备受青…

python-简单的dos攻击

前言 这个是DOS攻击学习(注意:千万别去攻击有商业价值的服务器或应用,不然会死的很惨(只有一个IP通过公网访问容易被抓),前提是网站没有攻击防御) 创建一个以python编写的后端web服务(好观察) 安装flask pip install flask from flask import Flaskapp …

Day22_K8S

文章目录 3.资源管理方式通过命令管理通过配置文件管理4. 基本概念入门4.1 Namespace4.2 Pod4.3 Label4.4 Deployment4.5 Service5. Pod详解5.1 Pod介绍5.2 Pod配置5.3 Pod生命周期5.3.1 初始化容器5.3.2 钩子函数5.3.3 容器探测5.3.4 重启策略5.4 Pod调度5.4.1 定向调度5.4.2 …