Redis 入门到精通(九)-- 主从复制(2)
一、redis 主从复制–数据同步阶段注意事项
1、数据同步阶段 master 说明
1)如果 master 数据量巨大,数据同步阶段应避开流量高峰期,避免造成 master 阻塞,影响业务正常执行。
2)复制缓冲区大小设定不合理,会导致数据溢出。如进行全量复制周期太长,进行部分复制时发现数据已经存在丢失的情况,必须进行第二次全量复制,致使 slave 陷入死循环状态。
repl-backlog-size 1mb
3)master 单机内存占用主机内存的比例不应过大,建议使用 50%-70% 的内存,留下 30%-50% 的内存用于执行 bgsave 命令和创建复制缓冲区。
2、数据同步阶段 slave 说明
1)为避免 slave 进行全量复制、部分复制时服务器响应阻塞或数据不同步,建议关闭此期间的对外服务。
slave-serve-stale-data yes|no
2)数据同步阶段,master 发送给 slave 信息可以理解 master 是 slave 的一个客户端,主动向 slave 发送命令。
3)多个 slave 同时对 master 请求数据同步,master 发送的 RDB 文件增多,会对带宽造成巨大冲击,如果 master 带宽不足,因此数据同步需要根据业务需求,适量错峰。
4)slave 过多时,建议调整拓扑结构,由一主多从结构变为树状结构,中间的节点既是 master,也是
slave。注意使用树状结构时,由于层级深度,导致深度越高的 slave 与最顶层 master 间数据同步延迟
较大,数据一致性变差,应谨慎选择。
二、redis 主从复制–运行id(runid)
1、 主从复制过程大体可以分为3个阶段
- 建立连接阶段(即准备阶段)
- 数据同步阶段
- 命令传播阶段
2、阶段三:命令传播阶段
-
当 master 数据库状态被修改后,导致主从服务器数据库状态不一致,此时需要让主从数据同步到一致的状态,同步的动作称为命令传播。
-
master 将接收到的数据变更命令发送给 slave,slave 接收命令后执行命令。
3、命令传播阶段的部分复制
1)命令传播阶段出现了断网现象
- 网络闪断闪连 忽略。
- 短时间网络中断 部分复制。
- 长时间网络中断 全量复制。
2)部分复制的三个核心要素
- 服务器的运行 id(run id)。
- 主服务器的复制积压缓冲区。
- 主从服务器的复制偏移量。
4、服务器运行ID(runid)
1)概念:
服务器运行 ID 是每一台服务器每次运行的身份识别码,一台服务器多次运行可以生成多个运行 id。
2)组成:
运行 id 由 40 位字符组成,是一个随机的十六进制字符。
例如:fdc9ff13b9bbaab28db42b3d50f852bb5e3fcdce。
3)作用:
运行 id 被用于在服务器间进行传输,识别身份。
如果想两次操作均对同一台服务器进行,必须每次操作携带对应的运行id,用于对方识别。
4)实现方式:
运行 id 在每台服务器启动时自动生成的,master 在首次连接 slave 时,会将自己的运行 ID 发送给 slave,slave 保存此 ID,通过 info Server 命令,可以查看节点的 runid。
三、redis 主从复制–复制缓冲区与偏移量
1、复制缓冲区
1)概念:
复制缓冲区,又名复制积压缓冲区,是一个先进先出(FIFO)的队列,用于存储服务器执行过的命令,每次传播命令,master 都会将传播的命令记录下来,并存储在复制缓冲区。
复制缓冲区默认数据存储空间大小是 1M,由于存储空间大小是固定的,当入队元素的数量大于队列长度时,最先入队的元素会被弹出,而新元素会被放入队列。
2)由来:
每台服务器启动时,如果开启有AOF或被连接成为master节点,即创建复制缓冲区。
3)作用:
用于保存master收到的所有指令(仅影响数据变更的指令,例如set,select)。
4)数据来源:
当 master 接收到主客户端的指令时,除了将指令执行,会将该指令存储到缓冲区中。
2、复制缓冲区内部工作原理
1)组成
- 偏移量。
- 字节值。
2)工作原理
- 通过 offset 区分不同的 slave 当前数据传播的差异。
- master 记录已发送的信息对应的 offset。
- slave 记录已接收的信息对应的 offset。
3、主从服务器复制偏移量(offset)
1)概念:
一个数字,描述复制缓冲区中的指令字节位置。
2)分类:
- master 复制偏移量:记录发送给所有slave的指令字节对应的位置(多个)。
- slave 复制偏移量:记录slave接收master发送过来的指令字节对应的位置(一个)。
3)数据来源:
- master 端:发送一次记录一次。
- slave 端:接收一次记录一次。
4)作用:
同步信息,比对master与slave的差异,当slave断线后,恢复数据使用。
四、redis 主从复制–工作流程(2)数据同步与命令传播阶段(全)
五、redis 主从复制–心跳机制与命令传播阶段工作流程
1、redis 心跳机制
1)进入命令传播阶段候,master 与 slave 间需要进行信息交换,使用心跳机制进行维护,实现双方连接保持在线。
2)master 心跳:
- 指令:PING。
- 周期:由 repl-ping-slave-period 决定,默认10秒。
- 作用:判断 slave 是否在线。
- 查询:INFO replication 获取 slave 最后一次连接时间间隔,lag项维持在0或1视为正常。
3)slave 心跳任务
- 指令:REPLCONF ACK {offset}。
- 周期:1秒。
- 作用1:汇报slave自己的复制偏移量,获取最新的数据变更指令。
- 作用2:判断master是否在线。
2、redis 心跳阶段注意事项
1)当 slave 多数掉线,或延迟过高时,master 为保障数据稳定性,将拒绝所有信息同步操作。
min-slaves-to-write 2
min-slaves-max-lag 8
slave 数量少于2个,或者所有 slave 的延迟都大于等于10秒时,强制关闭 master 写功能,停止数据同步。
2)slave 数量由 slave 发送 REPLCONF ACK 命令做确认。
3)slave 延迟由 slave 发送 REPLCONF ACK 命令做确认。
3、redis 主从复制工作流程完整图例
上一节关联链接请点击:
# Redis 入门到精通(九)-- 主从复制(1)