9. 哨兵模式
9.1 简介
当主库宕机,在从库中选择一个,切换为主库。
问题:
- 主库是否真正宕机?
- 哪一个从库可以作为主库使用?
- 如何实现将新的主库的信息通过给从库和客户端?
9.2 基本流程
哨兵主要任务:
- 监控
- 选择主库
- 通知
会有主观下线和客观下线,就是奇数个哨兵,少数服从多数,多数以为主服务器宕机了,就判断宕机
9.3 哨兵模式配置
- 创建一个sentinel.conf文件,进行配置
#端口号 port 26379 #sentinel monitor <自定义的reids主节点名称> <IP> <port> <数量、几个哨兵说主节点下线> sentinel monitor mymaster 127.0.0.1 6379 1 #指定多少毫秒后,主节点没有应答哨兵,就认为下线了 sentinel down-after-milliseconds mymaster 30000
- 启动三个redis实例,配置成一主二从模式
- 启动哨兵:
redis-sentinel sentinel.conf
- 将主服务器宕机,观察哨兵监控信息变化
将一个从库6380,切换成主库,将6381,切换成6379的从库。 - 将原来主库6379再次启动,6379切换成6380的从库
9.4 新主库的选定
筛选 + 打分,来实现新主库的选定
打分
三轮打分
- 第一轮 优先级
- 通过replica-priority配置项,给不同的从库设置优先级。可以将内存大,网络好,配置高的从库优先级设置更高。
- 第二轮 和原主库同步程度
- 选择和原主库repl_backlog_buffer(唤醒缓冲区)中的位置最接近的,做为分数最高
- 第三轮 ID号小的从库得分高
- 每一个redis实例都有一个id。
9.5 哨兵集群
9.5.1 简介
采用多个哨兵,组成一个集群,以少数服从多数的原则,来判断主库是否客观下线。
- 假如有s个哨兵,那么如果有s/2+1个哨兵确定主库宕机,则判断主库为客观下线
如果集群中,有哨兵实例掉线,其他的哨兵还可以继续协作,来完成主从库监控和切换的工作。
9.5.2 部署
-
创建了一个目录 mysentinel
-
分别创建三个哨兵配置文件
sentinel26379.conf sentinel26380.conf sentinel26381.conf
配置如下port 26379 sentinel monitor mymaster 127.0.0.1 6379 2
port 26380 sentinel monitor mymaster 127.0.0.1 6379 2
port 26381 sentinel monitor mymaster 127.0.0.1 6379 2
-
再次配置一主二从
-
启动三个redis实例,配置成一主二从,6379是主库
-
依次启动三个哨兵实例。主库宕机,发现主库下线后,选举新的从库做为主库
出现的指令 对应意义 +sdown 进入主观下线状态 -sdown 退出主观下线状态 +odown 进入客观下线状态 -odown 退出客观下线状态 +switch-master 主库地址发生变化切换 +slave-reconf-sent 哨兵发送replicaof命令配置从库 +slave-reconf-inprog 从库配置了新主库,但尚未进行同步 +slave-reconf-done 从库配置了新主库,并且已经完成同步
9.5.3运行机制
基于pub/sub(发布/订阅)机制实现哨兵集群组成
基于info命令对哨兵监控从库
基于哨兵自身的pub/sub功能,实现了客户和哨兵之间的通知
- subscribe 频道[频道…]
- subscribe +odown(订阅+odown的频道)
- publish 频道 内容
- publish +odown 下线(发布+odown频道’下线’的信息)
有一个投票机制,倘若一个哨兵发现主库主观下线了,会向其他哨兵发起投票,如果有两个都是主观下线,就判定主库为客观下线
并且此哨兵会向其他两个哨兵发送请求,由我(Leader)来判定从库中的哪一个来替换主库
就如同竞争上岗一样,三个哨兵会相互投票,哪个发起的早,哪个成为Leader几率更大,并且每个哨兵只可以投一个赞成票
注意:
- 在配置哨兵的时候
down-after-milliseconds
要让每个哨兵都配置相同的时间,否则可能会出现哨兵不同步的问题sentinel down-after-milliseconds mymaster 30000