一、持久化
Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能!
1.1、RDB(Redis DataBase)
1.1.1 概念
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的 Snapshot 快照,它恢复时是将快照文件直接读到内存里。
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何 IO 操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效。RDB 的缺点是最后一次持久化后的数据可能丢失。 Redis 默认的就是 RDB,一般情况下不需要修改这个配置。
rdb 默认保存的文件就是 dump.rdb,都是在我们配置文件的快照部分配置的,如下所示:
1.1.2 手动配置
修改 redis.conf 配置文件,如下图所示:
记得输入 config.rewrite 命令重启下 redis 服务使配置文件更新
# 客户端1 先删除 dump.rdb 文件
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# rm -f dump.rdb
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server# 客户端2 执行 set 操作
127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3 k4 v4 k5 v5
OK# 等1分钟后,再次查看客户端1,发现自动生成了 rdb 文件
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
1.1.3 触发机制
1、 save 的规则满足的情况下,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server# 客户端 2 执行 save 命令
127.0.0.1:6379> save
OK# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
2、执行 flushall 命令,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server# 客户端 2 执行 flushall 命令
127.0.0.1:6379> flushall
OK# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
3、退出 redis,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server# 客户端 2 执行退出命令
127.0.0.1:6379> shutdown
not connected> exit# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
1.1.4 恢复 rdb 文件
只需要将 rdb 文件放在我们 redis 启动目录即可,redis 启动的时候就会自动检查 dump.rdb恢复其中的数据,查看需要存在的位置命令:
127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/bin" # 如果在这个目录下存在 dump.rdb 文件,启动就会自动恢复其中的数据
1.1.5 优点
1、适合大规模的数据恢复
2、对数据完整性和一致性要求不高
1.1.6 缺点
1、需要在一定间隔时间做一次备份,所以如果 redis 意外宕机了,就会丢失最后一次快照后的所有修改。
2、fork 进程的时候,会占用一定的内存空间。
1.2、AOF(Append Only File)
1.2.1 概念
以日志的形式来记录每个写操作,将 Redis 执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
AOF 保存的是 appendonly.aof 文件
1.2.2 手动配置
默认是不开启的,需要我们手动进行配置,我们只需要将 appendonly 改为 yes 就开启了。
AOF 采用文件追加方式,文件会越来越大,为避免出现此种情况,新增了重写机制,当 AOF 文件的大小超过所设定的阈值时,Redis 就会启动 AOF 文件的内容压缩,只保留可以恢复数据的最小指令集,可以使用命令 bgrewriteaof !
1.2.3 触发机制
Redis 会记录上次重写时的 AOF 大小,默认配置是当 AOF 文件大小是上次 rewrite 后大小的已被且文件大于 64M 的触发。
# 客户端1查看当前目录的文件,如果存在 rdb 文件先删除就好了
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server# 客户端2启动 redis 服务
[root@localhost bin]# redis-server myredis/redis.conf
[root@localhost bin]# redis-cli -p 6379
127.0.0.1:6379> # 客户端1再次查看当前目录的文件,发现生成了 appendonlydir 目录,并存储了相关的文件
[root@localhost bin]# ls
appendonlydir myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# cd appendonlydir/
[root@localhost appendonlydir]# ls
appendonly.aof.1.base.rdb appendonly.aof.1.incr.aof appendonly.aof.manifest
1.2.4 异常恢复
当 aof 文件发生损坏的时候,可以使用 redis-check-aof 工具来修复,我们模拟下这个场景。
# 客户端1清空数据库,并重新赋值,然后退出 redis
127.0.0.1:6379> flushdb
OK
127.0.0.1:6379> set k1 v1
OK
127.0.0.1:6379> set k2 v2
OK
127.0.0.1:6379> set k3 v3
OK
127.0.0.1:6379> set k4 v4
OK
127.0.0.1:6379> set k5 v5
OK
127.0.0.1:6379> shutdown
not connected> exit# 客户端2 首先删除dump.rdb 文件
[root@localhost bin]# ls
appendonlydir dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# rm -f dump.rdb
[root@localhost bin]# ls
appendonlydir myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 修改我们的 aof 文件,舔些垃圾数据
[root@localhost bin]# cd appendonlydir/
[root@localhost appendonlydir]# vim appendonly.aof.1.incr.aof
[root@localhost appendonlydir]# cd ..
# 启动 redis 的服务端
[root@localhost bin]# redis-server myredis/redis.conf
58643:C 29 Aug 2023 20:14:27.081 # WARNING Memory overcommit must be enabled! Without it, a background save or replication may fail under low memory condition. Being disabled, it can also cause failures without low memory condition, see https://github.com/jemalloc/jemalloc/issues/1328. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
# 启动 redis 的客户端,发现无法启动
[root@localhost bin]# redis-cli -p 6379
Could not connect to Redis at 127.0.0.1:6379: Connection refused
not connected> # 执行 redis-check-aof --fix 修复的文件名 来修复文件
[root@localhost bin]# redis-check-aof --fix appendonlydir/appendonly.aof.1.incr.aof
Start checking Old-Style AOF
0x 13e: Expected \r\n, got: 3131
AOF analyzed: filename=appendonlydir/appendonly.aof.1.incr.aof, size=353, ok_up_to=301, ok_up_to_line=76, diff=52
This will shrink the AOF appendonlydir/appendonly.aof.1.incr.aof from 353 bytes, with 52 bytes, to 301 bytes
Continue? [y/N]: y
Successfully truncated AOF appendonlydir/appendonly.aof.1.incr.aof# 上面提示我们成功的修复了文件,再次重新启动下就可以了,只是 k5 被优化掉了,但也没法办法
[root@localhost bin]# redis-server myredis/redis.conf
[root@localhost bin]# redis-cli -p 6379
127.0.0.1:6379> mget k1 k2 k3 k4 k5
1) "v1"
2) "v2"
3) "v3"
4) "v4"
5) (nil)
1.2.5 优点
1、每一次修改都同步,文件的完整性会更加好
2、每秒同步一次,可能会丢失一秒的数据
3、从来都不需要同步,效率会比较高
1.2.6 缺点
1、相对于数据文件来说,aof 远远大于 rdb,修复的速度也比 rdb 慢
2、aof 的运行效率也要比 rdb 慢,所以我们 redis 默认的配置就是 rdb 持久化
1.2.7 小总结
1.3、总结
1.3.1 持久化方式对比
RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储。
AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF 命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。
1.3.2 缓存对比
只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
1.3.3 同时开启两种持久化对比
在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。
RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件,那要不要只使用 AOF 呢?作者建议不要,因为 RDB 更适合用于备份数据库(AOF 在不断变化不好备份),快速重启,而且不会有 AOF 可能潜在的 Bug,留着作为一个万一的手段。
1.3.4 性能建议
因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要15分钟备份一次就够了,只保留 save 900 1 这条规则。
如果 Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只 load 自己的 AOF 文件就可以了,代价一是带来了持续的 IO,二是 AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值 64M 太小了,可以设到 5G 以上,默认超过原大小 100% 大小重写可以改到适当的数值。
如果不 Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔 IO,也减少了 rewrite 时带来的系统波动。代价是如果 Master/Slave 同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的 RDB 文件,载入较新的那个,微博就是这种架构。
二、发布订阅
2.1 概念
Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。
Redis 客户端可以订阅任意数量的频道。
2.2 模型图
订阅/发布消息图如下:
下图展示了频道 channel1 , 以及订阅这个频道的三个客户端 —— client2 、 client5 和 client1 之间的关系:
当有新消息通过 PUBLISH 命令发送给频道 channel1 时, 这个消息就会被发送给订阅它的三个客户端:
2.3 相关命令
# 订阅一个或多个符合给定模式的频道
psubscribe pattern [pattern]# 查看订阅与发布系统状态
pubsub subcommand [argument[argument...]]# 将信息发送到指定的频道
publish channel message# 退订所有给定模式的频道
punsubscribe [pattern[pattern...]]# 订阅给定的一个或多个频道的信息
subscribe channel [channel...]# 退订指定的频道
unsubscribe [channel[channel...]
2.4 测试
以下实例演示了发布订阅是如何工作的。在我们实例中我们创建了订阅频道名为 redisChat
# 订阅一个频道 redisChat
127.0.0.1:6379> subscribe redisChat
1) "subscribe"
2) "redisChat"
3) (integer) 1
# 等待读取推送的消息
现在,我们先重新开启个 redis 客户端,然后在同一个频道 redisChat 发布两次消息,订阅者就能接收到消息。
# 发布者发布消息到频道
127.0.0.1:6379> publish redisChat "Hello Redis"
(integer) 1
# 发布者发布消息到频道
127.0.0.1:6379> publish redisChat "Hello xhf"
(integer) 1# 订阅者的客户端会出现以下的消息
1) "message" # 消息
2) "redisChat" # 哪个频道的消息
3) "Hello Redis" # 消息的具体内容
1) "message"
2) "redisChat"
3) "Hello xhf"
2.5 原理
Redis 是使用 C 实现的,通过分析 Redis 源码里的 pubsub.c 文件,了解发布和订阅机制的底层实现,籍此加深对 Redis 的理解。
Redis 通过 PUBLISH 、SUBSCRIBE 和 PSUBSCRIBE 等命令实现发布和订阅功能。
通过 SUBSCRIBE 命令订阅某频道后,redis-server 里维护了一个字典,字典的键就是一个个 channel,而字典的值则是一个链表,链表中保存了所有订阅这个 channel 的客户端。SUBSCRIBE 命令的关键,就是将客户端添加到给定 channel 的订阅链表中。
通过 PUBLISH 命令向订阅者发送消息,redis-server 会使用给定的频道作为键,在它所维护的 channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub 从字面上理解就是发布(Publish)与订阅(Subscribe),在 Redis 中,你可以设定对某一个 key 值进行消息发布及消息订阅,当一个 key 值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
2.6 使用场景
1、Pub/Sub 构建实时消息系统
2、Redis 的 Pub/Sub 系统可以构建实时的消息系统
3、比如很多用 Pub/Sub 构建的实时聊天系统的例子。