Java 面试宝典：什么是大 key 问题？如何解决？

大家好，我是大明哥，一个专注「死磕 Java」系列创作的硬核程序员。
本文已收录到我的技术网站：https://skjava.com。有全网最优质的系列文章、Java 全栈技术文档以及大厂完整面经

回答

Redis 大 key 问题是指某个 key 对应的 value 值很大（注意，不是 key 很大）。大 key 会导致 Redis 性能降低、数据倾斜以及主从同步等问题。一般来说我们应该杜绝大 key，如果遇到了我们就需要对其进行处理，处理过程分为这两个步骤：

发现大 key。比如利用 redis-cli --bigkeys 或者 Redis RDB Tools 。
大 key 的治理方案一般分为两种：
1. 可删除：使用 UNLINK 命令可以安全地删除大 key。
2. 不可删除：不可删除的话就将大 key 拆分为多个小 key，或者对 value 进行压缩处理

详解

什么是大 key

首先大 key 不是 key 很大，而是 key 所对应的 value 很大。如果 value 超过某个阈值，那么此时存储这个 value 所对应的 key 就是大 key。

那 value 多大才算大 key 呢？这个阈值没有一个衡量的标准，需要根据具体场景来确定，比如有些场景及时 KB 是大 key，而有些场景需要几十 MB。

通常情况下，Redis 官方提到的大 key 阈值是基于经验值，例如：

对于列表、集合、有序集合、哈希表，在超过 1 万个元素时被认为是大 key。
对于字符串，当它的大小达到几百 KB 时可能被认为是大 key。

为了后面演示，我们通过程序向 Redis 中插入一批数据，表格如下：

字符串

key	数据量
bigkey-01	30 个 “skjava” 拼接
bigkey-02	300 个 “skjava” 拼接
bigkey-03	3000 个 “skjava” 拼接
bigkey-04	30000 个 “skjava” 拼接
bigkey-05	60000个 “skjava” 拼接
bigkey-06	90000 个 “skjava” 拼接
bigkey-07	120000个 “skjava” 拼接

程序如下（数字各位小伙伴就去改下）：

    @Testpublic void bigKeyTest() {StringBuffer stringBuffer_01 = new StringBuffer();for (int i = 0; i < 30 ; i++) {stringBuffer_01.append("skjava-" + i + ";");}// 省略StringBuffer stringBuffer_07 = new StringBuffer();for (int i = 0; i < 120000 ; i++) {stringBuffer_07.append("skjava-" + i + ";");}Jedis jedis = new Jedis("127.0.0.1",6379);jedis.set("bigkey-01",stringBuffer_01.toString());//...jedis.set("bigkey-07",stringBuffer_07.toString());}

各个 key 大小如下图：

列表

key	数据量
bigkey-08	30 个 “skjava”
bigkey-09	300 个 “skjava”
bigkey-10	3000 个 “skjava”
bigkey-11	30000 个 “skjava”
bigkey-12	60000个 “skjava”
bigkey-13	90000 个 “skjava”
bigkey-14	120000个 “skjava”

代码

    @Testpublic void bigKeyTest() {List<String> list_08 = new ArrayList<>();for (int i = 0 ; i < 30 ; i++) {list_08.add("skjava-" + i);}// ...List<String> list_14 = new ArrayList<>();for (int i = 0 ; i < 120000 ; i++) {list_14.add("skjava-" + i);}Jedis jedis = new Jedis("127.0.0.1",6379);jedis.lpush("bigkey-08", list_08.toArray(new String[list_08.size()]));// ...jedis.lpush("bigkey-14", list_14.toArray(new String[list_14.size()]));}

列表长度及大小:

大 key 有什么危害

数据倾斜

大 key 所在的 Redis 服务器，会比其他 Redis 服务器占用更多的内存，这种数据倾斜的现象明显违背 Redis-Cluster 的设计思想。

占用内存过高

大 key 会占用更多的内存，可能会导致内存不足，甚至导致内存耗尽，Redis实例崩溃，影响系统的稳定性。

同时，频繁对大 key 进行修改可能会导致内存碎片化，进一步影响性能。

性能下降

大 key 会占用大量的内存，导致内存碎片增加，进而影响Redis的性能。同时，对大 key 的读写操作消耗的时间都会比较长，这会导致单个操作阻塞 Redis 服务器，影响整体性能。

尤其是执行像 HGETALL、SMEMBERS、ZRANGE、LRANGE 等命令时，如果操作的是大 key，可能会导致明显的延迟。

主从同步延迟

如果配置了主从同步，大 key 会导致主从同步延迟，由于大 key 占用的内存比较大，当主节点上的大 key 发生变化时，同步到从库时，会导致网络和处理上的延迟。

如何找到大 key

1、–bigkeys

在使用redis-cli命令链接 Redis 服务的时候，加上 --bigkeys 参数，就可以找出每种数据类型的最大 key 及其大小。

bigkeys 使用的是 SCAN 来迭代 Redis 中所有的 key，对于每种数据类型（字符串、列表、集合、有序集合、哈希表），它都会记录下占用最多内存的 key。但是该操作是资源密集型的，不建议直接在生产上面执行，建议在从节点或者低流量时段执行。

这种方式对集合类型来说不是特别友好，因为它只统计集合元素的多少，而不是实际占用内存，但是集合元素多，并不代表占用内存大。

2、SCAN命令

用 SCAN 命令结合 MEMORY USAGE。SCAN 可以迭代数据库中的 key，然后结合 MEMORY USAGE 命令检查每个 key 的大小。

redis-cli --scan --pattern '*' | xargs -L 1 -I '{}' sh -c 'echo {} && redis-cli memory usage {}'

这个命令会显示每个 key 的内存使用量：

redis-cli --scan --pattern '*'：遍历所有的 key。
xargs -L 1 -I '{}' sh -c 'echo {} && redis-cli memory usage {}'：对于每个 key，首先打印 key 的名称（echo {}），然后打印其内存使用情况（redis-cli memory usage {}）

3、Redis RDB Tools工具

RdbTools 是一个用于分析 Redis 数据库文件（.rdb 文件）的工具。它可以帮助我们理解 Redis 内存使用情况，找出大 key，并以此优化 Redis 实例。

例如，我们要找出占用内存最多的 5 个 key：

rdb --command memory --largest 5 dump.rdb

再如，获取字节数大于 10000 的 key：

rdb --command memory --bytes 10000 dump.rdb

关于Redis RDB Tools 的安装与使用：https://www.cnblogs.com/zyf98/p/15627047.html

如何处理大 key

如何处理大 key 呢？方案有如下两类：

1、可删除

如果这些大 key 可以删除，则我们可以使用 UNLINK 删除这些大 key。UNLINK 是异步的，不会像 DEL 命令一样会阻塞 Redis 服务，这种特性使得它比较适合大型的列表、集合、散列或有序集合的删除。

2、不可删除

对于不可删除的大 key，我们一般有两种方式出路：

分解。将大 key 拆分为多个小 key，降低单key的大小，读取可以用mget批量读取。
压缩。如果是 String 类型，我们可以采用压缩算法对其进行压缩处理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/290420.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！