Redis Hash数据类型

几乎所有的主流编程语言都提供了哈希(hash)类型，它们的叫法可能是哈希、字典、关联数组、映射。在 Redis 中，哈希类型是指值本身又是一个键值对结构，形如key = “key”，value = {ffield1, value1 }, … {fieldN, valueN } }，Redis 键值对和哈希类型二者的关系可以用下图来表示。

字符串和哈希类型对比：

在这里插入图片描述

哈希类型中的映射关系通常称为 field-value，用于区分 Redis 整体的键值对(key-value) ,注意这里的 value 是指 field 对应的值，不是键 (key) 对应的值，请注意 value 在不同上下文的作用。

命令

hset和hget

hset：设置hash中指定的字段(field)的值(value)。

语法：

HSET key field value [field value ...]

时间复杂度：插入一组 field 为 O(1),插入 N 组 field 为 O(N)

返回值：添加的字段的个数。如果当前字段已经存在，此时hset相当于更新，则返回0

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hget myhash field1
"Hello"redis> hset myhash field1 hello field2 world
(integer) 2

hget：获取 hash 中指定字段的值。

语法：

HGET key field

时间复杂度：O(1)

返回值：字段对应的值或者nilo

示例:

redis> hset myhash field1 "foo"
(integer) 1
redis> hget myhash field1
"foo"
redis> hget myhash field2
(nil)

hexists

判断hash中是否有指定的字段。

语法：

HEXISTS key field

时间复杂度：O(1)

返回值：1 表示存在，0 表示不存在。

示例：

redis> hset myhash field1 "foo"
(integer) 1
redis> hexists myhash field1
(integer) 1
redis> hexists myhash field2
(integer) 0

hdel

删除hash中指定的字段。

语法：

HDEL key field [field ...]

时间复杂度：删除⼀个元素为 O(1) 删除 N 个元素为 O(N).

返回值：本次操作删除的字段个数。

示例：

redis> hset myhash field1 "foo"
(integer) 1
redis> hdel myhash field1
(integer) 1
redis> hexists myhash filed
(integer) 0
redis> hdel myhash field2
(integer) 0

hkeys

获取hash中的所有字段。

语法：

HKEYS key

时间复杂度：O(N), N 为 field 的个数.。

返回值：字段列表。

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hkeys myhash
1) "field1"
2) "field2"

hvals

获取hash中的所有的值。

语法：

HVALS key

时间复杂度：O(N), N 为 field 的个数。

返回值：所有的值。

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hvals myhash
1) "Hello"
2) "World"

hgetall

获取 hash 中的所有字段以及对应的值。

语法：

HGETALL key

时间复杂度：O(N), N 为 field 的个数

返回值：字段和对应的值。

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hgetall myhash
1) "field1"
2) "Hello"
3) "field2"
4) "World"

hmget

⼀次获取hash中多个字段的值。

语法：

HMGET key field [field ...]

时间复杂度：只查询⼀个元素为 O(1), 查询多个元素为 O(N), N 为查询元素个数。

返回值：字段对应的值或者 nil。

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hmget myhash field1 field2 nofield
1) "Hello"
2) "World"
3) (nil)

在使用 HGETALL 时，如果哈希元素个数比较多，会存在阻塞 Redis 的可能。如果开友人员只需要获取部分 field，可以使用 HMGET，如果一定要获取全部field，可以尝试使用 HSCAN 命令，该命令采用渐进式遍历哈希类型。

hlen

获取 hash 中的所有字段(key)的个数。

语法：

HLEN key

时间复杂度：O(1)

返回值：字段个数。

示例：

redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hlen myhash
(integer) 2

hsetnx

在字段不存在的情况下，设置 hash 中的字段和值。

语法：

HSETNX key field value

时间复杂度：O(1)

返回值：1 表示设置成功，0 表示失败。

示例：

redis> hsetnx myhash field "Hello"
(integer) 1
redis> hsetnx myhash field "World"
(integer) 0
redis> hget myhash field
"Hello"

hincrby

将hash中字段对应的数值添加指定的值。

语法：

HINCRBY key field increment

时间复杂度：O(1)

返回值：该字段变化之后的值。

示例：

redis> hset myhash field 5
(integer) 1
redis> hincrby myhash field 1
(integer) 6
redis> hincrby myhash field -1
(integer) 5
redis> hincrby myhash field -10
(integer) -5

hincrbyfloat

hincrby的浮点数版本。

语法：

HINCRBYFLOAT key field increment

时间复杂度：O(1)

返回值：该字段变化之后的值。

示例：

redis> hset mykey field 10.50
(integer) 1
redis> hincrbyfloat mykey field 0.1
"10.6"
redis> hincrbyfloat mykey field -5
"5.6"
redis> hset mykey field 5.0e3   #5000
(integer) 0
redis> HINCRBYFLOAT mykey field 2.0e2   #200
"5200"

内部编码

哈希的内部编码有两种：

ziplist(压缩列表)：当哈希类型元素个数小于 hash-max-ziplist-entries 配置（默认512个)、同时所有值都小于 hash-max-ziplist-value 配置默认64字节)时，Redis 会使用 ziplist 作为哈希的内部实现，ziplist 使用更加紧凑的结构实现多个元素的连续存储,所以在节省内存方面比 hashtable 更加优秀。
hashtable (哈希表)︰当哈希类型无法满足 ziplist 的条件时，Redis 会使用 hashtable 作为哈希的内部实现，因为此时 ziplist 的读写效率会下降，而 hashtable 的读写时间复杂度为O(1)。

下面的示例演示了哈希类型的内部编码，以及响应的变化。

1）当 field 个数比较少且没有大的 value 时，内部编码为 ziplist：

127.0.0.1:6379> hmset hashkey f1 v1 f2 v2
OK
127.0.0.1:6379> object encoding hashkey
"ziplist"

2）当有 value 大于 64 字节时，内部编码会转换为 hashtable：

127.0.0.1:6379> hset hashkey f3 6666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666
(integer) 1
127.0.0.1:6379> object encoding hashkey
"hashtable"

3）当 field 个数超过 512 时，内部编码也会转换为 hashtable

127.0.0.1:6379> hmset hashkey f1 v1 f2 v2 f3 v3 ... 省略 ... f513 v513
OK
127.0.0.1:6379> object encoding hashkey
"hashtable"

使用场景

图"关系型数据表保存用户信息"为关系型数据表记录的两条用户信息，用户的属性表现为表的列，每条用户信息表现为行。如果映射关系表示这两个用户信息，则如图"映射关系表示用户信息"所示。

关系型数据表保存用户信息：

在这里插入图片描述

映射关系表示用户信息：

在这里插入图片描述

相比于使用Json格式的字符串缓存用户信息，哈希类型变得更加直观，并且在更新操作上变得更灵活。可以将每个用户的id定义为键后缀，多对field-value对应用户的各个属性，类似如下伪代码:

UserInfo getUserInfo(long uid) {// 根据 uid 得到 Redis 的键String key = "user:" + uid;// 尝试从 Redis 中获取对应的值userInfoMap = Redis 执⾏命令：hgetall key;// 如果缓存命中（hit）if (value != null) {// 将映射关系还原为对象形式UserInfo userInfo = 利⽤映射关系构建对象(userInfoMap);return userInfo;}// 如果缓存未命中（miss）// 从数据库中，根据 uid 获取⽤⼾信息UserInfo userInfo = MySQL 执⾏ SQL：select *from user_info where uid = <uid>// 如果表中没有 uid 对应的⽤⼾信息if (userInfo == null) {响应 404 return null;}// 将缓存以哈希类型保存Redis 执⾏命令：hmset key name userInfo.name age userInfo.age city userInfo.c// 写⼊缓存，为了防⽌数据腐烂（rot），设置过期时间为 1 ⼩时（3600 秒）Redis 执⾏命令：expire key 3600// 返回⽤⼾信息return userInfo;
}

但是需要注意的是哈希类型和关系型数据库有两点不同之处：

哈希类型是稀疏的，而关系型数据库是完全结构化的，例如哈希类型每个键可以有不同的 field，而关系型数据库一旦添加新的列，所有行都要为其设置值，即使为null
关系数据库可以做复杂的关系查询，而 Redis去模拟关系型复杂查询例如联表查询、聚合查询等基本不可能,维护成本高。

缓存方式对比

原生字符串类型⸺使用字符串类型，每个属性⼀个键。

set user:1:name James
set user:1:age 23
set user:1:city Beijing

优点：实现简单，针对个别属性变更也很灵活。
缺点∶占用过多的键，内存占用量较大，同时用户信息在Redis中比较分散，缺少内聚性，所以这种方案基本没有实用性。

序列化字符串类型，例如 JSON 格式

set user:1 经过序列化后的⽤⼾对象字符串

优点∶针对总是以整体作为操作的信息比较合适，编程也简单。同时，如果序列化方案选择合适，内存的使用效率很高。
缺点：本身序列化和反序列需要一定开销，同时如果总是操作个别属性则非常不灵活。

哈希类型

hmset user:1 name James age 23 city Beijing

优点：简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
。

set user:1:name James
set user:1:age 23
set user:1:city Beijing

优点：实现简单，针对个别属性变更也很灵活。
缺点∶占用过多的键，内存占用量较大，同时用户信息在Redis中比较分散，缺少内聚性，所以这种方案基本没有实用性。

序列化字符串类型，例如 JSON 格式

set user:1 经过序列化后的⽤⼾对象字符串

优点∶针对总是以整体作为操作的信息比较合适，编程也简单。同时，如果序列化方案选择合适，内存的使用效率很高。
缺点：本身序列化和反序列需要一定开销，同时如果总是操作个别属性则非常不灵活。

哈希类型

hmset user:1 name James age 23 city Beijing

优点：简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
缺点：需要控制哈希在ziplist和 hashtable两种内部编码的转换，可能会造成内存的较大消耗。