9.Redis数据结构之整数数组

Redis中的Set与Java中的HashSet一样，无序且存储元素不重复。

Redis的集合对象Set使用了intset和hashtable两种数据结构存储。intset我们可以理解为数组,hashtable就是普通的哈希表(key为Set集合中元素的值，value为null)。当value是整数值时，且数据量不大时使用inset来存储，其他情况都是用字典dict来存储。

比如我有1个Set,元素为ABC。在hashtable中对应就是3个entry,key是ABC,value是null。

编码转换

Set的底层存储intset和hashtable是存在编码转换的，使用intset存储必须满足下面两个条件，否则使用hashtable，条件如下：

集合对象保存的所有元素都是整数值
intset集合对象保存的元素数量不超过512个

intset内部其实是一个数组(int8_t coentents[]数组)，而且存储数据的时候是有序的，因为在查找数据的时候是通过二分查找来实现的。

intset：当集合中的元素都是整数时，Redis会采用intset编码方式存储。intset编码方式的优点是存储空间小，操作效率高。

hashtable：当集合中的元素包含字符串时，Redis会采用hashtable编码方式存储。hashtable编码方式的优点是可以存储任意类型的元素，支持字符串操作。缺点是存储空间相对较大，操作效率相对较低。

添加过程

以set的sadd命令为例子，整个添加过程如下：

检查set是否存在不存在则创建一个set结合。
根据传入的set集合一个个进行添加，添加的时候需要进行内存压缩。
setTypeAdd执行set添加过程中会判断是否进行编码转换。

稍微深入分析一下set的单个元素的添加过程，首先如果已经是hashtable的编码，那么我们就走正常的hashtable的元素添加，如果原来是intset的情况，那么我们就需要进行如下判断：
如果能够转成int的对象(isObjectRepresentableAsLongLong)，那么就用intset保存。
如果用intset保存的时候，如果长度超过512就转为hashtable编码。
其他情况统一用hashtable进行存储。

整数数组介绍

intset，也就是整数集合，是 set 的底层实现之一，当一个集合只包含整数值元素，并且这个集合的元素数量不多时，Redis 就会使用 intset 作为 set 的底层实现。

它的查找是 O(log n) 的，插入和删除都是 O(n) 的。但是由于存储元素相对较少的时候，O(log n) 和 O(n) 差距不是很大，但是用 Redis 的这种 intset，相比红黑树和哈希表来说，可以大大减少内存。

所以，Redis 的整数集合 intset 的存在主要还是为了节省内存。

整数数组结构

整数集合可用保存的数据类型有：int16t 、int32t 和 int64_t 的整数值，并且保证集合中不会出现重复元素。

整数集合定义如下：

``` // src/intset.h typedef struct intset { uint32t encoding; // 编码方式，后面会详细解释 uint32t length; // 集合中元素的个数,也就是contents数组的长度 int8t contents[]; // 保存元素的数组 } intset; /* Note that these encodings are ordered, so: INTSETENCINT16 < INTSETENCINT32 < INTSETENC_INT64. */