Redis 原理缓存过期、一致性hash、雪崩、穿透、并发、布隆、缓存更新策略、缓存数据库一致性

redis过期策略

redis的过期策略可以通过配置文件进行配置

一、定期删除

redis会把设置了过期时间的key放在单独的字典中,定时遍历来删除到期的key。
1).每100ms从过期字典中 随机挑选20个,把其中过期的key删除;
2).如果过期的key占比超过1/4,重复步骤1
为了保证不会循环过度,导致卡顿,扫描时间上限默认不超过25ms。根据以上原理,系统中应避免大量的key同时过期,给要过期的key设置一个随机范围。

二、惰性删除

过期的key并不一定会马上删除,还会占用着内存。 当你真正查询这个key时,redis会检查一下,这个设置了过期时间的key是否过期了? 如果过期了就会删除,返回空。这就是惰性删除。

三、内存淘汰机制

当redis内存超出物理内存限制时,会和磁盘产生swap,这种情况性能极差,一般是不允许的。通过设置 maxmemory 限制最大使用内存。超出限制时,根据redis提供的几种内存淘汰机制让用户自己决定如何腾出新空间以提供正常的读写服务。
(1)noeviction: 拒绝写操作, 读、删除可以正常使用。默认策略,不建议使用;
(2)allkeys-lru: 移除最近最少使用的key,最常用的策略;
(3)allkeys-random:随机删除某个key,不建议使用;
(4)volatile-lru:在设置了过期时间的key中,移除最近最少使用的key,不建议使用;
(5)volatile-random:在设置了过期时间的key中,随机删除某个key,不建议使用;
(6)volatile-ttl: 在设置了过期时间的key中,把最早要过期的key优先删除。

四、用java手写一个LRU算法实现

public class LRUCache<K,V> extends LinkedHashMap<K,V> {private int cacheSize;public LRUCache(int cacheSize){super(10,0.75f,true);//设置hashmap大小,true是让linkedhashmap按照访问顺序排序this.cacheSize = cacheSize;}@Overrideprotected boolean removeEldestEntry(Map.Entry<K, V> eldest) {//当map中数量大于指定缓存个数的时候,自动删除最老的数据return size()>cacheSize;}
}

redis分布式算法

如果有3个redis服务节点,分别是redis0,redis1,redis2 。现在一个资源,对他进行hash之后除3取余,余数分别是0,1,2 ,根据余数将该资源存储到对应的redis节点上。
因此此时的命中率为20%,即redis节点数从4个变成5个时,原有资源仍存放在对应redis节点上的概率为20%,剩下80%需要重新分配,影响较大。因此删除或增加一个redis节点,用传统的算法会使大量的缓存丢失,对后台服务器造成大量冲击。数据量达到百万千万级时,如果业务代码是穿透型的,会有大量的数据穿过cache直击DB,把数据库搞垮。(Hash链方式)

一致性hash算法原理

采用hash环算法
Hash链,只经过了1次hash,即把key hash到对应的机器编号。
而Hash环有2次Hash:
(1)把所有机器编号hash到这个环上,用机器的IP导致 对2的32次方取模。
(2)把key也hash到这个环上。然后在这个环上进行匹配,看这个key和哪台机器匹配。
这样,每个机器负责对应段上的数据。

他们在这个环形空间的位置会是固定的,因此则会形成如下存储关系:存储key的环形缓存和,存储值得值得环形缓存,因为hash算法一直,所以存储的对应位置也相同;

如果此时架构变动,移除一个cache节点B,此时产生变化的object4将会存储到cacheC上。因此,产生影响的范围是cacheB与cacheA之间的范围,影响相对小很多。
优点:避免在缓存服务器地址变化导致整个缓存在hash,缓存雪崩的问题;
而此时如果不是移除节点,而是新增一个节点cacheD,object2不在存放在cacheC上,而是会存放到cacheD上,此时影响的范围也知会在cacheB到cacheD之间。所以无论增加或删除一个节点,影响的范围都是很小的。

Hash倾斜性

在这里插入图片描述
但是hash算法又有倾斜性,上图中ABC3个cache节点分布的都比较均匀,而实际的情况会是如下图所示,ABC他们可能会挨得非常紧。从图中来看将会有大量的数据落在A上,不具有随机性,3个cache节点的负载性能都不均匀。

虚拟节点

在这里插入图片描述
因此需要增加虚拟节点。每个cache节点都会生成一个虚拟节点,并重新hash,重新散布到环形hash空间上,如下图,相对均匀了一些。 但即便是增加虚拟节点,还是会出现hash倾斜性的问题。的确,因此实际编码过程中配置一定的虚拟节点与真实节点的比例,随着数据越来越多,虚拟节点越来越低,使影响降到最低。
Consistent hashing命中率
(1-n/(n+m))*100%
服务器台数是n,而新增的服务器台数是m。当变动的服务器台数m越大,命中率越大,所以在变动时影响越来越小。当分布式集群越来越大时,一致性hash算法的优势就越明显。
在这里插入图片描述
redis分布式连接池取的ShardedJedis对象,而这个对象最终继承自Sharded,源码中也可以看出,初始化分块时,会有160乘以权重的虚拟节点。一般场景中会设置100-500个虚拟节点

Redis雪崩、穿透、并发等5大难题

缓存雪崩

数据未加载到缓存中,或者缓存同一时间大面积的失效,从而导致所有请求都去查数据库,导致数据库CPU和内存负载过高,甚至宕机。

应对办法

缓存的高可用性

缓存层设计成高可用,防止缓存大面积故障。即使个别节点、个别机器、甚至是机房宕掉,依然可以提供服务,例如 Redis Sentinel 和 Redis Cluster 都实现了高可用。

缓存降级

可以利用ehcache等本地缓存(暂时支持),但主要还是对源服务访问进行限流、资源隔离(熔断)、降级等。
当访问量剧增、服务出现问题仍然需要保证服务还是可用的。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级,这里会涉及到运维的配合。
比如推荐服务中,很多都是个性化的需求,假如个性化需求不能提供服务了,可以降级补充热点数据,不至于造成前端页面是个大空白。
在进行降级之前要对系统进行梳理,比如:哪些业务是核心(必须保证),哪些业务可以容许暂时不提供服务(利用静态页面替换)等,以及配合服务器核心指标,来后设置整体预案,比如:
(1)一般:比如有些服务偶尔因为网络抖动或者服务正在上线而超时,可以自动降级;
(2)警告:有些服务在一段时间内成功率有波动(如在95~100%之间),可以自动降级或人工降级,并发送告警;
(3)错误:比如可用率低于90%,或者数据库连接池被打爆了,或者访问量突然猛增到系统能承受的最大阀值,此时可以根据情况自动降级或者人工降级;
(4)严重错误:比如因为特殊原因数据错误了,此时需要紧急人工降级。

3.Redis备份和快速预热

1)Redis数据备份和恢复
2)快速缓存预热
4.提前演练
最后,建议还是在项目上线前,演练缓存层宕掉后,应用以及后端的负载情况以及可能出现的问题,对高可用提前预演,提前发现问题。

缓存穿透

缓存穿透是指查询一个一不存在的数据。例如:从缓存redis没有命中,需要从mysql数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,造成缓存穿透。
解决思路:
如果查询数据库也为空,直接设置一个默认值存放到缓存,这样第二次到缓冲中获取就有值了,而不会继续访问数据库。设置一个过期时间或者当有值的时候将缓存中的值替换掉即可。
可以给key设置一些格式规则,然后查询之前先过滤掉不符合规则的Key。

缓存并发

这里的并发指的是多个redis的client同时set key引起的并发问题。其实redis自身就是单线程操作,多个client并发操作,按照先到先执行的原则,先到的先执行,其余的阻塞。当然,另外的解决方案是把redis.set操作放在队列中使其串行化,必须的一个一个执行

缓存预热

缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。
这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!
解决思路:
1、直接写个缓存刷新页面,上线时手工操作下;
2、数据量不大,可以在项目启动的时候自动进行加载;
目的就是在系统上线前,将数据加载到缓存中。
以上就是缓存雪崩、预热、降级等的介绍。

布隆过滤器

布隆过滤器是一种空间效率很高的随机数据结构,它利用位数组和哈希函数来判断一个元素是否存在于集合中,主要用于在大规模数据中判断一个元素是否存在。

原理

布隆过滤器基于一个位数组和若干个哈希函数,其中位数组是一个由0和1组成的数组,初始值全部为0。当一个元素加入到布隆过滤器中时,会通过多个哈希函数生成多个哈希值,然后将这些哈希值对应的位数组位置设置为1。当一个元素要查询是否存在于布隆过滤器中时,也会通过多个哈希函数生成多个哈希值,然后查询这些哈希值对应的位数组位置是否都为1。如果任何一个位数组位置不为1,那么该元素肯定不存在于布隆过滤器中。如果所有位数组位置都为1,那么该元素可能存在于布隆过滤器中。因为多个元素可能会被哈希到同一个位数组位置上,所以存在误判的情况,但是不会漏掉任何一个元素。
在这里插入图片描述

布隆过滤器优点

布隆过滤器相比其他数据结构有如下优点:

  • 空间效率高:布隆过滤器只需要一个位数组和若干个哈希函数,所以它的空间效率很高。
  • 查询效率高:布隆过滤器的查询效率非常高,因为它只需要对位数组进行查询,而不需要真正的查询数据。
  • 可扩展性强:布隆过滤器可以根据需要动态调整位数组大小。

布隆过滤器缺点

布隆过滤器相比其他数据结构有如下缺点:

  • 无法删除元素:因为布隆过滤器的位数组中只能将元素对应的位设置为1,不能设置为0,所以无法删除元素。
  • 存在误判率:由于布隆过滤器使用的是哈希函数,所以在处理大量数据时,误判率是无法避免的。即使增加哈希函数的数量和布隆过滤器的大小,误判率也无法完全消除。

Redis布隆过滤器实现

Redis提供了布隆过滤器的实现,可以通过Redis的命令进行操作。下面是Redis布隆过滤器常用命令:

  • 2.1 BF.ADD 将元素添加到布隆过滤器中。

语法:

BF.ADD key element [element …]
参数:

key:布隆过滤器的名称。
element:要添加的元素。
返回值:

如果元素已经存在于布隆过滤器中,返回0。
如果元素不存在于布隆过滤器中,将元素添加到布隆过滤器中并返回1。
示例:

BF.ADD myfilter fooBF.ADD myfilter bar

  • 2.2 BF.EXISTS 判断元素是否存在于布隆过滤器中。

语法:

BF.EXISTS key element
参数:

key:布隆过滤器的名称。
element:要查询的元素。
返回值:

如果元素存在于布隆过滤器中,返回1。
如果元素不存在于布隆过滤器中,返回0。
示例:

BF.EXISTS myfilter fooBF.EXISTS myfilter baz

  • 2.3 BF.MADD 将多个元素添加到布隆过滤器中。

语法:

BF.MADD key element [element …]
参数:

key:布隆过滤器的名称。
element:要添加的元素。
返回值:

返回一个数组,表示每个元素是否添加成功。如果元素已经存在于布隆过滤器中,返回0;如果元素不存在于布隆过滤器中,将元素添加到布隆过滤器中并返回1。
示例:

BF.MADD myfilter foo bar baz

  • 2.4 BF.MEXISTS 判断多个元素是否存在于布隆过滤器中。

语法:

BF.MEXISTS key element [element …]
参数:

key:布隆过滤器的名称。
element:要查询的元素。
返回值:

返回一个数组,表示每个元素是否存在于布隆过滤器中。如果元素存在于布隆过滤器中,返回1;如果元素不存在于布隆过滤器中,返回0。
示例:

BF.MEXISTS myfilter foo bar baz

  • 2.5 BF.INFO 获取布隆过滤器的信息。

语法:

BF.INFO key
参数:

key:布隆过滤器的名称。
返回值:

返回布隆过滤器的信息,包括布隆过滤器的大小、哈希函数的个数和误判率等。
示例:

BF.INFO myfilter

缓存更新策略

内存淘汰(无需编码)

超时剔除(无需编码)

主动更新(需要编码)

需要我们手动编写业务逻辑,在修改数据库的同时,更新缓存。主动更新策略有三种

  1. Cache Aside Pattern:由缓存的调用者,在更新数据库的同时更新缓存。

  2. Read/Write Through Pattern:缓存和数据库整合为一个服务,由服务来维护一致性。调用者调用服务,不用关心一致性问题。

  3. Write Behind Caching Pattern:调用者只操作缓存,由其他线程异步的将缓存数据持久化到数据库,最终保持一致。

一般在数据一致性要求比较低的场景下可以使用内存淘汰机制,比如商城首页的分类信息,这些东西基本上是不会变化的。如果一致性要求比较高,我们可以采用主动更新+超时剔除兜底的方式来处理。

在企业中使用最多的主动更新策略是 Cache Aside Pattern。也就是我们自己编码来保证数据的一致性。

操作缓存和数据库时有三个问题需要我们考虑

  1. 删除缓存还是更新缓存
    1)更新缓存:每次更新数据库都更新缓存,无效写操作比较多。
    这种方式的缺点很明显,举个例子:假如我更新了100次数据库,然后又同时更新了100次缓存,但是在更新的时候并没有人来查这个数据,那么我更新这100次缓存好像也没啥用吧,相当于前99次都是无用功,只有最后一次才是有用的。这就是无效写操作过多的原因。

2)删除缓存:更新数据库时让缓存失效,查询时再更新缓存。(延迟加载)一般选择这个方案
这个方案比较合理一点,可以避免过多的无效写操作,缓存删除后,只要没人来查询这条数据,数据就不会被写入缓存,这样就可以避免大量无效的写操作。

缓存和数据库的一致性

1)单体系统,将缓存与数据库操作放在一个事务中。
2)分布式系统,利用TCC等分布式事务方案。

先操作缓存还是数据库

1.先删除缓存,再操作数据库

这种方式存在很明显的问题,假设有两个并发操作,线程A更新,线程B查询。线程A先删除缓存,然后还没来得及更新数据库,CPU资源被线程B抢走,线程B查询缓存发现没有命中(因为已经被线程A删除了),查询数据库,然后把结果写入到缓存中。这个时候线程A终于抢到CPU资源了,然后更新数据库,此时就会造成数据不一致问题。

在这里插入图片描述

2. 先操作数据库,再删除缓存(使用最多的方式)

这种处理方式使用的频率是最高的,因为出错的概率非常小,只有一种比较极端的情况才会出现数据一致性问题。
同样有两个并发请求,线程A查询、线程B更新,当线程A查询的时候,缓存刚好失效,然后就去查询数据库拿到数据,在准备写入缓存的时候,CPU资源被线程B抢走,线程B开始更新数据库,然后删除缓存(这一步其实等于无用,因为缓存已经过期)。此时线程A再次获取到CPU资源,然后写入缓存,此时写入的是更新前的旧数据,会产生数据一致性问题。
看起来这确实也是一个问题,但是我们仔细分析一下这种情况都需要满足哪些条件:

  1. 并发读写操作
  2. 读缓存时,缓存刚好失效
  3. 写数据库操作要比写缓存快
    写数据库是操作磁盘,写缓存是操作内存的,所以不太可能会出现写磁盘的速度快于写内存的。因此使用这种方式出现数据一致性的概率是很小的
3.延时双删策略

延迟双删策略是分布式系统中数据库存储和缓存数据保持一致性的常用策略,但它不是强一致。其实不管哪种方案,都避免不了Redis存在脏数据的问题,只能减轻这个问题,要想彻底解决,得要用到同步锁和对应的业务逻辑层面解决。

前面两种方案的不足点我们进行了分析,第二种方式的使用频率比较高,但是也有一些小缺陷,虽然说发生的概率很低,但是这个概率到了线上会不会发生也不好说,所以就有了延时双删策略对第二种方式做补充。

所谓延时双删就是先进行缓存清除,再执行数据库操作,最后(延迟N秒)再执行缓存清除延迟N秒的时间要大于一次写操作的时间,这个延时N秒就是了完善保证第二种策略中不足,可以保证线程A的写缓存和线程B的修改数据库、删除缓存都执行完毕,然后再删除缓存一次,就可以保证后面再来的查询请求可以查询到最新数据
ps: 一般的延时时间设置为3S左右,具体情况要根据业务场景取最佳值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/176797.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UWB 技术在机器人和移动领域的应用题】

多年来&#xff0c;机器人生态系统不断增长&#xff0c;不同的应用程序也在不断增长。如今&#xff0c;机器人出现在许多不同的领域&#xff0c;例如私人家庭、商业场所、仓库和医疗场所。他们要么自主工作&#xff0c;要么与我们并肩工作&#xff0c;帮助我们完成任务。 根据…

Unity Editor工具,导出unitypackage可选择是否包含脚本

概述 Unity自带的Export Package...功能&#xff0c;如果选中资源中包含脚本&#xff0c;或者Prefab挂载了自定义的脚本。在之后弹出的选择框内&#xff0c;如果勾选了Include dependencies会将整个项目所有的脚本全部都包含在内。等于导入了很多不相关的代码。如果取消勾选In…

soul协议算法

逆向工程技术是指对软件或应用程序进行逆向分析以了解其内部机制和功能的过程。虽然我无法详细介绍"Soul App"的逆向工程技术&#xff0c;但以下是一些常见的逆向工程技术&#xff0c;可能与你的研究相关&#xff1a; 1. 反汇编&#xff08;Disassembly&#xff09;…

[javaweb]——HTTP请求与响应协议,常见响应状态码(如:404)

&#x1f308;键盘敲烂&#xff0c;年薪30万&#x1f308; 目录 HTTP概述 &#x1f4d5;概念&#xff1a;Hyper Text Transfer Protocol&#xff0c;超文本传输协议&#xff0c;规定了浏览器和服务器之间数据传输的规则。 &#x1f4d5;特点&#xff1a; &#x1f4d5;插播…

ORANGE室内高尔夫—韩国室内模拟高尔夫原装进口真实体验身临其境

ORANGE室内高尔夫—韩国室内模拟高尔夫 真实体验 身临其境 室内高尔夫的产品优势&#xff1a; 1. 实际高尔夫球场的限制&#xff1a;室内高尔夫可以弥补室外高尔夫球场数量有限的问题&#xff0c;使得更多人能够享受高尔夫运动。 2. 天气和季节的限制&#xff1a;室内高尔夫可…

Expected indentation of 16 spaces but found 8 spaces.eslintvue/script-indent

问题&#xff1a;Expected indentation of 16 spaces but found 8 spaces.eslintvue/script-indent 原因&#xff1a; 严格地检查缩进问题&#xff0c;并不是报错 解决&#xff1a; 方法一&#xff1a;我们可以关闭这个检查规则&#xff08;好像没用&#xff09; .eslintrc.js…

一台服务器安装两个mysql、重置数据库用于测试使用

文章目录 一、切数据库数据存储文件夹已经存在数据库数据文件夹新建数据库数据文件夹 二、安装第二个mysql安装新数据库初始化数据库数据启动数据库关闭数据库 参考文档 一、切数据库数据存储文件夹 这个方法可以让你不用安装新的数据库&#xff0c;就可以得到一个全新的一个数…

图傅里叶变换

目录 什么是图信号&#xff1f; 如何理解图信号的”谱“&#xff1f; 图傅里叶变换是什么&#xff1f; 图傅里叶变换中特征值和图信号的总变差有什么关系&#xff1f; 让我们先总结一下&#xff0c;我们想要把图信号 正交分解到一组基 上&#xff1b; 那么怎么得到&#x…

MySQL 基础学习笔记(二)

目录 1 约束1.1 约束概述1.2 非空约束1.3 唯一约束1.4 主键约束1.5 默认约束1.6 外键约束 2 数据库设计2.1 数据库设计概述2.2 表关系 3 多表查询3.1 多表查询概述3.2 内连接查询3.3 外连接查询3.4 子查询 4 事务4.1 事务概述4.2 四大特征 1 约束 1.1 约束概述 约束是作用于表…

Labview2018安装教程(超级详细)

网盘资源见文末 一 .简介 LabVIEW 2017是National Instruments&#xff08;NI&#xff09;开发的一款图形化编程环境。LabVIEW是一种流程导向的编程语言&#xff0c;它使用图形符号表示程序的逻辑和数据流&#xff0c;并且以数据流的方式执行程序&#xff0c;使得用户可以通过…

双证齐发!移远通信通过ISO 26262功能安全流程认证及产品认证

近日&#xff0c;国际知名的认证和咨询机构法国BV&#xff08;Bureau Veritas&#xff09;向移远通信颁发了ISO 26262&#xff1a;2018功能安全ASIL B流程认证证书&#xff0c;同时为移远车规级GNSS模组LG69T&#xff08;AB&#xff09;颁发了ISO 26262 ASIL-B产品认证证书。移…

Java多线程篇(13)——FutureTask、Disruptor的使用

文章目录 FutureTaskCompletionServiceCompletableFuture DisruptorDisruptor 核心概念运行流程不同生产者模式的区别Disruptor设计精髓 FutureTask 现有一个场景&#xff0c;10个线程执行10个任务&#xff0c;然后主线程获取任务结果。 比较广泛的一个说法就是&#xff0c;r…

Django开发实例总结(入门级、4.2.6、详细)

目录 概述 Django的核心组件包括 Django的项目结构 创建工程&#xff08;4.2.6&#xff09; 实例一&#xff1a;Hello world 实例二&#xff1a;访问一个自定义主页 实例三&#xff1a;通过登录跳转到主页 实例四&#xff1a;主页添加静态文件&#xff0c;包含js、css、…

MVCC(多版本并发控制)

一、什么是MVCC MVCC是为了解决数据库在不加锁的前提下提升并发性和读取效率的一种思想 数据库有已下几种并发情况 读-读&#xff1a;不会产生并发问题读-写&#xff1a;发生隔离性问题&#xff0c;可能导致脏读、幻读、不可重复度写-写&#xff1a;可能存在数据丢失 为了防…

CRM软件助力企业科学决策

我们常说“选择大于努力”&#xff0c;这对于企业发展同样适用。每一家企业管理者在日常工作中都要做大量决策&#xff0c;员工只是将决策落地&#xff0c;而这些决策往往决定了公司大大小小项目实施的顺利与否。因此&#xff0c;采用CRM软件助力企业科学决策显得十分关键。 越…

缓存击穿只会逻辑过期 OR 互斥锁?深入思考 == 鹤立鸡群

网上但凡看得见的文章&#xff0c;大部分在说缓存穿透时都是无脑分布式锁 / 逻辑过期&#xff0c;分布式锁一点问题都没有么&#xff1f;逻辑过期一点问题都没有么&#xff1f;还能不能再进一步优化&#xff1f; 在聊聊缓存击穿的双重判定锁之前&#xff0c;我们将按照循循渐进…

WebSocket协议在java中的应用

文章目录 一、WebSocket介绍1.Http和WebSocket比较&#xff1a;2.应用场景 二、WebSocket使用步骤1.客户端搭建2.导入maven坐标3.导入WebSocket服务端组件WebSocketServer&#xff0c;用于和客户端通信1.ServerEndpoint2.OnOpen3.OnMessage4.OnClose 4.导入配置类WebSocketConf…

【进程】利用 Linux 下的 /proc/pid/ 的内容学习进程

1. 进程号 在计算机中&#xff0c;每一个进程都有一个进程号&#xff0c;进程号类似于一个索引&#xff0c;操作系统就是通过这个进程号快速地找到进程。在 linux 使用 ps -aux 查看进程&#xff0c;可以看到进程号pid&#xff1a; rootswd-Lenovo-G40-80:/proc/4234# ps -au…

设计模式之两阶段终止模式

文章目录 1. 简介 2. 常见思路3. 代码实战 1. 简介 两阶段终止模式&#xff08;Two-Phase Termination Pattern&#xff09;是一种软件设计模式&#xff0c;用于管理线程或进程的生命周期。它包括两个阶段&#xff1a;第一阶段是准备阶段&#xff0c;该阶段用于准备线程或进程…