一.什么是缓存?
前言:什么是缓存?
缓存(Cache),就是数据交换的缓冲区,俗称的缓存就是缓冲区内的数据,一般从数据库中获取,存储于本地代码
前言:为什么要使用缓存?
一句话:因为速度快,好用
缓存数据存储于代码中,而代码运行在内存中,内存的读写性能远高于磁盘,缓存可以大大降低用户访问并发量带来的服务器读写压力
实际开发过程中,企业的数据量,少则几十万,多则几千万,这么大数据量,如果没有缓存来作为"避震器",系统是几乎撑不住的,所以企业会大量运用到缓存技术;
但是缓存也会增加代码复杂度和运营的成本:
1.1. 缓存的作用
- 降低后端负载
- 提高读写效率,提高响应时间
1.2. 缓存的成本
- 数据一致性成本
- 代码维护成本
- 运维成本
1.3.如何使用缓存
实际开发中,会构筑多级缓存来使系统运行速度进一步提升,例如:本地缓存与redis中的缓存并发使用
浏览器缓存:主要是存在于浏览器端的缓存
应用层缓存:可以分为tomcat本地缓存,比如之前提到的map,或者是使用redis作为缓存
数据库缓存:在数据库中有一片空间是 buffer pool,增改查数据都会先加载到mysql的缓存中
CPU缓存:当代计算机最大的问题是 cpu性能提升了,但内存读写速度没有跟上,所以为了适应当下的情况,增加了cpu的L1,L2,L3级的缓存
二.缓存模型和思路
标准的操作方式就是查询数据库之前先查询缓存,如果缓存数据存在,则直接从缓存中返回,如果缓存数据不存在,再查询数据库,然后将数据存入redis。
// 根据id查询信息@Overridepublic Result queryById(Long id) {// 从redis中查询缓存String Json = stringRedisTemplate.opsForValue().get("USER_KEY_"+id);// 判断是否存在if (StrUtil.isNotBlank(Json)) {// 存在,直接返回User user = JSONUtil.toBean(Json, User.class);return Result.success(user);}// 不存在,根据id查询数据库User user = getById(id);// 数据库不存在,返回错误if (user == null) {return Result.error("用户不存在!");}// 存在,写入redis并返回stringRedisTemplate.opsForValue().set("USER_KEY_" + id, JSONUtil.toJsonStr(user));return Result.success(user);}
三.缓存更新策略
缓存更新是redis为了节约内存而设计出来的一个东西,主要是因为内存数据宝贵,当我们向redis插入太多数据,此时就可能会导致缓存中的数据过多,所以redis会对部分数据进行更新,或者把他叫为淘汰更合适。
\ | 内存淘汰 | 超时剔除 | 主动更新 |
---|---|---|---|
说明 | 不同自己维护,利用Redis的内存淘汰机制,当内存不足时自动淘汰部分数据。下次查询时更新缓存 | 给缓存数据添加TTL时间,到期后自动剔除缓存。下次查询时更新缓存 | 编写业务逻辑,在修改数据库的同时,更新缓存 |
一致性 | 差 | 一般 | 好 |
维护成本 | 无 | 低 | 高 |
3.1 业务场景:
- 低一致性需求:使用内存淘汰机制。例如店铺类型的查询缓存
- 高一致性需求:主动更新,并以超时剔除作为兜底方案。
- 读操作:
- 缓存命中则直接返回。
- 缓存未命中则查询数据库,并写入缓存,设定超时时间。
- 写操作:
- 先写数据库,然后再删除缓存。
- 要确保数据库与缓存操作的原子性。
- 读操作:
3.2.数据库缓存不一致解决方案:
由于我们的缓存的数据源来自于数据库,而数据库的数据是会发生变化的,因此,如果当数据库中数据发生变化,而缓存却没有同步,此时就会有一致性问题存在
用户使用缓存中的过时数据,就会产生类似多线程数据安全问题,从而影响业务。怎么解决呢?有如下几种方案:
3.2.数据库和缓存不一致采用什么方案
由Cache Aside Pattern,我们可以引申出三个问题:
3.2.1.删除缓存还是更新缓存?
- 更新缓存:每次更新数据库都更新缓存,无效写操作较多。(不可取)
- 删除缓存:更新数据库时让缓存失效,下次查询时再更新缓存。(可取)
3.2.2.如何保证缓存与数据库的操作同时成功或失败?
- 单体系统,将缓存与数据库操作放在一个事务
- 分布式系统,利用TCC等分布式事务方案
3.2.3.先操作缓存还是先操作数据库?
- 先删除缓存,再操作数据库
- 先操作数据库,再删除缓存
应该具体操作缓存还是操作数据库?我们应当是先操作数据库,再删除缓存,原因在于:
如果你选择第一种方案,在两个线程并发来访问时,假设线程1先来,他先把缓存删了,此时线程2过来,他查询缓存数据并不存在,此时他写入缓存,当他写入缓存后,线程1再执行更新动作时,实际上写入的就是旧的数据,新的数据被旧数据覆盖了。
3.3.代码实现缓存与数据库双写一致
核心思路如下:
根据id查询时,如果缓存未命中,则查询数据库,将数据库结果写入缓存,并设置超时时间
@Overridepublic Result queryById(Long id) {// 从redis中查询缓存String Json = stringRedisTemplate.opsForValue().get("USER_KEY_" + id);// 判断是否存在if (StrUtil.isNotBlank(Json)) {// 存在,直接返回User user = JSONUtil.toBean(Json, Uer.class);return Result.success(user);}// 不存在,根据商铺id查询数据库User user = getById(id);// 数据库不存在,返回错误if (user == null) {return Result.error("用户不存在!");}// 存在,写入redis并返回stringRedisTemplate.opsForValue().set("USER_KEY_" + id, JSONUtil.toJsonStr(user), 30, TimeUnit.MINUTES);return Result.success(user);}
根据id修改时,先修改数据库,再删除缓存
@Override@Transactionalpublic Result update(User user) {Long id = user.getId();if (id == null) {return Result.error("用户id不能为空");}// 更新数据库updateById(user);// 删除缓存stringRedisTemplate.delete("USER_KEY_" + id);return Result.success();}
四.缓存穿透
缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这些请求都会打到数据库。
4.1.常见的解决方案有两种:
-
缓存空对象
-
优点:实现简单,维护方便
-
缺点:
-
额外的内存消耗
-
可能造成短期的不一致
-
-
-
布隆过滤
-
优点:内存占用较少,没有多余key
-
缺点:
-
实现复杂
-
存在误判可能
-
-
缓存空对象思路分析:当我们客户端访问不存在的数据时,先请求redis,但是此时redis中没有数据,此时会访问到数据库,但是数据库中也没有数据,这个数据穿透了缓存,直击数据库,我们都知道数据库能够承载的并发不如redis这么高,如果大量的请求同时过来访问这种不存在的数据,这些请求就都会访问到数据库,简单的解决方案就是哪怕这个数据在数据库中也不存在,我们也把这个数据存入到redis中去,这样,下次用户过来访问这个不存在的数据,那么在redis中也能找到这个数据就不会进入到缓存了
布隆过滤:布隆过滤器其实采用的是哈希思想来解决这个问题,通过一个庞大的二进制数组,走哈希思想去判断当前这个要查询的这个数据是否存在,如果布隆过滤器判断存在,则放行,这个请求会去访问redis,哪怕此时redis中的数据过期了,但是数据库中一定存在这个数据,在数据库中查询出来这个数据后,再将其放入到redis中,
假设布隆过滤器判断这个数据不存在,则直接返回
这种方式优点在于节约内存空间,存在误判,误判原因在于:布隆过滤器走的是哈希思想,只要哈希思想,就可能存在哈希冲突
4.2.编码解决查询的缓存穿透问题:
@Overridepublic Result queryById(Long id) {// 从redis查询缓存String Json = stringRedisTemplate.opsForValue().get("USER_KEY_" + id);// 判断是否存在if (StrUtil.isNotBlank(Json)) {// 存在,直接返回User user = JSONUtil.toBean(Json, User.class);return Result.success(user);}// 判断命中的是否为空值if (Json == null) {// 返回一个错误信息return Result.erroe("用户信息不存在!");}// 不存在,根据商铺id查询数据库User user = getById(id);// 数据库不存在,返回错误if (user == null) {// 将空值写入redis,避免缓存穿透// 返回错误信息stringRedisTemplate.opsForValue().set("USER_KEY_" + id, "", 30 , TimeUnit.MINUTES);return Result.error("用户不存在!");}// 存在,写入redis并返回stringRedisTemplate.opsForValue().set("USER_KEY_" + id, JSONUtil.toJsonStr(user), 30 , TimeUnit.MINUTES);return Result.success(user);}
五.缓存雪崩
缓存雪崩是指在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库,带来巨大压力。
解决方案:
-
给不同的Key的TTL添加随机值
-
利用Redis集群提高服务的可用性
-
给缓存业务添加降级限流策略
-
给业务添加多级缓存
六.缓存击穿
缓存击穿问题也叫热点Key问题,就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击。
逻辑分析:假设线程1在查询缓存之后,本来应该去查询数据库,然后把这个数据重新加载到缓存的,此时只要线程1走完这个逻辑,其他线程就都能从缓存中加载这些数据了,但是假设在线程1没有走完的时候,后续的线程2,线程3,线程4同时过来访问当前这个方法, 那么这些线程都不能从缓存中查询到数据,那么他们就会同一时刻来访问查询缓存,都没查到,接着同一时间去访问数据库,同时的去执行数据库代码,对数据库访问压力过大
常见的解决方案有两种:
-
互斥锁
-
逻辑过期
解决方案一:使用锁来解决
因为锁能实现互斥性。假设线程过来,只能一个人一个人的来访问数据库,从而避免对于数据库访问压力过大,但这也会影响查询的性能,因为此时会让查询的性能从并行变成了串行,我们可以采用tryLock方法 + double check来解决这样的问题。
假设现在线程1过来访问,他查询缓存没有命中,但是此时他获得到了锁的资源,那么线程1就会一个人去执行逻辑,假设现在线程2过来,线程2在执行过程中,并没有获得到锁,那么线程2就可以进行到休眠,直到线程1把锁释放后,线程2获得到锁,然后再来执行逻辑,此时就能够从缓存中拿到数据了。
解决方案二:逻辑过期方案
方案分析:我们之所以会出现这个缓存击穿问题,主要原因是在于我们对key设置了过期时间,假设我们不设置过期时间,其实就不会有缓存击穿的问题,但是不设置过期时间,这样数据不就一直占用我们内存了吗,我们可以采用逻辑过期方案。
我们把过期时间设置在 redis的value中,注意:这个过期时间并不会直接作用于redis,而是我们后续通过逻辑去处理。假设线程1去查询缓存,然后从value中判断出来当前的数据已经过期了,此时线程1去获得互斥锁,那么其他线程会进行阻塞,获得了锁的线程他会开启一个 线程去进行 以前的重构数据的逻辑,直到新开的线程完成这个逻辑后,才释放锁, 而线程1直接进行返回,假设现在线程3过来访问,由于线程线程2持有着锁,所以线程3无法获得锁,线程3也直接返回数据,只有等到新开的线程2把重建数据构建完后,其他线程才能走返回正确的数据。
这种方案巧妙在于,异步的构建缓存,缺点在于在构建完缓存之前,返回的都是脏数据。
两种方案对比:
6.1.利用互斥锁解决缓存击穿问题
核心思路:相较于原来从缓存中查询不到数据后直接查询数据库而言,现在的方案是 进行查询之后,如果从缓存没有查询到数据,则进行互斥锁的获取,获取互斥锁后,判断是否获得到了锁,如果没有获得到,则休眠,过一会再进行尝试,直到获取到锁为止,才能进行查询
如果获取到了锁的线程,再去进行查询,查询后将数据写入redis,再释放锁,返回数据,利用互斥锁就能保证只有一个线程去执行操作数据库的逻辑,防止缓存击穿
public User queryWithMutex(Long id) {String key = CACHE_USER_KEY + id;// 1、从redis中查询商铺缓存String Json = stringRedisTemplate.opsForValue().get("key");// 2、判断是否存在if (StrUtil.isNotBlank(Json)) {// 存在,直接返回return JSONUtil.toBean(Json, User.class);}//判断命中的值是否是空值if (Json != null) {//返回一个错误信息return null;}// 4.实现缓存重构//4.1 获取互斥锁String lockKey = "lock:user:" + id;User user = null;try {boolean isLock = tryLock(lockKey);// 4.2 判断否获取成功if(!isLock){//4.3 失败,则休眠重试Thread.sleep(50);return queryWithMutex(id);}//4.4 成功,根据id查询数据库user = getById(id);// 5.不存在,返回错误if(user == null){//将空值写入redisstringRedisTemplate.opsForValue().set(key,"",CACHE_NULL_TTL,TimeUnit.MINUTES);//返回错误信息return null;}//6.写入redisstringRedisTemplate.opsForValue().set(key,JSONUtil.toJsonStr(user),CACHE_NULL_TTL,TimeUnit.MINUTES);}catch (Exception e){throw new RuntimeException(e);}finally {//7.释放互斥锁unlock(lockKey);}return user;}
6.2.利用逻辑过期解决缓存击穿问题
思路分析:当用户开始查询redis时,判断是否命中,如果没有命中则直接返回空数据,不查询数据库,而一旦命中后,将value取出,判断value中的过期时间是否满足,如果没有过期,则直接返回redis中的数据,如果过期,则在开启独立线程后直接返回之前的数据,独立线程去重构数据,重构完成后释放互斥锁。
private static final ExecutorService CACHE_REBUILD_EXECUTOR = Executors.newFixedThreadPool(10);
public User queryWithLogicalExpire( Long id ) {String key = CACHE_USER_KEY + id;// 1.从redis查询缓存String json = stringRedisTemplate.opsForValue().get(key);// 2.判断是否存在if (StrUtil.isBlank(json)) {// 3.存在,直接返回return null;}// 4.命中,需要先把json反序列化为对象RedisData redisData = JSONUtil.toBean(json, RedisData.class);User user = JSONUtil.toBean((JSONObject) redisData.getData(), User.class);LocalDateTime expireTime = redisData.getExpireTime();// 5.判断是否过期if(expireTime.isAfter(LocalDateTime.now())) {// 5.1.未过期,直接返回return user;}// 5.2.已过期,需要缓存重建// 6.缓存重建// 6.1.获取互斥锁String lockKey = LOCK_USER_KEY + id;boolean isLock = tryLock(lockKey);// 6.2.判断是否获取锁成功if (isLock){CACHE_REBUILD_EXECUTOR.submit( ()->{try{//重建缓存this.saveUser2Redis(id,20L);}catch (Exception e){throw new RuntimeException(e);}finally {unlock(lockKey);}});}// 6.4.返回过期的信息return user;
}