本文出自:https://thinkinjava.cn
作者:莫那 鲁道
1. 什么是缓存雪崩?怎么解决?
一般而言,我们会利用缓存来缓冲对数据库的冲击,假如缓存无法正常工作,所有的请求便会直接发送至数据库,进而导致数据库崩溃,从而导致整个系统崩溃。
如何解决呢?
2 种策略(同时使用):
-
对缓存做高可用,防止缓存宕机
-
使用断路器,如果缓存宕机,为了防止系统全部宕机,限制部分流量进入 DB,保证部分可用,其余的请求返回断路器的默认值。
2. 什么是缓存穿透?如何解决?
解释 1:缓存查询一个不存在的键,同时数据库也没有该键,如果黑客大量使用这种方式,将导致数据库宕机。
解决方案:我们可以采用一个默认值来避免,例如,当访问一个不存在的键时,然后再去查询数据库,如果仍然没有找到,则在缓存中放置一个占位符。下次请求到来时,检查该占位符,如果存在占位符,就不再查询数据库,以防止数据库宕机。
解释 2:大量请求查询一个刚刚失效的键,导致数据库压力倍增,可能会导致宕机,但实际上,这些请求都是查询相同的数据。
解决方案:可以在这些请求代码中添加双重检查锁。尽管这些请求的处理时间会变长,但总比数据库宕机要好。
3. 什么是缓存并发竞争?如何解决?
解释:多个客户端同时写入同一个键,如果顺序错乱,数据就会不正确。但我们无法控制写入的顺序。
解决方案:使用分布式锁,如 ZooKeeper,并加入数据的时间戳。在同一时刻,只有成功抢到锁的客户端才能进行写入操作,并且在写入时,需要比较当前数据的时间戳和缓存中数据的时间戳。
4. 什么是缓存与数据库双写不一致?如何解决?
解释:连续写入缓存和数据库,但在操作过程中发生并发操作,导致数据不一致。
通常情况下,更新缓存与数据库有以下几种顺序:
-
先更新数据库,再更新缓存。
-
先删除缓存,再更新数据库。
-
先更新数据库,再删除缓存。
对这三种方式的优劣进行分析:
先更新数据库,再更新缓存。
这种方式存在的问题是:当有两个请求同时更新数据时,如果没有使用分布式锁,则无法控制最终缓存中的值将是多少。即存在并发写入时的问题。
先删除缓存,再更新数据库。
这种方式存在的问题是:如果在删除缓存之后,有客户端读取数据,可能会读取到旧数据,并且有可能将旧数据设置回缓存,导致缓存中的数据一直是旧数据。
针对这个问题有两种解决方案:
-
使用"双删",即第一次删除后再次删除,将最后一步的删除操作设置为异步操作,以防止在客户端读取操作时设置了旧值。
-
使用队列,在该键不存在时将其放入队列中,串行执行,必须等待数据库更新完成后才能读取数据。
总的来说,这些解决方案都比较麻烦。
先更新数据库,再删除缓存。
这是一种常用的方式,但很多人并不知道,这种方式称为Cache Aside Pattern,是由外国人发明的。如果先更新数据库再删除缓存,会出现在更新数据库之前可能会有一段时间数据不是最新的情况。
同时,如果在更新之前缓存正好失效,在写入客户端完成删除操作后又设置了旧值,这是一个非常巧合的情况。
有两个前提条件:缓存在写入之前失效,同时写入客户端删除操作结束后立即设置旧数据 - 即读取操作比写入慢。另外,某些写入操作可能会造成表锁定。
所以,这种情况很少发生,但如果发生了怎么办?使用"双删"!记录更新期间是否有客户端读取数据库,如果有,在数据库更新完成后执行延迟删除。
还有一种可能,如果在执行更新数据库之前准备执行删除缓存操作时服务挂了,导致删除操作失败怎么办?可以通过订阅数据库的binlog来进行删除操作。
顶尖架构师栈
关注回复关键字
【C01】超10G后端学习面试资源
【IDEA】最新IDEA激活工具和码及教程
【JetBrains软件名】 最新软件激活工具和码及教程
工具&码&教程
转载: https://mp.weixin.qq.com/s/mG3q5UpXcRQoxdvoZZ7Xmg
本文由 mdnice 多平台发布