Redis单线程 VS 多线程

一、Redis 为什么选择单线程?

这种说法其实并不严谨,为什么这么说呢?

Redis的版本有很多 3.x4.x6.x,版本不同架构也不同的,不限定版本问是否单线程也是不太严谨。

版本3.x,最早版本,也就是大家口口相传的redis的单线程,在3.x的版本是redis确实是单线程。

版本4.x,严格意义上来说也不是单线程,而是负责处理客户端请求的线程是单线程,但是开始加了多线程的东西(异步删除)。--并没有完全显现。

2020年5月版本的6.0x后及2022年推出的7.0版本后,告别了大家印象中的单线程,用一种全新的多线程来解决问题。---已经完全体现了。

里程碑的重要版本

5.0版本是直接升级到6.0版本,对于这次激进的升级,redis之父antirez表示得很有信心和兴奋,所以第一时间发文阐述了6.0的一些重大功能"Redis 6.0.0 GA is out!" ,当然,Redis7.0后版本更加厉害

1.Redis单线程介绍

        主要是指Redis网络IO的键值对读写是由一个线程来完成的,Redis在处理客户端的请求时包括获取(socket 读)、解析执行内容返回(socket 写)等都由一个顺序串行的主线程处理,这就是所谓的“单线程”。这也是 Redis对外提供键值存储服务的主要流程。

但是Redis的其他功能,比如持久化RDB、AOF、异步删除、集群数据同步等,其实是由额外的线程执行

Redis命令工作线程是单线程的,但是,整个Redis来说是多线程的。

2.单线程为什么很快?

Redis 3.x单线程时代性能依旧很快的主要原因如下:

  1. 基于内存操作Redis的所有数据都存在内存中,因此所有的运算都是内存级别的,所以他的性能比较高。
  2. 数据结构简单Redis的数据结构是专门设计的,而这些简单的数据结构的查找和操作的时间大部分复杂度都是O(1),因此性能比较高。
  3. 多路复用和非阻塞I/ORedis使用epollI/O多路复用功能来监听多个socket连接客户端,这样就可以使用一个线程来连接处理多个请求,减少线程切换带来的开销,同时也避免了I/O阻塞操作。
  4. 避免上下文切换:因为是单线程模型,因此就避免了不必要的上下文切换和多线程竞争,这就省去了多线程切换带来的时间和性能上的消耗,而且单线程不会导致死锁问题的发生。

官方说明

https://redis.io/docs/get-started/faq/

Redis是单线程的,如何利用多个CPU/内核?

CPU并不是使用Redis的瓶颈,因为通常Redis要么受内存限制,例如,使用在平均Linux系统上运行的流水线Redis每秒可以发送一百万个请求,因此,如果应用主要使用 O(N) 或者 (log (N) ) 命令,则几乎不会使用过多的CPU。

但是,为了最大成都利用CPU,可以在同一框中启动多个Redis实例,并将它们视为不同的服务器,在某个时候,单核可能还是不够,因此,如果需要使用多个CPU,则可以开始考虑更早地进行分片的某种方法。

但是,在Redis 4.0中,Redis具有更多线程,目前,这个仅限于后台删除对象,以及阻止通过Redis模块实现的命令,对于将来的版本,计划使用Redis越来越线程化。

        大致意思就是说Redis是基于内存操作的,因此它的瓶颈可能是机器的内存或者网络带宽而不是CPU,既然CPU不是瓶颈,那么自然就采用单线程的解决方案了,况且使用多线程比较麻烦。但是在 Redis 4.0 中开始支持多线程了,例如后台删除、备份等功能

Redis 4.0 之前一直采用单线程的主要原因有以下三个 :

  1. 使用单线程模型是Redis的开发和维护更加简单,因为单线程模型方便开发和调试。
  2. 即使使用单线程模型也可以并发的处理多客户端的请求,主要使用的是IO多路复用和非阻塞IO;
  3. 对于Redis系统来说,主要的性能瓶颈是内存或者网络带宽而非CPU

3.Redis 为什么要加入多线程?

既然单线程这么好,为什么逐渐又要加入了多线程特性呢?

因为的单线程也存在一定的问题,如在执行复杂任务时,线程卡死等操作...

3.1 单线程的问题

        正常情况下使用del指令可以很快的删除数据,而当被删除的key是一个非常大的对象的时候,例如包含了成千上万的元素 hash 集合时,那么del指令就会造成 Redis主线程卡顿等问题。

        这就是 redis3.x单线程时代最经典的故障,大key删除的头疼的问题

        由于Redis是单线程的,del bigKey ...等待很久这个线程才会释放,类似加了一个synchronized锁,你可以详细高并发下,线程堵塞导致系统崩溃无法使用。

3.2 解决方法

        使用惰性删除可以有效的避免Redis卡顿的问题,因为在使用del key是同步操作,则可以使用异步的操作解决这个问题。

        比如当需要删除一个很大的数据时,因为是单线程原子命令操作,这就会导致Redis服务卡顿,于是在Redis4.0 中新增了多线程的模块,当然次版本中多线程主要是为了解决删除数据效率比较低的问。

unlink key

flushdb async

flushall async

包删除的工作交给后台的子线程来完成异步删除数据。

        因为Redis是单主线程处理,redis支付antirez一直强调"Lazy Redis is better Redis"。

        而lazy free的本质就是把某些cost(主要时间复制度,占用主线程cpu)较高删除操作,而redis主线程剥离让bio子线程来处理,极大地减少主线程阻塞时间。从而减少删除导致性能和稳定性问题。

        在Redis 4.0就引入了多线程来实现数据的异步惰性删除等功能,但是其实读写请求仍然只有一个线程,所以仍然算是狭义上的单线程。

二、Redis6/7的多线程特性和IO多路复用

        对于Redis主要的性能瓶颈是内存或者网络带宽而非CPU

1.网络瓶颈

在Redis6/7中,非常收关注的第一个新特性就是多线程

        这是因为,Redis一直被大家熟知的就是它的单线程架构,虽然有些命令操作可以用后台线程或者子线程执行(比如数据删除、快照生成、AOF重写)。但是,从网络IO处理到实际的读写命令处理,都是由单个线程完成的。

        随着网络硬件的性能提升,Redis的性能瓶颈有时会出现在网络IO的处理上,也就是说,单个主线程处理网络请求的速度跟不上底层网络硬件的速度,为了应对这个问题:

        采用多个IO线程来处理网络请求,提高网络请求处理的并行度,Redis6/7就是采用的这种方法。

        但是,Redis的多IO线程只是用来处理网络请求的,对于读写操作命令Redis仍然使用单线程来处理。这是因为,Redis处理请求时,网络处理经常出现瓶颈,通过多个IO线程并行处理网络操作,可以提升实例的整体处理性能。而继续使用单线程执行命令操作,就不用为了保证Lua脚本事务的原子性、额外开发多线程互斥加锁机制了(不管加锁操作处理),这样一来,Redis线程模型实现就简单了。

2.主线程和IO线程协作

阶段一:服务端和客户端建立Socket连接,并分配处理线程

        首先,主线程负责接收建立连接请求,当有客户端请求和实例建立Socket连接时,主线程会创建和客户端的连接,并把Socket放入到全局等待队列中,紧接着,主线程通过轮询方式把Socket连接分配给IO线程。注意:主线程不一定会将连接直接分配给IO线程,而是通过 epoll或者其他I/O多路复用机制,主线程会监听多个连接,一旦有事件发生,比如有数据可读,主线程会通知对应的IO线程去处理,此外Redis可能会用线程来处理这些IO任务,而不是一对一地将连接分配给IO线程。

阶段二:IO线程读取并解析请求

        主线程一旦把Socket分配给IO线程,就会进入阻塞状态,等待IO线程完成客户端请求读取解析。因为有多个IO线程在并行处理,所以,这个过程很快就可以完成。

阶段三:主线程执行请求操作

        等待IO线程解析完请求,主线程还是会以单线程的方式执行这些命令操作。

阶段四:IO线程回写Socket和主线程清空全局队列

        当主线程执行完请求操作后,会把需要返回的结果写入到缓冲区,然后,主线程会阻塞等待IO线程,把这些结果写回到Socket中,并返回给客户端。和IO线程读取和解析请求一样,IO线程回写Socket时,也是有多个线程在并发执行,所以回写Socket的速度也很快。等到IO线程回写Socket完毕,主线程会清空全局队列,等待客户端的后续请求。

3.Unix网络中五种IO模型

  • Blocking IO - 阻塞IO
  • NoneBlocking IO - 非阻塞IO
  • IO multplexing - IO多路复用
  • signal driven IO - 信号驱动IO
  • asynchronous IO - 异步IO

IO multplexing - IO 多路复用

Linux世界中一切皆文件:文件描述符:简称FD,句柄

  File descriptor:文件描述符(File descriptor)是计算机科学中的一个术语,是一个用于表述指向文件的引入的抽象化概念。文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符。在程序设计中,文件描述符这一概念往往只适用于UNIXLinux这样的操作系统。

4.IO多路复用

        一种同步的IO模型,实现一个线程监视多个文件句柄一旦某个文件句柄就绪就能够通知到对应应用程序进行响应的读写操作,没有文件句柄就绪时会阻塞应用程序,从而释放CPU资源。

        总而言之就是:I/O多路复用是一种高效的I/O操作机制,用于同时监视多个I/O流的可读性、可写性或异常情况,而无需为每个I/O流分配一个单独的线程或进程。这种技术允许一个单独的线程或进程来管理多个I/O操作,从而减少了系统资源的消耗并提高了系统的响应性和吞吐量。

4.1 概念

  • I/O:网络I/O,尤其在操作系统层面指数据在内核态和用户态之间的读写操作。
  • 多路多个客户端连接(连接就是套接字描述符,即socket 或者 channel)
  • 复用:复用一个或几个线程。
  • IO多路复用:也就是说一个或一组线程处理多个TCP连接,使用单进程就能够实现同时处理多个客户端的连接,无需创建或者维护过多的进程/线程。

一个服务端进程可以同时处理多个套接字描述符,实现IO多路复用的模型有三种:可以分select -> poll ->epoll三个阶段来描述。

select():select() 是一种比较早的I/O多路复用机制,它允许程序员监视一组文件描述符,并在其中任何一个文件描述符就绪时进行通知。但是select()有一些限制,比如它通常有最大文件描述符数量的限制,并且在大量文件描述符的情况下性能较差。

poll():poll() 是对select()的改进,它也可以同时监视多个文件描述符,但没有select()的一些限制,poll()使用一个pollfd结构数组来传递需要监视的文件描述符和所关注的事件。

epoll:epoll()是Linux特有的I/O多路复用机制,它提供了更高效的时间通知机制。相比较select()poll()epoll()在处理大量文件描述符时具有更好的性能。epoll()使用一个epoll实例来管理需要监视的文件描述符,并通过epoll_ctl()来添加、删除或者修改监视的文件描述符。然后通过epoll_wait()来等待就绪时间的发送。

I/O多路复用的优势在于,它避免了创建多个线程或者进程来处理I/O操作,从而减少了上下文切换的开销,提高了系统的性能和资源利用率,这种技术常用于网络编程中,用于处理大量并发连接的情况,例如WEB服务器、聊天服务器等。

4.2 IO多路复用模型

场景分析

        模拟一个tcp服务器处理30个客户端socket ,假设你是一个监考老师,让30个学生解答一道竞赛考题,然后负责验收学生答卷,你有下面几个选择:

        第一种选择(轮询):按照顺序逐个验收,先验收A、然后是B,之后是C、D。。。这中间如果有一个学生卡主了,全班都会被耽误,你用循环挨个处理socket,根本不具有并发能力。

        第二种选择(来一个new一个,一对一服务):你创建30个分身线程,每个分身线程检查一个学生的答案是否正确。这种类似于为每个用户创建一个进程或者线程处理连接。

        第三种选择(响应式处理,1对多服务):你站在讲台上等,谁解答完谁举手。这时C、D举手,表示他们解答问题完毕,你下去依次检查C、D的答案,然后继续回到讲台上等。此时E、A又举手,然后去处理E和A。。。这种就是IO复用模型Linux下的selectpollepoll就是干这个的。

IO多路复用模型

        将用户socket对应的文件描述符(FileDescriptor)注册进epoll,然后epoll帮你监听哪些socket上有消息到达,这样就避免了大量的无用操作。此时的socket应该采用非阻塞模式。这样,整个过程只在调用selectpollepoll这些调用的时候才会堵塞,收发客户消息是不会阻塞的,整个进程或线程就被充分利用起来,这就是事件驱动,所谓的reactor反应模式。

        在单个线程通过记录跟踪每一个Socket(I/O流)的状态俩同时管理多个I/O流,一个服务端进程可以同时处理多个套接字描述符。目的是尽量的提高服务器的吞吐能力。

        大家都用过nignxnginx使用epoll接收请求,nginx会有很多请求过来,epoll会把他们都监视起来,然后像拨开关一样,谁有数据就拨向谁,然后调用相应的代码处理。redis类似同理,这就是I/O多路复用原理,有请求就响应,没有请求不打扰。

4.3 Reactor模型

        Redis服务采用Reactor的方式来实现文件事件处理器(每一个网络连接其实都对应一个文件描述符)

        Redis基于Reactor模式开发了网络事件处理器,这个处理器被称为文件事件处理器。它的组成结构为4部分:

        多个套接字、IO多路复用程序、文件时间分配器、事件处理器,因为文件事件分派器队列的消费是单线程的,所以Redis才叫单线程模型。

        基于I/O复用模型:多个连接共用一个阻塞对象,应用程序只需要在一个阻塞对象上等待,无需阻塞等待所有连接。当某条连接有新的数据可以处理时,操作系统通知应用程序,线程从线程阻塞状态返回,开始进行业务处理。

        Reactor模式,是指通过一个或者多个输入同时传递给服务器的服务请求的事件驱动处理模式。服务端程序处理传入多路请求,并将它们同步分派给请求对应处理线程,Reactor模式也叫Dispatcher模式,即I/O多路复用统一监听事件,收到事件后分发(Dispatch 给某进程),是编写高性能网络服务器的必备技术。

Reactor模式中有2个关键组成:

  1. Reactor:Reactor在独立的线程中运行,负责监听和分发事件,分发给适当的处理程序对IO事件做出反应。它就像公司的电话接线员,它接听来自客户的电话并将线程转移到适当的联系人;
  2. Handlers:处理程序执行I/O事件要完成的实际事件,类似于客户想要与之交谈的公司的实际办理人。Reactor通过调度适当的处理程序来响应I/O事件,处理程序执行非阻塞操作。

三、结论

  Redis工作线程是单线程的,但是对于整个Redis来说是多线程的。

  I/O的读和写本身就是堵塞的,比如当scoket中有数据时,Redis会通过调用先将数据从内核空间拷贝到用户态空间,再交给Redis调用,而这个拷贝的过程就是阻塞的,当数量越大时拷贝所需要的时间就越多,这些操作都是基于单线程完成的。

        从Redis6开始,就新增了多线程的功能来提高I/O的读写性能,他的主要实现思路是将主线程的IO读写任务拆分给一组独立的线程去执行,这样就可以使多个socket的读写可以并行化了,采用多路I/O复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时间消耗),将最耗时的Scoket的读取、请求解析、写入单独外包出去,剩下的命令执行让然由主线程串行执行并和内存的数据交互。

结合上图可知,网络IO操作就变成多线程化了,其他核心部分仍然是线程安全的,是一个不错的折中办法。

  Redis6 --> 7将网络数据读写、请求协议解析通过多个IO线程来处理,对于真正的命令执行来说,仍然使用主线程操作,一举两得。

22

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/300902.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单片机为什么还在用C语言编程?

单片机产品的成本是非常敏感的。因此对于单片机开发来说,最重要的是在极其有限的ROM和RAM中实现最多产品的功能。或者反过来说,实现相同的产品功能,所需要的ROM和RAM越小越好,在开始前我有一些资料,是我根据网友给的问…

centos安装使用elasticsearch

1.首先可以在 Elasticsearch 官网 Download Elasticsearch | Elastic 下载安装包 2. 在指定的位置(我的是/opt/zhong/)解压安装包 tar -zxvf elasticsearch-7.12.1-linux-x86_64.tar.gz 3.启动es-这种方式启动会将日志全部打印在当前页面,一旦使用 ctrlc退出就会导…

【Leetcode每日一题】 动态规划 - LCR 166. 珠宝的最高价值(难度⭐⭐)(52)

1. 题目解析 题目链接:LCR 166. 珠宝的最高价值 这个问题的理解其实相当简单,只需看一下示例,基本就能明白其含义了 2.算法原理 想象一下,你正在玩一个寻宝游戏,游戏地图是一个二维网格,每个格子都藏有一…

【Linux ARM 裸机】开发环境搭建

1、Ubuntu 和 Windows 文件互传 使用过程中,要频繁进行 Ubuntu 和 Windows 的文件互传,需要使用 FTP 服务; 1.1、开启 Ubuntu 下的 FTP 服务 //安装 FTP 服务 sudo apt-get install vsftpd //修改配置文件 sudo vi /etc/vsftpd.conf//重启…

易宝OA ExecuteSqlForDataSet SQL注入漏洞复现

0x01 产品简介 易宝OA系统是一种专门为企业和机构的日常办公工作提供服务的综合性软件平台,具有信息管理、 流程管理 、知识管理(档案和业务管理)、协同办公等多种功能。 0x02 漏洞概述 易宝OA ExecuteSqlForDataSet接口处存在SQL注入漏洞,未经身份认证的攻击者可以通过…

设计模式深度解析:AI大模型下的策略模式与模板方法模式对比解析

​🌈 个人主页:danci_ 🔥 系列专栏:《设计模式》《MYSQL应用》 💪🏻 制定明确可量化的目标,坚持默默的做事。 策略模式与模板方法模式对比解析 文章目录 🌟引言🌟Part 1:…

neo4j图数据库下载安装配置

neo4j下载地址Index of /doc/neo4j/3.5.8/ 1.说明:jdk 1.8 版本对应的 neo4j 数据库版本 推荐安装3.X版本 2.配置系统环境变量 3.启动 neo4j.bat console 4.访问

智慧城市治理:构建全域覆盖的城市时空感知体系

TSINGSEE青犀AI算法中台是一款平台型产品,专注于提供各行业中小场景部署解决方案。平台具备接入广、性能强、支持跨平台、芯片国产化等特点,可提供丰富的视图接入能力和智能分析能力。 平台采用了多项IT高新技术,包括视频编解码技术、嵌入式…

《深入浅出多模态》:多模态经典模型CLIP

🎉AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职…

10 Python进阶:MongoDB

MongoDb介绍 MongoDB是一个基于分布式架构的文档数据库,它使用JSON样式的数据存储,支持动态查询,完全索引。MongoDB是NoSQL数据库的一种,主要用于处理大型、半结构化或无结构化的数据。以下是MongoDB数据库的一些关键特点和优势&a…

k8s单节点部署,容器运行时使用containerd

环境 系统 : entOS Linux release 7.9.2009 (CoreIP:192.168.44.177 硬件要求:控制平面最少需要 2c2g 安装前环境准备 如果是集群部署还需要配置时间同步 关闭防火墙 systemctl disable firewalld关闭selinux setenforce 0sed -i s/SELI…

深入浅出 -- 系统架构之微服务架构选型参考图

技术选型架构图 是一个用于展示项目中所采用的各种技术和组件之间关系的图表。 它通常包括以下几个部分: 1. 项目名称和描述:简要介绍项目的背景和目标。 2. 技术栈:列出项目中使用的主要技术和工具,如编程语言、框架、数据库…

RabbitMQ Docker 安装与应用

1.官方镜像 该镜像包含用户操作界面 2.Docker运行,并设置开机自启动 docker run -d --restartalways --name rabbitmq -p 5672:5672 -p 15672:15672 rabbitmq:3.10-management 默认登录账户和密码 guest 3、使用 队列和交换机绑定

理解PostgreSQL中的postmaster.pid

在PG中,一个简要的体系结构图可以大致画成下边的样子: Server端基本上分成backend process和若干background process。这些process都是一个名为postmaster进程的子进程。而postmaster则是postgres进程的别名。 进程概况 [14:42:08-postgrescentos1:/pg…

Ubuntu22.04平台编译完美解决问题“error: GLSL 4.5 is not supported.”【GLSL(OpenGL着色器语言)】

GLSL介绍 GLSL(OpenGL着色器语言)是用于编写OpenGL着色器程序的语言。GLSL 4.5 是 GLSL 的一个版本,引入了许多新的特性和改进,旨在提高着色器编程的灵活性和性能。GLSL 4.5 工具通常是用于编写、调试和优化 GLSL 4.5 着色器代码…

SinoDB数据库导入导出工具unload/load

unload/load是最常使用的最简单的数据导入、导出工具,支持的数据格式为以固定分隔符(如“|”为默认的分隔符)分隔的文本文件。 1. unload 数据导出 使用方法如下: unload to filename’ [DELIMITER ‘delimiter’] SELECT Statement; 其中: filename可…

Octopus V2:设备端super agent的高级语言模型

论文:Octopus v2: On-device language model for super agent论文地址:https://arxiv.org/abs/2404.01744模型主页:https://huggingface.co/NexaAIDev/Octopus-v2 Octopus-V2-2B Octopus-V2-2B 是一款具有20亿参数的开源先进语言模型&#…

【论文速读】| 大语言模型平台安全:将系统评估框架应用于OpenAI的ChatGPT插件

本次分享论文为:LLM Platform Security: Applying a Systematic Evaluation Framework to OpenAI’s ChatGPT Plugins 基本信息 原文作者:Umar Iqbal, Tadayoshi Kohno, Franziska Roesner 作者单位:华盛顿大学圣路易斯分校,华盛…

数据备份的演变:数字时代的一个关键方面

微信关注获取更多内容 数据备份至关重要,涵盖了其过去、现在和未来,是数字时代任何企业运营的一个重要方面。 如今,公司运营的几乎每个方面,从客户信息到内部财务数据,都以数字方式存储。 有鉴于此,数据…

【IoTDB 线上小课 01】我们聊聊“金三银四”下的开源

关于 IoTDB,关于物联网,关于时序数据库,关于开源...你是否仍有很多疑问? 除了自己钻研文档,群里与各位“大佬”的沟通,你是否还希望能够有个学习“捷径”? 天谋科技发起社区小伙伴,正…