【架构-14】数据库性能优化方式

数据库出现性能瓶颈对外的表现为:

  1. 大量请求阻塞
  2. SQL操作变慢
  3. 存储出现问题
    为解决上述出现的问题,因此推出了一系列的数据库性能优化方式。
    数据库性能优化是提高数据库系统性能和响应时间的关键任务。以下是一些常见的

数据库性能优化方式:

索引优化:
通过创建合适的索引,可以加快查询操作的速度。索引可以加速数据的查找和过滤,减少磁盘I/O操作。需要根据查询的频率、字段选择性以及数据访问模式等因素来设计和优化索引。

查询优化:
优化查询语句可以提高数据库的性能。使用合适的查询语句、避免不必要的连接和子查询、限制返回的数据量、优化WHERE和JOIN条件等都可以改善查询性能。

数据库设计和规范化:
良好的数据库设计和规范化可以提高数据库的性能和可维护性。合理划分表和字段、避免冗余数据、正确选择数据类型和长度等都是优化数据库设计的关键。

配置调优:
优化数据库的配置参数可以提高数据库的性能。例如,调整数据库缓冲区大小、并发连接数、日志记录级别等参数,以适应不同的工作负载和硬件环境。

硬件优化:
合理配置和优化硬件设备可以改善数据库性能。包括增加内存容量、优化磁盘子系统、使用RAID技术提高磁盘性能、使用高速网络等。

缓存优化:
使用缓存技术可以减少数据库的访问次数,提高响应速度。常见的缓存技术包括数据库查询缓存、应用级缓存、分布式缓存等。

分区和分片:
对于大规模数据量和高并发访问的场景,可以使用分区和分片技术来分散负载、提高吞吐量和扩展性。

SQL优化工具和性能监控:
使用专业的SQL优化工具和性能监控工具可以帮助识别慢查询、锁竞争、瓶颈等问题,并提供相应的优化建议和性能指标。

数据库版本升级和补丁更新:
及时升级数据库版本和应用相关的补丁可以获得性能改进和Bug修复,提高数据库的稳定性和性能。

数据库分布和负载均衡:
将数据库分布在多个物理节点上,并使用负载均衡技术将请求均匀分发到不同节点,可以提高系统的可用性和扩展性。

下面详细介绍几类技术:

分库和分表

在数据库优化中,分库(Sharding)和分表(Partitioning)是两种常见的策略,用于解决大规模数据量和高并发访问的问题。

  1. 分库(分片)
    分库是将数据库按照一定规则将数据划分为多个独立的数据库实例,每个数据库实例可以部署在不同的物理服务器或节点上。每个数据库实例负责处理一部分数据。
    分库的目的是将数据分散存储在不同的数据库中,以减轻单个数据库的负载压力,并提高系统的并发处理能力和扩展性。通常,分库的规则是基于数据的某个属性或哈希函数计算的结果来确定数据应该存储在哪个数据库实例中。
    分库也带来了如数据一致性、跨库事务、扩展性的管理等挑战。
    在这里插入图片描述
    在这里插入图片描述

  2. 分表
    分表是将单个表按照一定的规则拆分为多个子表,每个子表存储部分数据。
    分表的目的是将大表拆成小表,以减少单个表的数据量,提高查询性能和维护的效率。
    分表也会增加数据管理的复杂性。
    在这里插入图片描述

分库和分表通常结合使用,以更好地处理海量数据和高并发访问的需求。它们是数据库优化中常见手段,可以提高系统的性能、可扩展性和可用性。

反规范化设计

优点:避免进行表之间的连接操作,可以提高数据操作的性能能够,减少数据库查询时SQL的连接次数,从而减少磁盘IO,提高查询效率。
缺点:数据的重复存储浪费了磁盘空间,会产生数据的不一致问题
在这里插入图片描述

1、反规范化设计中,解决数据不一致问题的三种常见方法,有批处理维护、应用逻辑和触发器。
(1)异步通信和事件驱动:使用异步通信和事件驱动的方式来处理数据的更新和同步。当数据发生变化时,通过异步消息队列或事件总线发布相应的事件,然后由订阅者异步处理和更新相关的数据。这种方式可以降低数据更新的延迟和冲突。
(2)定期数据清理和维护(批处理维护):定期对数据进行清理和维护是确保数据一致性的重要步骤。这包括删除过期或无效的数据,修复错误数据,更新数据索引等操作,以保持数据的一致性和可靠性。通过定期运行一批处理作业或存储过程对数据库进行修改,适用于对实时性要求不高的情况。
(3)触发器:对数据的任何修改立即触发对数据库某些列的相应修改。触发器实时性好,也易于维护。

布隆过滤器(查询优化)

布隆过滤器是一种概率型数据结构,用于判断一个元素是否属于一个集合,以及过滤掉不属于集合的元素。它通过使用位数组和多个哈希函数来实现。
在这里插入图片描述

布隆过滤器本质是一种数据结构,特点是高效地插入和查询。原理是当某个元素加入集合时,通过散列函数将这个元素映射成一个位数组中的K个点,检索时只要看看这些点是不是都是1就大概知道集合中有没有它了,如果这些点有任何一个0,则被检元素一定不在,如果都是1,被检元素可能在。
主要解决的问题是在大规模数据集中快速判断某个元素是否存在,同时具有高效的空间利用率。布隆过滤器适用于那些对查询速度要求较高,而对少量的误判能够容忍的场景。
然而,布隆过滤器也存在一定的缺点。它有一定的误判率,即可能将不属于集合的元素误判为属于集合。此外,无法删除已插入的元素,因为删除操作会影响其他元素的判断结果。

一致性哈希算法(数据分布和负载均衡)

一致性哈希算法是一种用于分布式系统中数据分片和负载均衡的算法。哈希算法是通过某种哈希算法散列得到一个值,将该值分配到集群响应节点进行缓存。
一致性哈希算法是一种特殊的哈希算法,它将整个哈希空间映射成一个按顺时针方向组织的虚拟圆环,使用哈希算法算出数据的哈希值,然后根据哈希值的位置顺时针查找,将数据分配到第一个遇到的集群节点进行缓存,解决了简单哈希算法在分布式哈希表中存在的动态伸缩问题。
主要解决的问题是在分布式系统中动态添加或删除节点时,如何保持数据的均衡分步和最小的数据迁移的操作。一致性哈希算法通过在环空间上均匀分步节点,使相邻节点负责的数据范围最小,从而减少数据迁移的开销。
一致性哈希算法的优点在于它在节点增减时能够保持负载均衡,适用于分布式缓存、负载均衡、分布式存储等场景。

Redis持久化(缓存优化)

为什么要持久化(答:Redis的数据全部存储在内存中,如果突然宕机,数据就会全部丢失,因此必须有一套机制来保证Redis的数据不会以为故障而丢失)
持久化方法
在这里插入图片描述

Redis持久化技术有RDB内存快照(全集)、AOF日志(快速)两种。RDB内存快照方式就是把当前内存中的数据集快照写入磁盘(数据库中所有键值对数据)。恢复时是将快照文件直接读到内存里。AOF是通过持续不断地保存Redis服务器所执行的更新命令来记录数据库状态,类似mysql的binlog。恢复数据时需要从头开始回放更新命令。
用AOF来保证数据不丢失,作为数据恢复的第一选择;用RDB来做不同程度的冷备,在AOF文件都丢失或损坏不可用时,还可以使用RDB来进行快速的数据恢复。
缓存问题:
本质:别让数据库去抗所有流量
缓存穿透:大量的key在redis里是不存在的
缓存雪崩:大量的key是已存在的,但同时失效了
缓存击穿:少量热点的key缓存时间失效了
解决方案:采用cluster集群(分片或主从复制和哨兵模式、读写分离、分库分表)、服务降级、服务熔断、请求限流。

主从复制

优势:(1)避免数据库单点故障、提高可用性。主服务器实时、异步复制数据到从服务器,当主数据宕机时,可从数据库中选择一个升级为主服务器,防止数据库单点故障。
(2)提高查询效率,主数据库可进行数据的插入、删除等写操作,而从数据库专门用来进行数据的查询操作,将不同操作分担到不同服务器以提高数据库访问效率。
主从复制的三种模式
(1)全同步复制,是指主库在执行完一个事务后,会等待所有从库执行完该事务后,才会把结果返回到客户端。这种方式的优点是数据一致性较高,但性能比较低。
(2)异步复制,主库在执行完客户端提交的事务后,会立即将结果返回给客户端。不关心从库是否已经接收并处理。
(3)半同步复制,主库在执行完客户端提交的事务后,会等待至少一个从库接收到后,才会将结果返回到客户端。牺牲了一定的性能,提高了数据的安全性。
主从复制的工作流程如下:
(1)主节点接收到写操作后,会将写操作记录成二进制日志(Binary Log)并持久化存储。
(2)从节点连接到主节点,并请求同步二进制日志。主节点将二进制日志发送给从节点。
(3)从节点将接收到的二进制日志应用到自己的数据库中,使其与主节点保持一致。
(4)当客户端发起读操作时,可以选择连接主节点或从节点。从节点负责处理读操作,从而减轻主节点的负载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/311944.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spark-机器学习(2)特征工程之特征提取

在之前的文章中,我们了解我们的机器学习,了解我们spark机器学习中的MLIib算法库,知道它大概的模型,熟悉并认识它。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错&a…

【网络编程】UDP实现回显服务器

一.网络编程的基本术语. 客户端 客户端是为用户提供本地服务的程序,通常位于用户设备上。也称为用户端,是相对于服务器而言的。它主要指安装在用户设备上的程序,这些程序能够与服务器进行通信,从而获取服务或者执行特定功能。在…

Visual Studio code无法正常执行Executing task: pnpm run docs:dev

最近尝试调试一个开源的项目,发现cmd可以正常启动,但是在vs中会报错,报错内容如下 Executing task: pnpm run docs:dev pnpm : 无法加载文件 E:\XXXX\pnpm.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参阅 http…

java Web实现用户登录功能

文章目录 一、纯JSP方式实现用户登录功能(一)实现思路1、创建Web项目2、创建登录页面3、创建登录处理页面4、创建登录成功页面5、创建登录失败页面6、编辑项目首页 (三)测试结果 二、JSPServlet方式实现用户登录功能(一…

Python基于深度学习的屋内烟雾检测系统的研究与实现,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

【教程】ubuntu20.04 下配置 Charm-crypto 0.5 实验环境

目录 前言先决条件基本依赖安装准备好 gcc,make 和 perl准备好 m4,flex,bison 和 libssl-dev安装 Python3.x,pip3 和 pyparsing 安装 OpenSSL安装 GMP5.x安装 PBC安装 Charm-crypto5.0安装开发环境检验 Charm-crypto5.0 安装成功参…

STM32有什么高速接口吗?

STM32系列微控制器在高速接口方面也提供了一些强大的功能,虽然没有像Zynq那样的可编程逻辑部分,但有一些特性值得注意。我这里有一套嵌入式入门教程,不仅包含了详细的视频 讲解,项目实战。如果你渴望学习嵌入式,不妨点…

数据分析(2)

数据分析(2) 本文介绍pandas的另一种数据类型DataFrame,中文叫数据框 DataFrame 定义: DataFrame是一个二维的矩阵数据表,通过行和列,可以定位一个值。 在某种程度上,可以认为DataFrame是“具有相同ind…

OpenStack:开源云计算的崛起与发展

目录 一,引言 二,OpenStack的起源 三,OpenStack的版本演进 四,OpenStack跟虚拟化的区别 五,OpenStack组件介绍 1)Horizon介绍 2)KeyStone介绍 Keystone 功能概览 Keystone 架构详解 3&a…

上海计算机学会 2023年10月月赛 乙组T3 树的连通子图(树、树形dp)

第三题:T3树的连通子图 标签:树、树形 d p dp dp题意:给定一棵 n n n个结点的树, 1 1 1号点为这棵树的根。计算这棵树连通子图的个数,答案对 1 , 000 , 000 , 007 1,000,000,007 1,000,000,007取余数。题解&#xff1…

解决QtCreator不能同时运行多个程序的方法

当我们运行QtCreator代码的时候,往往一个代码,可能需要打开好几个运行,但是会出现的情况就是,如果打开了一个界面,当我么再运行的时候,第一个界面就没有了,而且可能会出现终端报错的情况&#x…

笔记本电脑上的聊天机器人: 在英特尔 Meteor Lake 上运行 Phi-2

对应于其强大的能力,大语言模型 (LLM) 需要强大的算力支撑,而个人计算机上很难满足这一需求。因此,我们别无选择,只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上。 为何需要将 LLM 推理本地化 如果我们可以在典配…

鸿蒙南向开发:【编译和烧录】指导

编译 #进入源码目录 #rm -rf ohos_config.json #hb set #. #如下图所示,按↑↓键,选择需要编译的工程名,然后回车 #hb build -f #然后回车,等待屏幕出现:BUILD SUCCESS字样,说明编译成功。如下图 #编译生成的固件在…

Java项目如何使用EasyExcel插件对Excel数据进行导入导出

文章目录 一、EasyExcel的示例导入依赖创建实体类数据导入和导出 二、EasyExcel的作用三、EasyExcel的注解 EasyExcel是一个阿里巴巴开源的excel处理框架,它以使用简单、节省内存著称。在解析Excel时,EasyExcel没有将文件数据一次性全部加载到内存中&…

IAM 统一身份认证与访问管理服务

即统一身份认证与访问管理服务,是云服务商提供的一套云上身份管理解决方案,可帮助企业安全地管理云上资源的访问权限。 在当今云计算时代,企业越来越依赖云服务来存储和处理敏感数据。然而,这也带来了新的安全挑战,即…

LeetCode——965. 单值二叉树

题目- 力扣(LeetCode) 如果二叉树每个节点都具有相同的值,那么该二叉树就是单值二叉树。 只有给定的树是单值二叉树时,才返回 true;否则返回 false。 示例 1: 输入:[1,1,1,1,1,null,1] 输出&a…

移除元素,合并两个有序数组

目录 1.移除元素 解题思路 代码 2.合并两个有序数组 解题思路 代码 1.移除元素 解题思路 原地删除数组num的val元素,那么我们需要做的是遍历num数组 再次过程中越过num数组val的元素,找num数组中不是val的原素,并把它们从头依次放入…

【重回王座】ChatGPT发布最新模型gpt-4-turbo-2024-04-09

今天,新版GPT-4 Turbo再次在大型模型排行榜上荣登榜首,成功超越了此前领先的Claude 3 Opus。另外,新模型在处理长达64k的上下文时,性能竟能够与旧版在处理26k上下文时的表现相当。 目前GPT-4 Turbo仅限于ChatGPT Plus的用户&…

锂电池充放电管理-单片机通用

锂电池充放电管理-单片机通用 一、锂电池充放电检测的原理二、power.c的实现三、power.h的实现四、锂电池检测和充电电路 一、锂电池充放电检测的原理 ①两节锂电池通过电阻分压检测ADC,再根据电压划分电量等级;②充电使用的是锂电池充电IC方案&#xf…

LangChain-Chatchat 开源知识库来了

LangChain-Chatchat 开源知识库来了 LangChain-Chatchat 架构设计LangChain-ChatChat 具体实现过程 一键本地离线部署软件环境硬件环境支持三种部署方式 LangChain-Chatchat 是基于 ChatGLM 等大语言模型与 LangChain 等应用框架实现,开源、可离线部署的 RAG 检索增…