MySQL 索引(上)

   

 🎉欢迎您来到我的MySQL基础复习专栏

☆* o(≧▽≦)o *☆哈喽~我是小小恶斯法克🍹
✨博客主页:小小恶斯法克的博客
🎈该系列文章专栏:重拾MySQL-进阶篇
🍹文章作者技术和水平很有限,如果文中出现错误,希望大家能指正🙏
📜 感谢大家的关注! ❤️

目录

 🚀索引概述

 🚀索引的特点 

🚀索引结构

🚀二叉树

🚀红黑树

 🚀B树:为磁盘而生

🚀B树的构建  (这里引用的是一个博主的构建过程,我觉得还不错http://t.csdnimg.cn/3VtX2)

 🚀B+Tree  (以下这里引用了黑马部分)

 🚀Hash

🚀为什么InnoDB存储引擎选择使用B+tree索引结构? 


🚀索引概述

索引(index)是帮助MySQL高效获取数据的数据结构(有序)。数据库系统还维护着满足 特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构  上实现高级查找算法,这种数据结构就是索引。

 索引说明:

假设我们要执行的SQL语句是:select * from emp where age =  43 ;

✨无索引

在无索引情况下,就需要从第一行开始扫描,一直扫描到最后一行,我们称之为全表扫描,性能很低。

✨有索引

如果我们针对于这张表建立了索引,假设索引结构就是二叉树,那么也就意味着,会对age这个字段建立一个二叉树的索引结构。

此时我们在进行查询时,只需要扫描三次就可以找到数据了,极大的提高的查询的效率。

注意:这里我们只是假设索引的结构是二叉树,介绍一下索引的大概原理,只是一个示意图,并不是索引的真实结构,索引的真实结构通常是基于B树或者B+树

 🚀索引的特点 

特点优点缺点
提高检索速度加快数据的检索速度,特别是对大表进行检索时增加了写操作的时间,因为每次插入、更新和删除都需要维护索引
唯一约束可以确保列或列组合的唯一性唯一索引会增加写操作的开销
加速排序在使用ORDER BY子句进行排序时可以加快查询速度占用额外的磁盘空间
加速分组和联接对于GROUP BY和JOIN操作,索引可以提高查询性能不恰当的索引可能导致查询性能下降
全文搜索允许对文本字段进行高效的全文搜索需要额外的存储空间,并且不支持所有的数据类型
减少IO成本可以减少磁盘IO的次数,提高查询效率创建和维护索引需要额外的计算资源

🚀索引结构

MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,主要包含以下几种:

索引结构

描述

B+Tree索引

最常见的索引类型大部分引擎都支持  B+ 树索引

一种自平衡的多路搜索树,所有关键字都存储在叶子节点上,并且叶子节点之间通过指针连接形成有序链表。非叶子节点只包含键值信息,不包含实际数据。适用于范围查找,对于数据库系统来说更加适用。

Hash索引

底层数据结构是用哈希表实现 , 只有精确匹配索引列的查询才有效 , 适用于等值查找,支持范围查询

R-tree(空间索引)

空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据 型,通常使用较少

Full-text(索引 )

是一种通过建立倒排索引 ,快速匹配文档的方式类似于

Lucene,Solr,ES

用于全文搜索的索引结构,支持对文本字段进行高效的全文搜索,适用于大段文本的搜索。

上述是MySQL中所支持的所有的索引结构接下来我们再来看看不同的存储引擎对于索引结构的支持情况。

InnoDB

MyISAM

Memory

B+tree索引

Hash 索引

不支

不支

R-tree 索引

不支

不支

Full-text

5.6版本之后支持

不支

 注意:我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。

🚀二叉树

二叉树具有以下性质:左子树的键值小于根的键值,右子树的键值大于根的键值。 
如下图所示就是一棵二叉查找树, 

假如说MySQL的索引结构采用二叉树的数据结构,理想状态下结构是:

如果主键是顺序插入的,则会形成一个单向链表:

所以,如果选择二叉树作为索引结构会存在以下缺点

✨顺序插入时,会形成一个链表,查询性能大大降低。

✨大数据量情况下,层级较深,检索速度慢。

🚀红黑树

此时大家可能会想到我们可以选择红黑树红黑树是一颗自平衡二叉树那这样即使是顺序插入数 据,最终形成的数据结构也是一颗平衡的二叉树 ,结构如下 : 

✨对于数据在内存中的情况(如上述的TreeMap和HashMap),红黑树的表现是非常优异的。但是对于数据在磁盘等辅助存储设备中的情况(如MySQL等数据库),红黑树并不擅长,因为红黑树长得还是太高了。当数据在磁盘中时,磁盘IO会成为最大的性能瓶颈,设计的目标应该是尽量减少IO次数;而树的高度越高,增删改查所需要的IO次数也越多,会严重影响性能。

✨所以,在MySQL的索引结构中,并没有选择二叉树或者红黑树,而选择的是B+Tree,那么什么是 B+Tree呢?在详解B+Tree之前,先来介绍一个B-Tree。

 🚀B树:为磁盘而生

B-Tree  B树是一种多叉路衡查找树,相对于二叉树,  B树每个节点可以有多个分支,即多叉。

以一颗最大度数(max-degree5(5)b-tree为例那这个B树每个节点最多存储4key,5

个指针:

✨B树,也是自平衡的排序查找树,但是不要求子节点数目必须小于2。

✨每个节点可以有最多M个子节点,M>=2,M即为B树的阶数

✨每个节点中可以存储最多M个、最少M/2向上取整个key,一般为2-3个。

✨所有叶子节点均在同一层

树的度数指的是一个节点的子节点个数。

在这里插入图片描述

还有一个更详细的图:

 

🚀B树的构建  (这里引用的是一个博主的构建过程,我觉得还不错http://t.csdnimg.cn/3VtX2)

B树的构建过程中每个节点中的关键字的个数都在动态改变。

因为其构建过程是:先对节点先扩充,当节点中关键字数量扩充到等于M时,再对其进行拆分,并将中间数升到父节点中去。

例如:定义一个5阶树(平衡5路查找树;),现在我们要把3、8、31、11、23、29、50、28 这些数字构建出一个5阶树出来;

遵循规则:

(1)节点拆分规则:当前是要组成一个5路查找树,那么此时m=5,关键字数必须<=5-1(这里关键字数>4就要进行节点拆分);当节点中关键字数大于4时,就将中间的关键字升为父节点的关键字(如果没有父节点,则创建一个父节点),然后创建此父节点的两个子节点,将中间关键字两边的关键字分别存储到这两个子节点中。

(2)排序规则:满足节点本身比左边节点大,比右边节点小的排序规则;

先插入 3、8、31、11
在这里插入图片描述
再插入23、29
在这里插入图片描述再插入50、28
在这里插入图片描述

特点:

✨5阶的B树,每一个节点最多存储4个key,对应5个指针。

✨一旦节点存储的key数量到达5,就会裂变,中间元素向上分裂。

✨在B树中,非叶子节点和叶子节点都会存放数据。

 🚀B+Tree  (以下这里引用了黑马部分)

B+TreeB-Tree的变种,我们以一颗最大度数(max-degree4 4b+tree为例来看一 下其结构示意图:

我们可以看到,两部分:

✨绿色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据。

✨红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据。

插入一组数据100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 250 然后观察一些数据插入过程中节点的变化情况

 最终我们看到,B+Tree 与  B-Tree相比,主要有以下三点区别:

所有的数据都会出现在叶子节点。

叶子节点形成一个单向链表。

非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的 

上述我们所看到的结构是标准的B+Tree的数据结构接下来我们再来看看MySQL中优化之后的 B+Tree

✨MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点 的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,利于排序。

 🚀Hash

✨MySQL中除了支持B+Tree索引,还支持一种索引类型---Hash索引。

✨哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。

 如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可 以通过链表来解决。

✨Hash索引只能用于对等比较 (=,  in),不支持范围查询(between,  >,  < ,   ...)

✨无法利用索引完成排序操作

✨查询效率高,通常(不存在hash冲突的情况)只需要一次检索就可以了,效率通常要高于B+tree索引 

存储引擎支持

在MySQL中,支持hash索引的是Memory存储引擎。    而InnoDB中具有自适应hash功能,  hash索引是 InnoDB存储引擎根据B+Tree索引在指定条件下自动构建的。

🚀为什么InnoDB存储引擎选择使用B+tree索引结构? 

✨平衡的高效查找: B+树具有平衡性,使得在大数据量情况下,查询操作的时间复杂度保持在较低水平(通常为O(log n))。

✨多路搜索: B+树的多路搜索特性使得每一步操作都能跳过大量的数据,从而提高了查询效率。

✨对于B-tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储 的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低;

✨相对Hash索引,  B+tree支持范围匹配及排序操作

(范围查询: B+树索引结构天生适合范围查询,因为其内部有序排列的特性可以快速定位到范围的起始点,并且进行连续的遍历。

顺序访问: B+树的叶子节点形成有序链表,这使得对整个表进行顺序扫描时非常高效。)


希望对你有帮助!  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/241290.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker五部曲之五:通过Docker和GitHub Action搭建个人CICD项目

文章目录 项目介绍Dockerfile解析compose.yml解析Nginx反向代理到容器以及SSL证书设置MySQL的准备工作Spring和环境变量的交互 GitHub Action解析项目测试结语 项目介绍 该项目是一个入门CICD-Demo&#xff0c;它由以下几部分组成&#xff1a; Dockerfile&#xff1a;用于构建…

像操作本地文件一样操作linux文件 centos7环境下samba共享服务搭建详细教程

1.安装dnf yum -y install dnf 2.安装samba dnf install samba -y 3.配置 3.1创建并设置用户信息 #创建用户 useradd -M -s /sbin/nologin samba echo 123|passwd --stdin samba mkdir /home/samba chown -R samba:samba /home/samba smbpasswd -a samba smaba设置密码示…

Dobbo --- HelloWorld项目搭建

Dobbo-HelloWorld 1. demo -- spring方式集成1.1 实现步骤 2. demo -- springboot方式集成2.1 实现provider2.2 实现consumer2.3 项目测试 1. demo – spring方式集成 dubbo官方文档 提供一个可被调用的接口 提供方&#xff1a;实现接口的方法逻辑&#xff0c;启动应用程序&a…

跨境电商多语种服务指南:如何提供优质的客户体验?

卓越的客户支持是成功企业的核心&#xff0c;客户希望得到全天候的及时响应。根据《哈佛商业评论》的研究报告&#xff0c;快速及时地响应会促使人们在未来支付更多的费用。而在与全球客户打交道时&#xff0c;特别是跨境电商企业&#xff0c;您的沟通必须超越语言障碍。用客户…

Python爬虫 - 网易云音乐下载

爬取网易云音乐实战&#xff0c;仅供学习&#xff0c;不可商用&#xff0c;出现问题&#xff0c;概不负责&#xff01; 分为爬取网易云歌单和排行榜单两部分。 因为网页中&#xff0c;只能显示出歌单的前20首歌曲&#xff0c;所以仅支持下载前20首歌曲&#xff08;非VIP音乐&…

【笔记】Helm-3 主题-6 Chart仓库指南

Chart仓库指南 本节介绍如何创建和使用chart仓库。在高层级中&#xff0c;chart仓库是打包的chart存储和分享的位置。 社区的Helm chart仓位于 Artifact Hub &#xff0c;欢迎加入。不过Helm也可以创建并运行您自己的chart仓库。该指南将介绍如何操作。 Artifact Hub 先决条…

C语言之编译和链接

目录 一、引言 二、编译和链接 2.1 预处理&#xff08;预编译&#xff09; 2.2 编译 2.3 汇编 2.4 链接 一、引言 #include <stdio.h> int main() {printf("hello, world\n");return 0; } 像这样&#xff0c;只由ASCII字符构成的文件被称为文本文件&…

java结合百度ocr实现图片文字提取功能

1.进入百度云控制台&#xff0c;找到文字识别服务&#xff0c;创建一个应用 2.引入ocr需要的maven依赖包 <dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>4.16.11</version> </depend…

go实现判断20000数据范围内哪些是素数(只能被1和它本身整除的数),采用多协程和管道实现

实现一个并发程序&#xff0c;用于寻找 20000 以内的所有素数。使用了 Goroutines 和 Channels 来分发和处理任务&#xff0c;并通过 WaitGroup&#xff08;实现为 exitChan&#xff09;来同步 Goroutines 的退出。 一.GO代码 package mainimport ("fmt""time…

C++初阶类与对象(三):详解复制构造函数和运算符重载

上次介绍了构造函数和析构函数&#xff1a;C初阶类与对象&#xff08;二&#xff09;&#xff1a;详解构造函数和析构函数 今天就来接着介绍新的内容&#xff1a; 文章目录 1.拷贝构造函数1.1引入和概念1.2特性 2.赋值运算符重载2.1运算符重载2.2放在哪里2.3运算符重载示例2.3.…

深度学习(1)--基础概念

目录 一.计算机视觉(CV) 二.神经网络基础 三.神经网络整体架构 一.计算机视觉(CV) (1).计算机视觉中图像表示为三位数组&#xff0c;其中三维数组中像素的值为0~255&#xff0c;像素的值越低表示该点越暗&#xff0c;像素的值越高表示该点越亮。 (2).图像表示 A*B*C&#xf…

美摄视频SDK的HDR格式编辑方案

在当今的视觉媒体时代&#xff0c;高动态范围&#xff08;HDR&#xff09;技术已成为高质量视频内容的标配。为了满足企业对高效、高质量视频处理的需求&#xff0c;美摄科技推出了业界领先的视频SDK&#xff0c;全面支持多种HDR标准的图像视频进行处理。 一、核心优势 HDR全…

视频智能识别周界入侵检测AI智能分析网关V4如何配置ONVIF摄像机接入

AI边缘计算智能分析网关V4性能高、功耗低、检测速度快&#xff0c;易安装、易维护&#xff0c;硬件内置了近40种AI算法模型&#xff0c;支持对接入的视频图像进行人、车、物、行为等实时检测分析&#xff0c;上报识别结果&#xff0c;并能进行语音告警播放。算法可按需组合、按…

从matlab的fig图像文件中提取数据

这里用的是openfig&#xff08;&#xff09;函数打开的fig文件 →→→【matlab 中 fig 数据提取】 很简洁 →→→【MATLAB提取 .fig 文件中的数据】 这个给出了包含多个曲线的情况 →→→【提取matlab fig文件里的数据和legend】 chatgpt给出的方法 打开fig文件并保存数据 我的…

Vue入门七(Vuex的使用|Vue-router|LocalStorage与SessionStorage和cookie的使用|路由的两种工作模式)

文章目录 一、Vuex1&#xff09;理解vuex2&#xff09;优点3&#xff09;何时使用&#xff1f;4&#xff09;使用步骤① 安装vuex② 创建vuex③ 导入vuex④ 创建仓库Store⑤ 基本使用 5&#xff09;五个模块介绍1.State2.mutations3.actions4.Getter5.Modules 6&#xff09;购物…

QT设置QTableWidget左上角文字(CornerButton)

关于这个左上角 在QTableWidget中&#xff0c;左上角有一个可以点击的空白区域&#xff0c;如图&#xff1a; 默认情况下&#xff0c;点击它会全选所有的单元格。 它即不属于列表头&#xff0c;也不属于行表头&#xff0c;它的名称叫Corner Button 在QTableWidget中&#xf…

Flask 项目怎么配置并创建第一个小项目?附上完成第一个小案例截图

目录 1. 为什么要学习 flask&#xff1f; 2. flask 是什么&#xff1f; 3. flask 如何使用&#xff1f; 要安装 Flask&#xff0c;可以按照以下步骤进行&#xff1a; 4. 使用流程 4.1. 新建项目 4.1.1. 打开 pycharm&#xff0c;新建项目 4.1.2. 设置目录&#xff0c;并…

【JavaEE进阶】 依赖注⼊DI详解

文章目录 &#x1f334;什么是依赖注入&#x1f384;依赖注入的三种方法&#x1f6a9;属性注⼊(Field Injection)&#x1f6a9;构造⽅法注⼊&#x1f6a9;Setter注⼊&#x1f6a9;三种注⼊的优缺点 &#x1f333;Autowired存在的问题&#x1f332;解决Autowired存在的问题&…

借势营销怎么做才能有效宣传?媒介盒子揭秘

借势营销之所以受到品牌欢迎&#xff0c;原因就在于通过借势营销能够达到“润物细无声和四两拨千斤的效果&#xff0c;用小投入获得大回报&#xff0c;但有许多企业稍有不慎就会翻车&#xff0c;今天媒介盒子就从多个角度和大家聊聊&#xff1a;借势营销怎么做才能有效宣传。 一…

深入详解使用 RabbitMQ 过程中涉及到的多个细节问题(面试可用)

目录 1、基础类问题 2、cluster 相关问题 3、综合性问题 4、参考资料 C软件异常排查从入门到精通系列教程&#xff08;专栏文章列表&#xff0c;欢迎订阅&#xff0c;持续更新...&#xff09;https://blog.csdn.net/chenlycly/article/details/125529931C/C基础与进阶&…