MySQL索引数据结构

目录

1 索引常用的数据结构

1.1 二叉树

1.2 平衡二叉树

1.3 红黑树

1.3 Hash表

1.4 B树

1.4 B+树

2 MySQL索引的数据结构

2.1 MyISAM存储引擎索引

2.2 InnoDB存储引擎索引

2.2.1 聚集索引

2.2.2 非聚集索引

2.2.3 联合索引数

2.2.4 hash索引


1 索引常用的数据结构
1.1 二叉树

二叉树特点:

  • 最顶端的称为根节点
  • 没有子节点的称为叶节点
  • 节点中k-v数据结构,key必须,v非必须
  • 非叶子节点只能允许最多两个子节点存在
  • 每个节点比左子树所有节点的值大,比右子树所有节点的值小

二叉树查找:

  • 采取二分查找
  • 最大查找的次数为树的高度
  • 查找的时间复杂度为O(log n)

那么如果key的数据分布特点是单调递增或者递减呢?

  • 二叉树会退化为链表
  • 查找的时间复杂度变为O(n)
1.2 平衡二叉树

为解决二叉树存在的问题,引入了平衡二叉树

当左子树高度和右子树高度的差大于1时,进行旋转,那么就得到了平衡二叉树

平衡二叉树特点:

  • 每个节点最多有两个子节点
  • 每个节点的值比左子树所有节点的值大,比右子树所有节点的值小
  • 每个节点的左子树的高度与右子树的高度差不超过1

那么为了保证二叉树的平衡,在插入数据需要进行一定的操作来保持二叉树的平衡,包括以下几种情况:

左左右

  • 插入1节点后导致3号子树与8号子树高度差大于1
  • 产生的原因是3号节点的子树节点多了一个节点,此时将3号节点

  • 右旋的流程为(当前节点为3节点,右旋就是让自己变成右子节点)
    • 将父节点的左子节点设置为左子节点
    • 将左子节点的右子节点设置为当前节点

左右左右

  • 插入4节点后导致5子树与8子树高度差大于1
  • 产生的原因是5节点的子树多了一个节点,此时先将3节点旋,再将5节点

  • 左旋流程(当前节点为3节点)
    • 将父节点的左子节点设置为右子节点
    • 将右子节点的左子节点设置为当前节点
  • 右旋流程(当前节点为5节点)
    • 将父节点的左子节点设置为左子节点
    • 将左子节点的右子节点设置为当前节点

右右左

  • 插入5节点后导致3子树与8子树高度差大于1
  • 产生的原因是3节点的子节点多了一个节点,此时将3节点旋解决问题

  • 左旋流程(当前节点为3节点)
    • 将父节点的左子节点设置为右子节点
    • 将右子节点的左子节点设置为当前节点

右左右左

  • 插入4节点时导致3子树与8子树的高度差大于1
  • 产生的原因是3节点的右子节点多了一个左子节点,此时将5节点右旋后再将3节点左旋解决

  • 右旋流程(当前节点为5节点)
    • 将父节点的右子节点设置为左子节点
    • 将左子节点的右子节点设置为当前节点
  • 左旋流程(当前节点为3号节点)
    • 将父节点的左子节点设置为右子节点
    • 将右子节点的左子节点设置为当前节点

思考:以上四种情况均考虑的是左子树高度大于右子树高度,那么反过来时又该如何呢?

平衡树虽然解决了数据单调递增或者递减时导致退化为链表的问题,但是在插入时,需要频繁的旋转来保持二叉树的平衡,对于插入修改的性能影响极大。

1.3 红黑树

为解决平衡二叉树插入更新时频发旋转带来的性能问题,引入了红黑树,红黑树通过以下两方面避免了频繁旋转问题

  • 红黑树在某些时候允许左右子树的高度差大于1,只要符合红黑树规则即可
  • 红黑树不平衡时,不一定非要旋转才能平衡,也可以通过改变颜色达到平衡

红黑树特点:

  • 规则1每个节点不是黑色就红色
  • 规则2根节点是黑色
  • 规则3红色节点的子节点都为黑色
  • 规则4所有所有叶子节点都是黑色
  • 规则5每个节点到叶子节点的每个路径黑色节点的个数都相等

红黑树变色逻辑

  • 新插入的节点总认为是红色
  • 如果在插入之后不符合规则,则变色

  • 变色逻辑(当前节点为2节点)
    • 父节点和叔节点变黑
    • 如果祖父节点不是根节点,则变为红色,然后递归检查是否需要变色
    • 如果是祖父节点是根节点,则不变,完成变色

红黑树旋转逻辑

  • 变色之后如果还不满足红黑树规则进行选择
  • 旋转规则平衡一致

红黑似乎已经解决很多问题那么再来想一下数据量很大时候会导致红黑高度增大那么检索时候最差情况下每个节点产生一次磁盘IO对于检索性能影响巨大

1.3 Hash表

  • hash大多情况下只需要计算一次hash就可以定位元素位置
  • hash冲突问题严重hash也会退链表导致检索性能降低
  • 仅仅只能满足=in查询不支持范围查询

1.4 B树

B-Tree特点

  • 节点索引从左递增序列
  • 所有的索引元素不重复
  • 叶子节点叶子节点包含数据
  • 叶子节点具备相同深度并且节点指针为空

B一个节点包含多个数据可以有效降低高度从而加快检索性能

但是因为非叶子节点包含数据会导致以下问题

  • 一个叶子节点包含数据有限
  • 插入如果一个节点数据达到上限势必导致数据分裂合并
  • 而且由于非叶子节点包含数据数据页分裂合并将会发生非常频繁
  • 如果需要进行范围查询如何实现高效查询

1.4 B+树

B+Tree特点

  • 叶子节点不存储data存储索引使得可以容纳数据量
  • 叶子节点包含所有索引数据
  • 叶子节点按照索引递增排序并且两个相邻叶子节点双向指针

B+由于非叶子节点仅仅包含索引使其相同数据情况下高度远远低于B从而加快检索效率

2 MySQL索引的数据结构
2.1 MyISAM存储引擎索引
  • MySQLMyISAM存储引擎数据文件索引文件分离

  • MyISAM存储引擎索引数据结构

  • 采用B+数据结构进行一些调整
  • MyISAM叶子节点不存储真正数据而是存储数据指针
  • MyISAM索引属于非聚集索引
2.2 InnoDB存储引擎索引
  • MySQL InnoDB数据文件和索引文件同一个

2.2.1 聚集索引
  • InnoDB聚集索引一个标准B+
  • 叶子节点存储真实记录
  • 记录会将数据存储别的数据然后叶子节点存储部分数据以及指向其余数据指针

  • InnoDB肯定会有一个充当聚集索引
  • 创建指定主键主键聚集索引
  • 指定主键选定唯一索引聚集索引
  • 没有唯一索引innodb生成rowid充当聚集索引

2.2.2 非聚集索引

除了聚集索引InnoDB还可以创建辅助索引提升查询效率

辅助索引又称为非聚集索引

InnoDB辅助索引采用B+数据结构,但其叶节点存储的是主键值,而非真实数据

  • 拿到主键通过回表方式在聚集索引检索匹配数据
2.2.3 联合索引数
  • 联合索引给多个字段创建索引
  • 排序规则依次按照字段顺序进行排序
  • 上一个字段相同按照下一个字段进行排序

  • 按照联合索引排序规则得出,查询查询条件需要严格按照联合索引字段顺序给出查询条件中缺某个索引字段字段不能通过索引查询
  • 以上最左前缀匹配原则

2.2.4 hash索引
  • hash索引数据结构一致但是存储主键
  • 然后拿到主键进行回表查询

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30321.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

链表算法题目

1.两数相加 两个非空链表,分别表示两个整数,只不过是反着存储的,即先存储低位在存储高位。要求计算这两个链表所表示数的和,然后再以相同的表示方式将结果表示出来。如示例一:两个数分别是342和465,和为807…

深入解析 BitBake 日志机制:任务调度、日志记录与调试方法

1. 引言:为什么 BitBake 的日志机制至关重要? BitBake 是 Yocto 项目的核心构建工具,用于解析配方、管理任务依赖,并执行编译和打包任务。在 BitBake 构建过程中,日志记录机制不仅用于跟踪任务执行情况,还…

C++--迭代器(iterator)介绍---主要介绍vector和string中的迭代器

目录 一、迭代器(iterator)的定义 二、迭代器的类别 三、使用迭代器 3.1 迭代器运算符 3.2 迭代器的简单应用:使用迭代器将string对象的第一个字母改为大写 3.3 将迭代器从一个元素移动到另外一个元素 3.4 迭代器运算 3.5 迭代器的复…

基于multisim的自动干手器设计与仿真

1 设计的任务与要求 设计一个输出 5V 的直流稳压电源。用开关的闭合模拟手挡住光线的功能。用灯的亮灭模拟烘干吹风功能。 2 方案论证与选择 2.1 自动干手器的系统方案 本设计由5V直流电源、红外发射电路、红外接收电路、灯模拟电路构成。 1. 5V直流电源系统 这一部分是整…

【算法学习之路】7.链表算法

链表算法 前言一.原地逆置思路一:头插法思路二:双指针法思路3:递归 例题:1.头插法2.双指针法3,递归 二.双指针快慢指针:一个指针快一个指针慢例题1例题2 前言 我会将一些常用的算法以及对应的题单给写完&am…

分布式锁—7.Curator的分布式锁

大纲 1.Curator的可重入锁的源码 2.Curator的非可重入锁的源码 3.Curator的可重入读写锁的源码 4.Curator的MultiLock源码 5.Curator的Semaphore源码 1.Curator的可重入锁的源码 (1)InterProcessMutex获取分布式锁 (2)InterProcessMutex的初始化 (3)InterProcessMutex.…

IPD(集成产品开发)简介

参考:IPD咨询_研发管理咨询_IPD集成产品开发-百思特管理咨询集团 一、什么是IPD IPD到底是什么?一套体系?一些流程?还是一种模式? 华为在整个企业内部改革中最重要的两个项目一个是ISC(集成供应链),另外…

解决Jenkins默认终止Shell产生服务进程的问题

1、Windows环境 Jenkins进行Build steps的使用Execute Windows batch command启动微服务(Jar包),Jenkins会默认终止Shell产生的服务进程,而在命令行能够正常运行的服务进程。 1.1 使用命令行启动服务是正常 使用命令行执行 正常…

C 语言数据结构(三):栈和队列

目录 1. 栈 1.1 栈的概念及结构 1.2 栈的实现 2. 队列 2.1 队列的概念及结构 2.2 队列的实现 💬 :如果你在阅读过程中有任何疑问或想要进一步探讨的内容,欢迎在评论区畅所欲言!我们一起学习、共同成长~! &#x…

多模态分子预训练模型 - SPMM 评测

SPMM 是 Structure-Property Multi-Modal foundation model 的简称,一种多模态分子性质-结构双向预训练模型。作者是韩国科学技术研究院人工智能研究生院,大田,韩国的 Jong Chul Ye,于 2024 年 3 月 14 日 发表在 nature communic…

算法.习题篇

算法 — 地大复试 模拟 while循环和MOD循环计数 1.约瑟夫问题 http://bailian.openjudge.cn/practice/3254 using namespace std;bool isNoPeople(vector<bool> c)//判断当前数组是否一个小孩都没有了 {bool nopeople true;for (bool ival : c){if ( ival true)nop…

C++第十节:map和set的介绍与使用

【本节要点】 1.关联式容器2.键值对3.map介绍与使用4.set介绍与使用5.multimap与multisedd的介绍与使用 一、关联式容器&#xff1a;数据管理的核心利器 关联式容器是STL中用于高效存储和检索键值对&#xff08;key-value pair&#xff09;的数据结构&#xff0c;其底层基于红黑…

Java 大视界 -- Java 大数据在智能家居能源管理与节能优化中的应用(120)

&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎来到 青云交的博客&#xff01;能与诸位在此相逢&#xff0c;我倍感荣幸。在这飞速更迭的时代&#xff0c;我们都渴望一方心灵净土&#xff0c;而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识&#xff0c;也…

DeepSeek-R1本地化部署(Mac)

一、下载 Ollama 本地化部署需要用到 Ollama&#xff0c;它能支持很多大模型。官方网站&#xff1a;https://ollama.com/ 点击 Download 即可&#xff0c;支持macOS,Linux 和 Windows&#xff1b;我下载的是 mac 版本&#xff0c;要求macOS 11 Big Sur or later&#xff0c;Ol…

手写简易Tomcat核心实现:深入理解Servlet容器原理

目录 一、Tomcat概况 1. tomcat全局图 2.项目结构概览 二、实现步骤详解 2.1 基础工具包&#xff08;com.qcby.util&#xff09; 2.1.1 ResponseUtil&#xff1a;HTTP响应生成工具 2.1.2 SearchClassUtil&#xff1a;类扫描工具 2.1.3 WebServlet&#xff1a;自定义注解…

OpenHarmony子系统开发编译构建指导

OpenHarmony子系统开发编译构建指导 概述 OpenHarmony编译子系统是以GN和Ninja构建为基座&#xff0c;对构建和配置粒度进行部件化抽象、对内建模块进行功能增强、对业务模块进行功能扩展的系统&#xff0c;该系统提供以下基本功能&#xff1a; 以部件为最小粒度拼装产品和独…

红日靶场(一)——个人笔记

说明&#xff1a; 红日靶场官网 http://vulnstack.qiyuanxuetang.net/vuln/detail/2/ 靶场默认密码 hongrisec2019 预留空间 【攻击机Kail_2023.3】70G 【靶场win7】32G 【靶场Win2K3 】11G 【靶场winserver08】23G 环境搭建 修改VMnet1、VMnet2网卡的地址 将VMnet1作为内…

网络基础(一)【网络发展/认识协议/网络 VS 系统/以太网通信原理/重谈协议/网络中的地址管理】

网络基础&#xff08;一&#xff09; 1. 网络的发展2. 认识协议3. 网络 VS 系统4. 以太网通信原理5. 重谈协议6. 网络中的地址管理 1. 网络的发展 最开始时&#xff0c;计算机之间相互独立。 但是为了协作完成一些任务&#xff0c;就产生了计算机之间相互通讯的需求&#xff0c…

【ESP-IDF】组件

前言 对于要封装自己的库&#xff0c;在ESP-IDF中&#xff0c;可以采用构建组件的方式导入&#xff0c;而不是单纯在文件夹下导入.h和.c文件&#xff0c;不然一旦要导入的文件过多&#xff0c;它们背后的依赖可能就会相互交叉&#xff0c;不在方便移除和复用。本文就分别讲述&a…

AR配置静态IP双链路负载分担示例

AR配置静态IP双链路负载分担示例 适用于大部分企业网络出口 业务需求&#xff1a; 运营商1分配的接口IP为100.100.1.2&#xff0c;子网掩码为255.255.255.252&#xff0c;网关IP为100.100.1.1。 运营商2分配的接口IP为200.200.1.2&#xff0c;子网掩码为255.255.255.248&am…