【MySQL】索引(上)

https://www.wolai.com/curry00/fzTPy3kSsMDEgEcdvo4G5w
https://www.bilibili.com/video/BV1Kr4y1i7ru/?p=69
https://jimhackking.github.io/%E8%BF%90%E7%BB%B4/MySQL%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/#%E7%B4%A2%E5%BC%95

索引是一种用于快速查询和检索数据的数据结构,排序好的数据结构。
优点:加快检索速度;通过创建唯一性索引,可以保证行数据的唯一性;通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
缺点:创建和维护索引需要耗费时间,本身存储也要耗费一定空间

mysql索引类型

  • 按「数据结构」分类:B+tree索引、Hash索引、Full-text全文索引(是一种通过建立倒排索引,快速匹配文档的方式)、R-tree空间索引(空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少)。
  • 按「物理存储」分类:聚簇索引(主键索引)、二级索引(辅助索引)
    • 二级索引(Secondary Index)就是非聚簇索引,是因为二级索引的叶子节点 存储的数据是主键。也就是说,通过二级索引,可以定位主键的位置。
    • 主键索引就是聚簇索引,叶子节点存储就是数据
  • 按「字段特性」分类:主键索引、唯一索引、普通索引、前缀索引
    注意主键索引不允许为null,不允许相同,唯一索引允许多个null但不能相同,普通索引允许为null也允许相同,前缀索引只适用于字符串类型的数据,前缀索引是对文本的前几个字符创建索引。
  • 按「字段个数」分类:单列索引、联合索引
    建立在单列上的索引称为单列索引,比如主键索引;
    建立在多列上的索引称为联合索引;
    在这里插入图片描述

不同引擎对索引的支持情况
在这里插入图片描述

索引数据结构

哈希表、有序数组、B+树、B树、红黑树,二叉树

  • 哈希表:只适用于等值查询的场景,用这种索引做不了范围查询,必须全表扫描。查询效率高

  • 有序数组:有序数组在等值查询和范围查询场景中的性能就都非常优秀,但是一旦更新数据就得挪动后面的元素,成本太高

  • 二叉搜索树:为了维持 O(log(N)) 的查询复杂度,需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是 O(log(N))。
    二叉树是搜索效率最高的,但是实际上大多数的数据库存储却并不使用二叉树。其原因是,索引不止存在内存中,还要写到磁盘上。你可以想象一下一棵 100 万节点的平衡二叉树,树高 20。一次查询可能需要访问 20 个数据块。

  • B树:在二分查找树的基础上,增加单个节点的数据存储数量,同时增加了树的子节点数,一次计算可以把查找范围缩小更多。
    插入节点过程:中间节点向上分裂,某个分支超过最大节点数了,最中间的节点,加入根节点中去 https://www.cs.usfca.edu/~galles/visualization/BTree.html(可视化演示网站)
    在这里插入图片描述
    在这里插入图片描述

    但是非叶子节点会存放索引数据和业务数据,为了查找对比计算,需要把数据加载到内存以及 CPU 高速缓存中时,都要把索引数据和无关的业务数据全部查出来。如果所对比的节点不是所查的数据,那么这些加载进内存的业务数据就毫无用处,全部抛弃。

  • B+ 树:为了拆分索引数据与业务数据的平衡多叉树。非叶子节点只保存索引数据,叶子节点保存索引数据与业务数据,叶子结点形成双向链表,所有元素都会出现在叶子节点。这样即保证了叶子节点的简约干净,数据量大大减小,又保证了最终能查到对应的业务数。既提高了单次 I/O 数据的有效性,又减少了 I/O 次数,还实现了业务。在这里插入图片描述

  • 红黑树:红黑树就是介于完全不平衡和完全平衡之间的一种二叉树,可以解决二叉树的这个问题(二叉树缺点:顺序插入时,会形成一个链表,查询性能大大降低。大数据量情况下,层级较深,检索速度慢,),通过每个节点有红黑两种颜色、从节点到任意叶子节点会经过相同数量的黑色节点等一系列规则,实现了树的层数最大也只会有两倍的差距,这样既能提高插入和删除的效率,又能让树相对平衡从而有还不错的查询效率。
    从整体上讲,红黑树就是一种中庸之道的二叉树,但是用来当mysql的索引还是有问题,用红黑树存放100万个数据,把树放满,这个树的高度会越变越高和二叉搜索树一样 在这里插入图片描述

1、B树和B+树的区别

  • B+树所有的数据都会出现在叶子节点,B+叶子节点有所有索引的冗余和其对应的数据,非叶子节点没有数据,B树没有冗余,非叶子节点有数据
  • B树检索的过程就相当于对于范围内的每个节点的关键字做二分查找,没到达叶子节点可能检索就结束了,检索B+树最后肯定会查询到底,效率比较稳定
  • B+树叶子节点之间相互之间也构成一个双向链表,B树没有。所以B树进行范围查询需要找到查询的下限,然后进行中序遍历。B+树直接对链表进行遍历就行

2、为什么mysql使用B+树?

  • B+树非叶子节点不放数据只放索引,所以可以存放更多的索引,比B树更矮胖,所以IO次数就比较少
  • B+树有很多冗余节点,所以插入、删除的效率就比较高,而B树删除插入调整很多
  • B+树叶子节点用双向链表相互连接了起来,所以范围查询效率比较高

3、MyISAM和InnoDB引擎中的B+树区别是什么?

  • MyISAM不管是不是主键索引,使用的都是非聚簇索引(叶子节点的data部分放数据记录的地址
  • InnoDB主键索引使用聚簇索引(叶子节点部分就是数据),二级索引则是非聚簇索引

聚簇索引和非聚簇索引

  • 聚簇索引:
    优点:查询速度快,对主键的排序查找和范围查找速度快
    缺点:依赖有序数据,更新代价比较大
  • 非聚簇索引:
    优点:更新代价小
    缺点:依赖有序的数据,可能会二次查询(回表)

1、什么是回表?
如果我用 product_no 二级索引查询商品,如下查询语句:

select * from product where product_no = '0002';

会先检二级索引中的 B+Tree 的索引值(商品编码,product_no),找到对应的叶子节点,然后获取主键值,然后再通过主键索引中的 B+Tree 树查询到对应的叶子节点,然后获取整行数据。这个过程叫「回表」,也就是说要查两个 B+Tree 才能查到数据

2、创建表时,InnoDB 存储引擎会怎么选择索引?

  • 如果有主键,默认会使用主键作为聚簇索引的索引键(key)
  • 如果没有主键,就选择第一个不包含 NULL 值的唯一列作为聚簇索引的索引键(key)
  • 在上面两个都没有的情况下,InnoDB 将自动生成一个隐式自增 id 列作为聚簇索引的索引键(key)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/353026.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware虚拟机卡顿(虚拟机卡死)(调整所有虚拟机内存使其适应预留的主机 RAM (F)、默认进程优先级、不允许使用内存页面修整功能(M))

文章目录 设置编辑——首选项——内存——额外内存——调整所有虚拟机内存使其适应预留的主机 RAM (F)(我把这个勾上了)编辑——首选项——优先级——默认进程优先级虚拟机——设置——选项——高级——不允许使用内存页面修整功能(M) 参考文章&#xff…

Tuple 元组

文章目录 一、什么是元组 ?二、元组的具体操作2.1 创建元组2.1.1 tuple() 创建元组函数和 list() 创建列表函数总结 2.2 元组的元素访问操作2.3 元组的元素计数操作2.4 zip 对象 一、什么是元组 ? 列表属于可变序列,可以任意修改列表中的元素。 元组的…

(1)图像识别yolov5—安装教程

目录 1、安装YOLOv5: 2、下载预训练模型: 3、识别示例图片: 1、安装YOLOv5: 首先,你需要在你的计算机上下载 YOLOv5 的文件包,下载链接:https://github.com/ultralytics/yolov5。下载后对压缩文件进行解压。 (Linux命令行安装方式:git clone https://github.com/u…

Chromium源码阅读:深入理解Mojo框架的设计思想,并掌握其基本用法(1)

Mojo简介 Mojo 是一个运行时库的集合,提供与平台无关的通用 IPC 原语抽象、消息 IDL 格式以及具有针对多种目标语言的代码生成的绑定库,以便于跨任意进程间和进程内边界传递消息。 Mojo 分为清晰分离的层,子组件的基本层次结构如下&#xff…

全氟己酮自动灭火材料表现亮眼!手把手教你自动灭火毯的使用方法

灭火毯的使用方法是什么?很多朋友在购买灭火毯之前,都比较关心这个问题。在这里,我们可以把灭火毯分为两种。一种是传统灭火毯,还有一种是近年来兴起的高科技产品—全氟己酮自动灭火毯。这两种灭火毯的使用方法大有不同&#xff0…

游戏服务器研究一:bigworld 开源代码的编译与运行

1. 前言 bigworld 已经开源了它的代码,而我对于大世界的 scale 很感兴趣,所以就尝试把代码跑起来研究。但是,整个过程比我原先预想的复杂得多。 虽然能找到一些官方的帮助文档,但这些文档要么过旧,要么过于详尽&…

表面声波滤波器——设计方案(4)

设计步骤 设计声表面波滤波器,首先需要分析器件的指标要求,如中心频率、使用带宽、插入损耗等,结合产线工艺水平,选择合适的衬底材料和换能器材料。确认可以满足器件性能需求的换能器设计方案,然后通过软件仿真。对叉…

python基础语法 002 - 4 字符串

1 字符串 字符串:引号括起来的数据类型 # 双引号 a "yuze wang"# 单引号 a ’yuze wang‘# 三引号 a ’‘’yuze‘‘’ a """yuze"""注意:所有格式表示都是半角,全角会报错 1.1 引号表示 …

IMU应用于体操训练

考虑到在艺术体操训练与竞赛中艺术体操的训练与比赛中,地板项目导致的伤率最高,最近,一个来自澳大利亚的科研团队利用IMU评估运动员执行基础翻腾技巧训练时,他们上肢与下肢所承受的冲击负荷。 本次实验共有十四名艺术体操运动员参…

Profibus协议转Modbus协议网关模块帮助PLC实现智能激光设备通讯

一、前言 Profibus转Modbus网关(XD-MDPB100)是一种工业通信协议转换设备,用于实现Profibus协议与Modbus协议之间的转换。Profibus转Modbus网关在工业自动化系统中具有广泛的应用,它解决了不同协议设备之间的通信问题。本文将深入…

《Nest系列 - 2. Nest 代码生成器,让你告别base代码书写!!!》

紧接上文我们做一些核心梳理 核心梳理: /controllers目录:存放控制器文件,每个控制器对应一组路由和请求处理方法。控制器处理来自客户端的HTTP请求,并返回相应的响应。/modules目录:存放模块文件,每个模块…

学会这几点,轻松制作引人入胜的电子期刊

随着数字化时代的到来,电子期刊已经成为了信息传播的重要载体。它以方便快捷、形式多样、互动性强等特点,受到了广泛的欢迎。那么,如何制作一份引人入胜的电子期刊呢?下面就来为大家分享几点制作电子期刊的小技巧。 1.选择合适的制…

Linux实现: 客户端(cli01)通过TCP(或UDP)连接到聊天服务器(serv)进行聊天?(伪代码版本)

🏆本文收录于「Bug调优」专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&…

爬抖音直播间观众数据

打开抖音,稍微看了下买房直播间,突然很好奇是那些用户在观看,想拿下这些用户数据,再通过用户等级排序,筛选出优质客户。 现在用户数据已经拿到了,但是关键数据,抖音是打码加密的。目前最大的难…

前端面试项目细节重难点(已工作|做分享)(九)

面试官:请你讲讲你在工作中如何开发一个新需求,你的整个开发过程是什么样的? 答:仔细想想,我开发新需求的过程如下: (1)第一步:理解需求文档: 首先&#x…

Java——面向对象进阶(三)

前言: 抽象类,接口,内部类 文章目录 一、抽象类1.1 抽象方法1.2 抽象类1.3 抽象类的使用 二、 接口2.1 接口的定义和实现2.2 default 关键字2.3 实现接口时遇到的问题 三、内部类3.1 成员内部类3.2 静态内部类3.3 成员内部类3.4 匿名内部类&a…

6月17(信息差)

1.马斯克最新预测:未来不再需要手机 将被脑机芯片替代 当地时间6月17日,马斯克高仿号“Not Elon Musk”发帖称:“你会在你的大脑上安装一个Neuralink接口,让你通过思考来控制你的新X手机吗?”对此,马斯克本…

C++ 62 之 冒泡排序

#include <iostream> // #include <string> #include <cstring>using namespace std;// 冒泡排序:函数模板 template<typename T> void mySort(T arr[], int len){ // size参数是数组的个数&#xff0c;一定是int型的for (size_t i 0; i < len -1;…

88. 合并两个有序数组(简单)

88. 合并两个有序数组 1. 题目描述2.详细题解3.代码实现3.1 Python3.2 Java 1. 题目描述 题目中转&#xff1a;88. 合并两个有序数组 2.详细题解 两个数组均有序&#xff08;非递减&#xff09;&#xff0c;要求合并两个数组&#xff0c;直观的思路&#xff0c;借助第三个数…

利用AI云防护实现高效负载均衡

在当今高度数字化的世界里&#xff0c;保证网站和应用的高可用性和响应速度对企业的业务连续性和用户体验至关重要。传统的负载均衡技术虽然能够分发流量&#xff0c;但在面对突发流量、DDoS攻击或资源动态调整时往往力不从心。本文将探讨如何借助AI云防护服务&#xff0c;不仅…