算法之美：B+树原理、应用及Mysql索引底层原理剖析

算法之美：B+树原理、应用及Mysql索引底层原理剖析

news/2024/12/23 22:00:44/文章来源:https://blog.csdn.net/qq_30294911/article/details/137125810

B树的一种变种形式，B+树上的叶子结点存储关键字以及相应记录的地址，同等存储空间下比B-Tree存储更多Key。非叶子节点不对关键字记录的指针进行保存，只进行数据索引 , 树的层级会更少 , 所有叶子节点都在同一层, 叶子节点的关键字从小到大有序排列，叶子节点之间用指针连接, 构成有序链表（稠密索引）。

B+树上每个非叶子节点之间是一个双向链表进行链接，而叶子节点中的数据都是使用单向链表链接。

检索特点

当索引部分某个结点的关键字与所查的关键字相等时，并不停止查找，继续沿着关键字的指针向下，每次查询必须到叶子节点才能真正获取到相关数据。B+Tree叶子节点相连接，对树的遍历就是只需要一次线性遍历叶子节点。由于叶子节点的数据是顺序排列，方便区间查找，在B+树完成范围查找、排序查找、分组查找、去重查找比B-Tree效率更高。

动画演示： B+ Tree Visualization

演示：M=5

1）插入可以是中文或者是英文，对应会转为ASCII码；

2）插入第五个元素时，会将中间的元素往上提，并在中间保留一个元素在叶子节点，叶子节点间用指针相连；

B-Tree和B+树区别

两种树各有优缺点和应用场景：

1）B树和B+树的最大区别在于非叶子节点是否存储数据；
2）B+树非叶子节点只是当索引使用，同等空间下B+树存储更多key；
3）B树,非叶子节点和叶子节点都会存储数据，找到对应节点就有对应的数据；
4）B+树, 只有叶子节点才会存储数据,存储的数据都是在一行上，找到非叶子节点的key，还需要继续找到叶子节点才可以获取数据；
5）B树的节点包括了key-value，所以找到对应的key即可找到对应的value，不用在继续寻找；

Mysql索引底层剖析

在多数数据库的设计里面，会用B-Tree或B+Tree做索引提高查询效率

基于一张数据库的表数据进行查询（类似mysql的user表）

构建索引：id用做key，然后data是数据的存储地址

内存地址	id	phone	name	Age
0xFS	212	13012341234	张三	34
0xER	324	15725112361	李四	46
0x32	461	18612695656	王五	24
0x93	524	13109910002	赵六	29
0xAP	689	13399811341	钱七	30
0xSQ	.... 1千万条数据

精确查找 id = 689 的数据

sql：select * from user where id = 689

1）未使用索引：自上而下查找数据，一行行遍历，5次才找到数据；
2）使用索引：ID建立主键索引（B+Tree结构），对应的数据存储数据的地址，2次找到数据，且数据量越多效果越明显；

根节点是常驻内存的，不需要进行IO操作；

查询ID=689时，IO从461才开始发生第一次IO，随之时524、689

范围查找 id>212和 id < 524的用户

sql：select * from user where id > 212 and id < 524

1）未使用索引：自上而下查找数据，一行行遍历；
2）使用索引：id建立主键索引（B+Tree结构），由于本身是有序链表，所以顺序查找即可；

举一反三

如果把相关数据都放到B+Tree叶子节点上，拿查询的时候直接一次性就可以把数据获取了。

以这个为例，我们展开讲讲Mysql中的InnoDB中的索引结构与MyISAM的索引结构区别

InnoDB引擎

表数据文件按B+Tree组织的，叶节点data域保存完整行数据, 树上的key就是主键, 以主键构建的B+树索引。

这种索引叫做聚集索引（聚簇索引 clustered index），聚簇索引一般为主键索引，而主键一个表中只能有一个，所以聚集索引一个表只能有一个聚簇索引叶子节点存储的是行数据，而非聚簇索引叶子节点存储的是聚簇索引（通常是主键 ID）

MyISAM引擎

索引文件和数据文件是分开的，索引结构的叶子节点放的是指向数据的主键（或者是地址）构建的B+树索引。

这种索引叫做非聚集索引、二级索引、辅助索引（非聚簇索引 nonclustered index），非聚集索引一个表可以存在多个。

叶子节点中保存的不是实际数据，而是主键，获得主键值后去聚簇索引中获得数据行。

非聚簇索引的叶子节点上存储的并不是真正的行数据，而是主键 ID或记录的地址。当使用非聚簇索引进行查询时，会得到一个主键 ID，再使用主键 ID 去聚簇索引上找真正的行数据，把这个过程称之为回表查询，所以聚簇索引查询效率更高，而非聚簇索引需要进行回表查询，性能不如聚簇索引。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/290194.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

IntelliJ IDEA中遇到的“cannot access java.lang.String“错误及其解决方案（day8）

IntelliJ IDEA中遇到的“cannot access java.lang.String“错误及其解决方案（day8）

intelliJ 今天遇到使用intelliJ遇到了一个新错误，有问题就解决问题是一个程序员最基本的修养，如下： 在上面的代码中，我使用了this.这个关键字，发现出现了以上问题，找了一些资料，不是很明白&am…

阅读更多...

基于CNN-RNN的动态手势识别系统实现与解析

基于CNN-RNN的动态手势识别系统实现与解析

一、环境配置为了成功实现基于CNN-RNN的动态手势识别系统，你需要确保你的开发环境已经安装了以下必要的库和工具： Python：推荐使用Python 3.x版本，作为主要的编程语言。TensorFlow：深度学习框架，用于构建…

阅读更多...

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement 相关链接：arXiv GitHub 关键字：LLM、Data Augmentation、Fine-tuning、NLP、Low-data Regime 摘要预训练的大型语言模型（LLMs）目前是解决绝大多数自然语言处理任…

阅读更多...

《Vision mamba》论文笔记

《Vision mamba》论文笔记

原文出处： [2401.09417] Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model (arxiv.org) 原文笔记： What： Vision Mamba: Efficient Visual Representation Learning with Bidirectional St…

阅读更多...

分类模型评估：混淆矩阵与ROC曲线

分类模型评估：混淆矩阵与ROC曲线

1.混淆矩阵2.ROC曲线 & AUC指标理解混淆矩阵和ROC曲线之前，先区分几个概念。对于分类问题，不论是多分类还是二分类，对于某个关注类来说，都可以看成是二分类问题，当前的这个关注类为正类，所有其他非关注…

阅读更多...

Java项目：78 springboot学生宿舍管理系统的设计与开发

Java项目：78 springboot学生宿舍管理系统的设计与开发

作者主页：源码空间codegym 简介：Java领域优质创作者、Java项目、学习资料、技术互助文中获取源码项目介绍系统的角色：管理员、宿管、学生管理员管理宿管员，管理学生，修改密码，维护个人信息。宿管员…

阅读更多...

RegSeg 学习笔记（待完善）

RegSeg 学习笔记（待完善）

论文阅读解决的问题引用别的论文的内容可以用 controlf 寻找想要的内容 PPM 空间金字塔池化改进 SPP / SPPF / SimSPPF / ASPP / RFB / SPPCSPC / SPPFCSPC / SPPELAN  ASPP STDC：short-term dense concatenate module 和 DDRNet SE-ResNeXt …

阅读更多...

Java代码混淆技术在应用程序保护中的关键作用与应用

Java代码混淆技术在应用程序保护中的关键作用与应用

摘要本文探讨了代码混淆在保护Java代码安全性和知识产权方面的重要意义。通过混淆技术，可以有效防止代码被反编译、逆向工程或恶意篡改，提高代码的安全性。常见的Java代码混淆工具如IPAGuard、Allatori、DashO、Zelix KlassMaster和yGuard等&#xff0…

阅读更多...

2. Java基本语法

2. Java基本语法

文章目录 2. Java基本语法2.1 关键字保留字2.1.1 关键字2.1.2 保留字2.1.3 标识符2.1.4 Java中的名称命名规范 2.2 变量2.2.1 分类2.2.2 整型变量2.2.3 浮点型2.2.4 字符型 char2.2.5 Unicode编码2.2.6 UTF-82.2.7 boolean类型 2.3 基本数据类型转换2.3.1 自动类型转换2.2.2 强…

阅读更多...

JVM篇详细分析

JVM篇详细分析

JVM总体图程序计数器： 线程私有的，每个线程一份，内部保存字节码的行号，用于记录正在执行字节码指令的地址。（可通过javap -v XX.class命令查看） java堆： 线程共享的区域，用来保存对…

阅读更多...

Java安全篇-Fastjson漏洞

Java安全篇-Fastjson漏洞

前言知识： 一、json 概念： json全称是JavaScript object notation。即JavaScript对象标记法，使用键值对进行信息的存储。格式： {"name":"wenda","age":21,} 作用： JSON 可以作为…

阅读更多...

Git，GitHub，Gitee，GitLab 四者有什么区别？

目录 1. Git 2. GitHub 3. Gitee 4. GitLab 5. 总结概括 1. Git Git 是一个版本管理工具，常应用于本地代码的管理，下载完毕之后，我们可以使用此工具对本地的资料，代码进行版本管理。下载链接： Git - Downlo…

阅读更多...

见证实力 | 走进飞凌嵌入式研发实验室

见证实力 | 走进飞凌嵌入式研发实验室

研发实验室是一家高新技术企业技术实力与创新动能的核心，一个设备齐全、流程规范、标准严格的实验室，能够确保产品功能的先进性、运行的稳定性和质量的可靠性，使产品在激烈的市场竞争中脱颖而出。十八年来，飞凌嵌入式已成功帮助…

阅读更多...

Haproxy2.8.1+Lua5.1.4部署，haproxy.cfg配置文件详解和演示

Haproxy2.8.1+Lua5.1.4部署，haproxy.cfg配置文件详解和演示

目录一.快速安装lua和haproxy 二.配置haproxy的配置文件三.配置haproxy的全局日志四.测试负载均衡、监控和日志效果五.server常用可选项 1.check 2.weight 3.backup 4.disabled 5.redirect prefix和redir 6.maxconn 六.调度算法 1.静态 2.动态一.快速安装lu…

阅读更多...

如何解决 IntelliJ IDEA 中属性文件的编码问题

如何解决 IntelliJ IDEA 中属性文件的编码问题

在使用 IntelliJ IDEA 进行开发过程中，我们经常会遇到属性文件（.properties 文件）的编码问题。如果属性文件的编码设置不正确，就会导致中文等特殊字符显示乱码。这是因为IntelliJ IDEA中默认的配置文件的编码格式是ISO-8859-1。 …

阅读更多...

骗子查询系统源码

源码简介小权云黑管理系统 V1.0 功能如下： 1.添加骗子，查询骗子 2.可添加团队后台方便审核用 3.在线反馈留言系统 4.前台提交骗子，后台需要审核才能过 5.后台使用光年UI界面 6.新增导航列表，可给网站添加导航友链 7.可添加云黑类…

阅读更多...

Linux repo基本用法: 搭建自己的repo仓库[服务端]

Linux repo基本用法: 搭建自己的repo仓库[服务端]

概述 Repo的使用离不开Git, Git 和 Repo 都是版本控制工具，但它们在使用场景和功能上有明显区别… Git 定义：Git 是一个分布式的版本控制系统，由 Linus Torvalds 为 Linux 内核开发而设计，现已成为世界上最流行的版本控制软件之…

阅读更多...

C语言--编译和链接

C语言--编译和链接

1.翻译环境计算机能够执行二进制指令，我们的电脑不会直接执行C语言代码，编译器把代码转换成二进制的指令； 我们在VS上面写下printf("hello world");这行代码的时候，经过翻译环境，生成可执行的exe文件&…

阅读更多...

【超图 SuperMap3D】【基础API使用示例】51、超图SuperMap3D - 绘制圆｜椭圆形面标注并将视角定位过去

【超图 SuperMap3D】【基础API使用示例】51、超图SuperMap3D - 绘制圆｜椭圆形面标注并将视角定位过去

前言引擎下载地址：[添加链接描述](http://support.supermap.com.cn/DownloadCenter/DownloadPage.aspx?id2524) 绘制圆形或者椭圆形效果核心代码 entity viewer.entities.add({// 圆中心点position: { x: -1405746.5243351874, y: 4988274.8462937465, z: 370…

阅读更多...

SpringBoot Redis 之Lettuce 驱动

SpringBoot Redis 之Lettuce 驱动

一、前言一直以为SpringBoot中 spring-boot-starter-data-redis使用的是Jredis连接池，直到昨天在部署报价系统生产环境时，因为端口配置错误造成无法连接，发现报错信息如下： 一了解才知道在SpringBoot2.X以后默认是使用Lettuce作…

阅读更多...

最新文章

推荐文章