b 树和 b+树的理解

(本文引自mic老师面试文档)
数据结构与算法问题,困扰了无数的小伙伴。
很多小伙伴对数据结构与算法的认知有一个误区,认为工作中没有用到,为什么面试要问,问了能解决实际问题?
图灵奖获得者: Niklaus Wirth 说过: 程序=数据结构+算法, 也就说我们无时无刻都在和数据结构打交道。
只是作为 Java 开发,由于技术体系的成熟度较高,使得大部分人认为:程序应该等于框架 + SQL 呀?
今天我们就来分析一道数据结构的题目:”B 树和 B+树“。
关于这个问题,我们来看看普通人和高手的回答!
普通人
嗯. 我想想 …
嗯… Mysql 里面好像是用了 B+树来做索引的! 然后… 
高手
为了更清晰的解答这个问题,我打算从三个方面来回答:
了解二叉树、AVL 树、B 树的概念
B 树和 B+树的应用场景
 1. B 树是一种多路平衡查找树,为了更形象的理解,(我们来看这张图)。
二叉树,每个节点支持两个分支的树结构,相比于单向链表,多了一个分支。
二叉查找树,在二叉树的基础上增加了一个规则,左子树的所有节点的值都小于它的根节点,右子树的所有子节点都大于它的根节点。
 (如图),二叉查找树会出现斜树问题,导致时间复杂度增加,因此又引入了一种平衡
二叉树,它具有二叉查找树的所有特点,同时增加了一个规则:”它的左右两个子树的
高度差的绝对值不超过 1“。平衡二叉树会采用左旋、右旋的方式来实现平衡。

(如图),而 B 树是一种多路平衡查找树,它满足平衡二叉树的规则,但是它可以有多个子树,子树的数量取决于关键字的数量,比如这个图中根节点有两个关键字 3 和 5,那么它能够拥有的子路数量=关键字数+1。
因此从这个特征来看,在存储同样数据量的情况下,平衡二叉树的高度要大于 B 树。
B+树,其实是在 B 树的基础上做的增强,最大的区别有两个:
a. B 树的数据存储在每个节点上,而 B+树中的数据是存储在叶子节点,并且通
过链表的方式把叶子节点中的数据进行连接。
b. B+树的子路数量等于关键字数
(如图所示)这个是 B 树的存储结构,从 B 树上可以看到每个节点会存储数据。
(如图所示)这个是 B+树,B+树的所有数据是存储在叶子节点,并且叶子节点的数据
是用双向链表关联的。
2. B 树和 B+树,一般都是应用在文件系统和数据库系统中,用来减少磁盘 IO 带来的
性能损耗。
以 Mysql 中的 InnoDB 为例,当我们通过 select 语句去查询一条数据时,InnoDB 需
要从磁盘上去读取数据,这个过程会涉及到磁盘 IO 以及磁盘的随机 IO(如图所示)
我们知道磁盘 IO 的性能是特别低的,特别是随机磁盘 IO。
因为,磁盘 IO 的工作原理是,首先系统会把数据逻辑地址传给磁盘,磁盘控制电路按
照寻址逻辑把逻辑地址翻译成物理地址,也就是确定要读取的数据在哪个磁道,哪个扇
区。
为了读取这个扇区的数据,需要把磁头放在这个扇区的上面,为了实现这一个点,磁盘
会不断旋转,把目标扇区旋转到磁头下面,使得磁头找到对应的磁道,这里涉及到寻道
事件以及旋转时间。
很明显,磁盘 IO 这个过程的性能开销是非常大的,特别是查询的数据量比较多的情况
下。
所以在 InnoDB 中,干脆对存储在磁盘块上的数据建立一个索引,然后把索引数据以及
索引列对应的磁盘地址,以 B+树的方式来存储。
如图所示,当我们需要查询目标数据的时候,根据索引从 B+树中查找目标数据即可,
由于 B+树分路较多,所以只需要较少次数的磁盘 IO 就能查找到。
3. 为什么用 B 树或者 B+树来做索引结构?原因是 AVL 树的高度要比 B 树的高度要
高,而高度就意味着磁盘 IO 的数量。所以为了减少磁盘 IO 的次数,文件系统或者
数据库才会采用 B 树或者 B+树。
以上就是我对 B 树和 B+树的理解!
结尾 数据结构在实际开发中非常常见,比如数组、链表、双向链表、红黑树、跳跃表、B 树、
B+树、队列等。
在我看来,数据结构是编程中最重要的基本功之一。
学了顺序表和链表,我们就能知道查询操作比较多的场景中应该用顺序表,修改操作比
较多的场景应该使用链表。
学了队列之后,就知道对于 FIFO 的场景中,应该使用队列。
学了树的结构后,会发现原来查找类的场景,还可以更进一步提升查询性能。
基本功决定大家在技术这个岗位上能够走到的高度。
好的,本期的普通人 VS 高手面试系列的视频就到这里结束了,喜欢的朋友记得点赞收
藏。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/185716.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手把手教你:LLama2原始权重转HF模型

LLama2是meta最新开源的语言大模型,训练数据集2万亿token,上下文长度由llama的2048扩展到4096,可以理解和生成更长的文本,包括7B、13B和70B三个模型,在各种基准集的测试上表现突出,该模型可用于研究和商业用…

Android sqlite 使用简介

进行Android应用开发时经常会用到数据库。Android系统支持sqlite数据库,在app开发过程中很容易通过SQLiteOpenHelper使用数据库,SQLiteOpenHelper依赖于Context对象,但是基于uiatomator1.0和Java程序等无法获取Context的应用如何使用数据库呢…

MongoDB副本集特点验证

MongoDB副本集特点验证 mogodb副本集概述副本集搭建副本集结构验证结果源码地址 mogodb副本集概述 MongoDB副本集是将数据同步在多个服务器的过程。 复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证…

【MongoDB】索引 - 复合索引

一、准备工作 这里准备一些学生数据 db.students.insertMany([{ _id: 1, name: "张三", age: 20, class: { id: 1, name: "1班" }},{ _id: 2, name: "李四", age: 22, class: { id: 2, name: "2班" }},{ _id: 3, name: "王五…

经验模态分解(Empirical Mode Decomposition,EMD)(附代码)

代码原理 EMD(Empirical Mode Decomposition),也称为经验模态分解,是一种将非线性和非平稳信号分解成多个本征模态函数(Intrinsic Mode Functions,简称IMF)的方法。 EMD的基本原理是通过一系列…

【Mysql】增删改查(基础版)

我使用的工具是Data Grip (SQLyog Naivact 都行) 使用Data Grip创建student表,具体步骤如下(熟悉Data Grip或者使用SQLyog,Naivact可以跳过) https://blog.csdn.net/m0_67930426/article/details/13429…

zookeeper:服务器有几种状态?

四种: looking(选举中)、leading(leader)、following( follower)、 observer(观察者角色)

字节流操作

for i in range(100):ai.to_bytes(2,byteorderbig)print(i,a,end )if i%40:print() 字节流 a5678 先把5678转换为二进制就变成 0001_0110_0010_1110拆分两个字节,高字节在前,低字节在后 hig_byte 0001_0110 对应的16进制 0x16 little_byte 0010_11…

掌动智能:UI自动化测试工具产品功能和优势

UI自动化测试工具是一种软件工具,用于模拟用户与应用程序的交互,检查应用程序的用户界面是否按预期工作。这些工具允许开发人员编写测试脚本,以模拟用户操作,例如点击按钮、输入文本、导航菜单等,然后验证应用程序的响…

在linux上脱离hadoop安装hbase-2.5.6集群

一、软件版本 1.1、jdk1.8 1.2、hbase 2.5.6 1.3、zookeeper 3.8.1 二、计算节点 准备三台服务器 192.168.42.139 node1 192.168.42.140 node2 192.168.42.141 node3三、配置环境 1、每台服务器都配置jdk环境变量 [rootnode1 data]# javac -version javac 1.8.0_3912、每…

lvgl 转换和使用新字体

一、背景 如果lvgl 提供的默认字体不符合我们的显示要求,我们可以在网上下载开源字体,或者利用系统自带(注意版权问题)的字体文件转换lvgl 能识别和调用的字体。 或者为了压缩存储空间,某些字体我们只需要个别字符&…

SpringBoot测试类启动web环境-下篇

一、响应状态 1.MockMvcResultMatchers 说明:模拟结果匹配。 package com.forever;import org.junit.jupiter.api.Test; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.boot.test.autoconfigure.web.servlet.AutoC…

TCP网络编程

一)TCP Socket介绍: 1)TCP和UDP有着很大的不同,TCP想要进行网络通信的话首先需要通信双方建立连接以后然后才可以进行通信,TCP进行网络编程的方式和文件中的读写字节流类似,是以字节为单位的流进行传输 2)针对于TCP的套接字来说,J…

LangChain之关于RetrievalQA input_variables 的定义与使用

最近在使用LangChain来做一个LLMs和KBs结合的小Demo玩玩,也就是RAG(Retrieval Augmented Generation)。 这部分的内容其实在LangChain的官网已经给出了流程图。 我这里就直接偷懒了,准备对Webui的项目进行复刻练习,那么…

【QEMU-tap-windows-Xshell】QEMU 创建 aarch64虚拟机(附有QEMU免费资源)

“从零开始:在Windows上创建aarch64(ARM64)虚拟机” 前言 aarch64(ARM64)架构是一种现代的、基于 ARM 技术的计算架构,具有诸多优点,如低功耗、高性能和广泛应用等。为了在 Windows 平台上体验…

(欧拉)openEuler系统添加网卡文件配置流程、(欧拉)openEuler系统手动配置ipv6地址流程、(欧拉)openEuler系统网络管理说明

文章目录 系统说明openEuler23.03系统手动配置ip流程修改名称生成网卡配置文件【openEuler23.03系统添加网卡文件配置流程】手动指定ip添加ipv6地址修改配置文件信息和名称删除创建的网卡信息重启网卡生效并测试 openEuler23.03系统网络管理说明 系统说明 我这用云上最小化安装…

【Python大数据笔记_day05_Hive基础操作】

一.SQL,Hive和MapReduce的关系 用户在hive上编写sql语句,hive把sql语句转化为MapReduce程序去执行 二.Hive架构映射流程 用户接口: 包括CLI、JDBC/ODBC、WebGUI,CLI(command line interface)为shell命令行;Hive中的Thrift服务器允许外部客户端…

Python+Selenium+Unittest 之selenium12--WebDriver操作方法2-鼠标操作1(ActionChains类简介)

在我们平时的使用过程中,会使用鼠标去进行很多操作,比如鼠标左键点击、双击、鼠标右键点击,鼠标指针悬浮、拖拽等操作。在selenium中,我们也可以去实现常用的这些鼠标操作,这时候就需要用到selenium中的ActionChains类…

SQL第三次上机作业

1.查询与王利就读同一专业学生的借书证号和姓名 USE TSGL GO SELECT Lno,Rname FROM Reader WHERE Dept(SELECT DeptFROM ReaderWHERE Rname王利) and Rname ! 王利2.查询比希望出版社出版的所有图书价格都高的图书信息 SELECT * FROM Book WHERE Price>(SELECT MAX(Price…

5G-DFS最新动态-产品不在需要走FCC官方测试

添加图片注释,不超过 140 字(可选) 最近,FCC公布了最新版本的PAG(Product Acceptance Group)清单,即388624 D02 Pre-Approval Guidance List v18r04。这个清单的主要改变是将带有雷达侦测功能的…