数据结构--》掌握数据结构中的查找算法

        当你需要从大量数据中查找某个元素时,查找算法就变得非常重要。

        无论你是初学者还是进阶者,本文将为你提供简单易懂、实用可行的知识点,帮助你更好地掌握查找在数据结构和算法中的重要性,进而提升算法解题的能力。接下来让我们开启数据结构与算法的奇妙之旅吧。

目录

查找的基本操作

二叉排序树

平衡二叉树

红黑树的基本操作

B树

哈希(散列)表基本操作


查找的基本操作

查找:在数据集合中寻找满足某种条件的数据元素的过程称为查找。

查找表:用于查找的数据集合称为查找表,它由同一类型的数据元素(或记录)组成。

关键字:数据元素中唯一标识该元素的某个数据项的值,使用基于关键字的查找,查找结果应该是唯一的。

查找长度:在查找运算中,需要对比关键字的次数称为查找长度。

平均查找长度(ASL):所有查找过程中进行关键字的比较次数的平均值。

ASL的数量级反应了查找算法时间复杂度:

顺序查找又称 “线性查找”,通常用于线性表。其算法思想是:从头到尾挨个查找(反过来也可以)。

下面是用 C 语言实现顺序查找算法的基本代码示例:

#include <stdio.h>int sequentialSearch(int array[], int n, int target) {for (int i = 0; i < n; i++) {if (array[i] == target) {return i; // 找到匹配的元素,返回索引}}return -1; // 未找到匹配的元素,返回-1
}int main() {int array[] = {9, 5, 7, 3, 2, 8};int n = sizeof(array) / sizeof(array[0]);int target = 7;int result = sequentialSearch(array, n, target);if (result == -1) {printf("未找到目标元素\n");} else {printf("目标元素在索引 %d 处\n", result);}return 0;
}

回顾重点,其主要内容整理成如下内容:

折半查找又称 “二分查找”,仅适用于有序的顺序表。二分查找通过将待查找的数据与数据集合的中间元素进行比较,从而将查找范围缩小一半,重复这个过程直到找到匹配的元素或者确定找不到为止。

下面是折半查找的相关概念及代码实现(使用C语言):

#include <stdio.h>int binarySearch(int array[], int low, int high, int target) {while (low <= high) {int mid = (low + high) / 2;if (array[mid] == target) {return mid; // 找到匹配的元素,返回索引} else if (array[mid] < target) {low = mid + 1; // 目标在当前中间元素的右侧} else {high = mid - 1; // 目标在当前中间元素的左侧}}return -1; // 未找到匹配的元素,返回-1
}int main() {int array[] = {2, 3, 5, 7, 8, 9};int n = sizeof(array) / sizeof(array[0]);int target = 7;int result = binarySearch(array, 0, n - 1, target);if (result == -1) {printf("未找到目标元素\n");} else {printf("目标元素在索引 %d 处\n", result);}return 0;
}

回顾重点,其主要内容整理成如下内容: 

分块查找也称索引顺序查找,是一种将数据集合划分为多个块,并在每个块中建立索引来加速查找过程的一种查找算法。它适用于数据集合较大且有序的情况。

下面是分块查找的相关概念及代码实现(使用C语言):

#include <stdio.h>// 定义数据块结构
typedef struct {int index; // 索引值int max;   // 当前块的最大值
} Block;int blockSearch(int blocks[], int n, int m, int target) {// 首先找到所在块的索引int blockIndex = -1;for (int i = 0; i < n; i++) {if (blocks[i].max >= target) {blockIndex = i;break;}}// 若未找到所在块,则目标元素不存在if (blockIndex == -1) {return -1;}// 在对应块内顺序查找目标元素int start = blockIndex * m; // 块的起始位置int end = (blockIndex + 1) * m - 1; // 块的结束位置for (int i = start; i <= end; i++) {if (blocks[i] == target) {return i; // 找到匹配的元素,返回索引}}return -1; // 未找到匹配的元素,返回-1
}int main() {Block blocks[] = {{0, 3}, {4, 7}, {8, 11}, {12, 14}};int n = sizeof(blocks) / sizeof(blocks[0]);int m = 4;int target = 10;int result = blockSearch(blocks, n, m, target);if (result == -1) {printf("未找到目标元素\n");} else {printf("目标元素在索引 %d 处\n", result);}return 0;
}

回顾重点,其主要内容整理成如下内容:  

二叉排序树

二叉排序树又称 “二叉查找树”,一颗二叉树或者是空二叉树,或者是具有如下性质的二叉树:

左子树上所有结点的关键字均小于根结点的关键字

右子树上所有结点的关键字均大于根结点的关键字

左子树和右子树又各是一颗二叉排序树:

以下是二叉排序树查找、插入、删掉等相关的操作代码:

#include <stdio.h>
#include <stdlib.h>// 二叉树节点定义
typedef struct TreeNode {int val;struct TreeNode* left;struct TreeNode* right;
} TreeNode;// 查找二叉排序树中是否存在指定值,存在返回1,不存在返回0
int searchBST(TreeNode* root, int val) {if (root == NULL) {return 0;}if (root->val == val) {return 1;} else if (root->val > val) {return searchBST(root->left, val);} else {return searchBST(root->right, val);}
}// 插入值为val的节点到二叉排序树中,返回插入后的根节点
TreeNode* insertBST(TreeNode* root, int val) {// 如果当前根节点为空,则直接将新节点插入if (root == NULL) {TreeNode* node = (TreeNode*)malloc(sizeof(TreeNode));node->val = val;node->left = NULL;node->right = NULL;return node;}// 如果val比当前根节点小,则递归插入到左子树中if (val < root->val) {root->left = insertBST(root->left, val);} else {  // 否则递归插入到右子树中root->right = insertBST(root->right, val);}return root;
}// 删除值为val的节点,返回删除后的根节点
TreeNode* deleteBST(TreeNode* root, int val) {// 如果当前节点为空,则说明没有找到需要删除的节点,直接返回原根节点if (root == NULL) {return root;}// 如果需要删除的节点比当前根节点小,则递归删除左子树中的对应节点if (val < root->val) {root->left = deleteBST(root->left, val);return root;} else if (val > root->val) {  // 否则递归删除右子树中的对应节点root->right = deleteBST(root->right, val);return root;}// 找到需要删除的节点if (root->left == NULL) {  // 情况1:只有右子树TreeNode* right = root->right;free(root);return right;} else if (root->right == NULL) {  // 情况2:只有左子树TreeNode* left = root->left;free(root);return left;} else {  // 情况3:同时存在左右子树,选择用其前驱节点进行替代TreeNode* pred = root->left;while (pred->right != NULL) {pred = pred->right;}root->val = pred->val;root->left = deleteBST(root->left, pred->val);return root;}
}// 中序遍历二叉排序树,输出结果为有序序列
void inorder(TreeNode* root) {if (root == NULL) {return;}inorder(root->left);printf("%d ", root->val);inorder(root->right);
}int main() {// 构建二叉排序树TreeNode* root = NULL;root = insertBST(root, 5);insertBST(root, 3);insertBST(root, 7);insertBST(root, 2);insertBST(root, 4);insertBST(root, 6);// 查找操作printf("%d\n", searchBST(root, 4));  // 输出1printf("%d\n", searchBST(root, 8));  // 输出0// 删除操作root = deleteBST(root, 5);inorder(root);  // 输出有序序列:2 3 4 6 7return 0;
}

回顾重点,其主要内容整理成如下内容: 

平衡二叉树

平衡二叉树也称为AVL树,是一种二叉排序树,它的左子树和右子树的高度差不超过1,即每个节点的左右子树的高度之差的绝对值都不超过1。

主要目的:在于保证二叉搜索树的查找效率。在普通的二叉搜索树中,如果出现极端情况(如数据有序插入),树高会退化为O(n),此时二叉搜索树的效率就与链表一样了。而平衡二叉树的高度始终保持在O(log n)级别,因此在大量动态插入和删除的数据操作时,平衡二叉树有着明显的优势。

结点的平衡因子 = 左子树高 - 右子树高。(结点的平衡因子的值只可能是 -1、0 或 1)

注意:只要有任一结点的平衡因子绝对值大于1,就不是平衡二叉树。

平衡二叉树的插入:每次调整的对象都是 “最小不平衡子树” , 在插入操作中只要将最小不平衡子树调整平衡,则其他祖先结点都会恢复平衡。

调整最小不平衡子树(LL)

调整最小不平衡子树(RR)

上面的两个代码思路大致如下:

调整最小不平衡子树(LR):  

调整最小不平衡子树(RL):   

总结:  

练习

回顾重点,其主要内容整理成如下内容:

平衡二叉树的删除: 平衡二叉树的删除和插入操作有异曲同工之妙,其主要特点如下:

平衡二叉树的删除操作具体步骤:

1)删除结点(方法同 “二叉排序树”)

2)一路向北(上 )找到最小不平衡子树,找不到就完结撒花

3)找最小不平衡子树下,“个头”最高的儿子、孙子

4)根据孙子的位置,调整平衡(LL/RR/LR/RL)

5)如果不平衡向上传导,继续2操作

具体的操作如下:

对最小不平衡子树的旋转可能导致树变矮,从而导致上层祖先不平衡(不平衡向上传递):

回顾重点,其主要内容整理成如下内容: 

红黑树的基本操作

红黑树(Red-Black Tree)是一种自平衡二叉查找树,它在每个节点上增加了一个存储位表示节点的颜色,可以是红色或黑色。这个额外的颜色信息使得红黑树相较于普通的二叉查找树更加平衡,从而能够确保最坏情况下基本动态集合操作的时间复杂度为O(log n)。

平衡二叉树和红黑树的特点及其适用场景

红黑树具有以下五个性质: 

1)每个节点不是红色就是黑色。

2)根节点是黑色的。

3)每个叶子节点都是黑色的空节点(NIL节点)。

4)如果一个节点是红色的,则它的两个子节点都是黑色的。

5)对每个节点,从该节点到其所有后代叶子节点简单路径上,均包含相同数目的黑色节点。

将所有特性总结为的几句话:左根右、根叶黑、不红红、黑路同。

注意:1)从根结点到叶节点的最长路径不大于最短路径的2倍

           2)从n个内部节点的红黑树高度  h \leqslant 2log_2(n+1)

           3)红黑树查找操作时间复杂度 = O(log_2n)

下面是一个简单的红黑树的实例:

结点的黑高bh:从某结点出发(不含该结点)到达任一空叶结点的路径上黑结点总数。

回顾重点,其主要内容整理成如下内容: 

红黑树的删除操作

B树

B树:又称多路平衡查找树,B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示。一颗m阶B树或为空树,或为满足如下特性的m叉树:

1)树中每个结点至多有m棵子树,即至多含有m-1个关键字。

2)若根结点不是终端结点,则至少有两棵子树。

3)除根结点外的所有非叶结点至少有[m/2]棵子树,即至少含有[m/2]-1个关键字。

4)所有的叶结点都出现在同一层次上,并且不带信息(可以视为外部结点或类似于折半查找找判定树的查找失败结点,实际上这些结点不存在,指向这些结点的指针为空)。

B树的高度:一般求解含n个关键字的m阶B树,最小高度和最大高度是多少?(不包含叶子结点)

B树的插入

B树的删除: 若被删除关键字在非终端结点,则用直接前驱或直接后继来替代被删除的关键字。

直接前驱:当前关键字左侧指针所指子树下的 “最右下” 的元素。

直接后继:当前关键字右侧指针所指子树中的 “最坐下” 的元素。

回顾重点,其主要内容整理成如下内容: 

B+树的相关概念

B+树是一种变种的B树,也是一种自平衡的搜索树。一棵m阶的B+树满足下列条件:

1)每个分支结点最多有m棵子树(孩子结点)。

2)非叶根结点至少有两棵子树,其他每个分支结点至少有[m/2] 棵子树。

3)结点的子树个数与关键字个数相等

4)所有叶结点包含全部关键字及指向相应记录的指针,叶节点中将关键字按大小顺序排列,并且相邻叶结点按大小顺序相互链接起来。

5)所有分支结点中仅包含它的各个子节点中关键字的最大值及指向其子节点的指针。

B+树的查找:无论查找成功与否,最终一定都要走到最下面一层结点。

哈希(散列)表基本操作

哈希表又称散列表,是一种数据结构,特点是:数据元素的关键字与其存储地址直接相关。

举出以下一个例子进行简单的说明:

拉链法(又称链接法、链地址法)处理“冲突”:把所有“同义词”存储在一个链表中。

若不同的关键字通过散列函数映射到同一个值,则称它们为 “同义词”;

通过散列函数确定的位置已经存放了其他元素,则称这种情况为 “冲突”。

散列查找: 我们可以通过散列函数计算目标元素存储地址,然后遍历该地址来找到我们的目标

如果查找失败的情况下,比如如下的这俩种情况:

平均查找长度:如果想求解平均查找长度的话可以采用如下方式进行:

装填因子:装填因子越大表明冲突越大,查找效率越低。

常见散列函数的设计方法:(设计目标:让不同关键字的冲突尽可能的减少)

散列表处理冲突的方法: 

开放定址法有以下三种方式进行:

线性探测法:如果当前的位置冲突,往后面找有空位的地方然后进入即可。

如果想进行查找的话也可以采用如下的方式:(分别是成功和失败的情况)

查找效率分析的话如下:

平方探测法:根据d给出的公式依次带入找到对应的值

伪序列随机法:根据提供的d值进行存放:

总结

再散列法

回顾重点,其主要内容整理成如下内容: 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/158795.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

修炼k8s+flink+hdfs+dlink(四:k8s(一)概念)

一&#xff1a;概念 1. 概述 1.1 kubernetes对象. k8s对象包含俩个嵌套对象字段。 spec&#xff08;规约&#xff09;&#xff1a;期望状态 status&#xff08;状态&#xff09;&#xff1a;当前状态 当创建对象的时候&#xff0c;会按照spec的状态进行创建&#xff0c;如果…

Hadoop3教程(四):HDFS的读写流程及节点距离计算

文章目录 &#xff08;55&#xff09;HDFS 写数据流程&#xff08;56&#xff09; 节点距离计算&#xff08;57&#xff09;机架感知&#xff08;副本存储节点选择&#xff09;&#xff08;58&#xff09;HDFS 读数据流程参考文献 &#xff08;55&#xff09;HDFS 写数据流程 …

【Vue 2】Props

Prop大小写 Prop的命名规则有camelCase&#xff0c;驼峰命名和kebab-case&#xff0c;短横线分隔。 由于HTML对大小写不敏感&#xff0c;所以浏览器会把大写字母解释为小写字母。 当我们使用camelCase命名prop时&#xff0c;在Dom中的template模板使用该prop就需要换成对应的…

Leetcode刷题详解——盛最多水的容器

1.题目链接&#xff1a;盛最多水的容器 2.题目描述&#xff1a; 给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容…

修改http_charfinder.py使能在python311环境中运行

需要修改两个函数&#xff0c;第一个是init函数&#xff0c;修改如下&#xff1a; async def init(loop, address, port): # <1> # app web.Application(looploop) # <2> # app.router.add_route(GET, /, home) # <3> app web.Application(…

企业级CI/CD 持续集成/交付/发布

jenkins 安装与使用 nmcli g hostname jenkins 加载缓存 yum makecache fast 上传jdk11、jdk8 获取、上传war包 1、jenkins.io/download 2.4.27 2、老师发的 上传 maven 上传tomcat软件包 &#xff08;apache.org-tomcat8-下载&#xff09; 注意8009端口 /usr... vi /etc/pro…

Redis 图形化界面下载及使用超详细教程(带安装包)! redis windows下客户端下载

另一个完全不同的redis图形化界面教程链接&#xff08;带安装包&#xff09;&#xff1a; Redis 最流行的图形化界面下载及使用超详细教程&#xff08;带安装包&#xff09;&#xff01; redis windows客户端下载_dream_ready的博客-CSDN博客 redis图形化界面的压缩包&#xff…

18.(开发工具篇Gitlab)Git如何回退到指定版本

首先: 使用git log命令查看提交历史,找到想要回退的版本的commit id. 使用git reset命令 第一步:git reset --hard 命令是强制回到某一个版本。执行后本地工程回退到该版本。 第二步:利用git push -f命令强制推到远程 如下所示: 优点:干净利落,回滚后完全回到最初状态…

Leetcode刷题笔记--Hot61-70

1--课程表&#xff08;207&#xff09; 主要思路&#xff1a; 用 in 记录每一门课程剩余的先修课程个数&#xff0c;当剩余先修课程个数为0时&#xff0c;将该课程加入到队列q中。 每修队列q中的课程&#xff0c;以该课程作为先修课程的所有课程&#xff0c;其剩余先修课程个数…

K8S云计算系列-(3)

K8S Kubeadm案例实战 Kubeadm 是一个K8S部署工具&#xff0c;它提供了kubeadm init 以及 kubeadm join 这两个命令来快速创建kubernetes集群。 Kubeadm 通过执行必要的操作来启动和运行一个最小可用的集群。它故意被设计为只关心启动集群&#xff0c;而不是之前的节点准备工作…

12.JVM

一.JVM类加载机制:把类从硬盘文件加载到内存中 1.java文件,编写时是一个.java文件,编译后现成一个.class的字节码文件,运行的时候,JVM就会读取.class文件,放到内存中,并且构造类对象. 2.类加载流程: a.加载:找到.class文件,打开文件,读取内容,尝试解析文件内容. b.验证:检查…

GIS小技术分享(一):python中json数据转geojson或者shp

1.环境需求 geopandspandasshapelyjsonpython3 2.输入数据&#xff08;path字段&#xff0c;线条&#xff09; [{"id": "586A685D568311B2A16F33FCD5055F7B","name": "普及江","path": "[[116.35178835446628,23.57…

Android Handler/Looper视角看UI线程的原理

概述 Handler/Looper机制是android系统非重要且基础的机制&#xff0c;即使在rtos或者linux操作系统上开发应用框架时&#xff0c;也经常借鉴这个机制。通过该机制机制可以让一个线程循环处理事件&#xff0c;事件处理逻辑即在Handler的handleMessge种。本文建议android8.1源码…

JVM基础:初识JVM

IDE&#xff1a;IntelliJ IDEA 2022.1.3 x64 操作系统&#xff1a;win10 x64 位 家庭版 文章目录 一、JVM是什么&#xff1f;二、JVM有哪些功能&#xff1f;2.1 解释和运行2.2 内存管理2.3 即时编译 三、有哪些常见的JVM&#xff1f;3.1 常见JVM3.2 Java虚拟机规范3.3 HotSpot的…

Mongodb----部署副本集 实现读写分离

使用软件&#xff1a; xshell7 vmware16 centos8 nosql booster 1 部署副本集 推荐方案&#xff1a; 为了降低资源分配&#xff0c;这里仅使用一台服务器&#xff0c;但是分配3个端口&#xff08;27017、27018、27019&#xff09;来分别实现 主节点、副本节点…

【软考-中级】系统集成项目管理工程师-立项管理历年案例

持续更新。。。。。。。。。。。。。。。 目录 2023 上 试题一(18分) 2023 上 试题一(18分) A公司跨国收购了B公司的主营业务&#xff0c;保留了B公司原有的人员组织结构和内部办公系统。 为了解决B公司内部办公系统与A公司原有系统不兼容的问题&#xff0c;财务、人力和行政部…

深入浅出ThreadPoolExecutor(一)

文章目录 线程池简诉ThreadPoolExecutor详解ThreadPoolExecutor参数详解创建线程池的工具类Executors 线程池简诉 针对各种池子,比如 连接池:用于管理和重复使用数据库连接&#xff0c;避免频繁创建和销毁数据库连接带来的性能开销。对象池&#xff1a;用于管理和重复使用对象…

Linux shell编程学习笔记12:布尔运算和逻辑运算

Linux Shell 脚本编程和其他编程语言一样&#xff0c;支持算数、关系、布尔、逻辑、字符串、文件测试等多种运算。前面几节我们陆续研究了 Linux shell编程 中的 字符串运算、算术运算和关系运算&#xff0c;今天我们来研究 Linux shell编程中的的布尔运算、逻辑运算。 一、…

LENOVO联想笔记本小新 Pro-14 2021AMD处理器ACH版(82MS)原厂Win10系统

下载链接&#xff1a;https://pan.baidu.com/s/1-KZ8Y9NmkS7nDXcMbhZLHw?pwdyrkx 系统自带所有驱动、出厂主题壁纸、系统属性专属LOGO标志、Office办公软件、lenovo联想电脑管家等预装程序 所需要工具&#xff1a;16G或以上的U盘 文件格式&#xff1a;ISO 文件大小&#xff1…