【数据结构与算法】:归并排序和计数排序

1. 归并排序

归并排序是一种效率仅次于快速排序的排序算法。它有非递归递归两种实现方式(本文只讲述递归实现,非递归实现以后有专门的文章)。

其实,归并排序也叫外排序。它不仅可以对内存中的数据进行排序,还能对文件里的数据排序。

比如:假设有10G的数据放在硬盘的文件中,要排序,如何排呢?
我们知道,内存里的空间远远没有10G,假设有1G内存可用。首先我们可以把10G的文件切分成10个1G的文件,再依次读文件,每次把1G的数据读入内存的数组中,接着利用快排对其进行排序,再把排好序的那1G的数据写到硬盘的一个文件,再继续读下一个1G的数据……当10个文件里的数据都分别有序时,再利用归并排序进行两两归并,最终使10G的数据有序。

1.算法思想:

归并排序采用分治法。首先假设一组数据的左半区间有序,右半区间有序,将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。

若将两个有序表合并成一个有序表,称为二路归并

所谓 归并,就是将两组有序的数据合成为一组有序的数据。 例如有如下两个有序数组,将两个有序数组归并为一个有序数组,这就是一次归并操作。

在这里插入图片描述

2.归并操作的工作原理如下:

第一步:申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列。

第二步:设定两个指针,最初位置分别为两个已经排序序列的起始位置。

第三步:比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置。

重复步骤3直到某一指针超出序列尾,将另一序列剩下的所有元素直接复制到合并序列尾。

归并排序类似于二叉树的后序遍历即先将左右的区间都排为有序后,然后才开始进行归并操作,因为归并必须要满足两个数组是有序的。

例如有如下数组。需要先将该数组每次都分割为两个区间,直到最后每个区间都只有一个值,此时比较两个值大小,然后将该两个值归并到一个数组中,此时就得到一个有两个元素的有序数组,然后再与另一个有两个元素的有序数组进行归并,然后就得到了一个有四个元素的有序数组,然后再与另一个有四个元素的有序数组进行归并,就得到了一个有八个元素的有序数组。就这样依次递归归并,直到最后目标数组为有序数组。

在这里插入图片描述

3.归并排序的代码实现如下:


//把数组分成区间
void _MergrSort(int* arr,int left,int right,int* tmp)
{//当左右两个区间只有一个元素或是不存在区间时,递归结束if (left >= right)return ;//右移1位右除以2的效果,用来把数组分成两个区间int mid = (left + right) >> 1;//假设[left mid] [mid+1 right]有序,就可以归并_MergrSort(arr, left, mid, tmp);_MergrSort(arr, mid + 1, right, tmp);//每次归并的过程int begin1 = left;int end1 = mid;int begin2 = mid + 1;int end2 = right;int index = left;while (begin1 <= end1 && begin2 <= end2){if (arr[begin1] < arr[begin2]){tmp[index++] = arr[begin1++];}else{tmp[index++] = arr[begin2++];}}//当其中有一个区间结束时,另一个有序区间的数据直接拷贝进临时数组里while (begin1 <= end1){tmp[index++] = arr[begin1++];}while (begin2 <= end2){tmp[index++] = arr[begin2++];}//最后把临时数组里面的数据拷贝回原数组for (int i = left; i <= right; i++){arr[i] = tmp[i];}
}void MergrSort(int* arr, int sz)
{//创建临时数组存放数据int* tmp = (int*)malloc(sizeof(int) * sz);if (tmp == NULL){perror("malloc");return;}_MergrSort(arr, 0, sz - 1, tmp);free(tmp);tmp = NULL;
}

排序结果如下:
在这里插入图片描述

4.归并排序的时间复杂度和稳定性分析:

1.归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(N)
4. 稳定性:稳定

2. 计数排序

计数排序是一种非比较排序,即不需要直接比较数据之间的大小来进行排序。

1.算法思想:

计数排序,是通过统计每一个数字出现的次数,并把它映射到与它自己本身数值相同的下标处,再遍历映射的数组使原数组有序的一种排序方法

计数排序的本质是一种哈希算法,也就是通过建立映射关系来达到排序的目的。

2.映射过程的图解如下:

基本思路:

先开辟一个映射数组,然后遍历原数组,数组中的元素是几就在开辟的的映射数组下标为几的位置+1,得到的这个映射数组就包含了原数组中所有元素的映射关系,最后遍历一遍映射数组找出原数组中出现过的数即可

在这里插入图片描述
如图所示,原数组中有一个8,那么在映射数组的下标为8的位置记为1;原数组中有两个5,在映射数组的下标为5的位置记为2……以此类推。

但是这样映射也面临着一个问题,那就是我们开辟的数组到底要开多大的空间呢? 显然,我们在上述例子中开辟了10个整形空间的数组,但是可以看到,有5个位置都是空的,也就是说有五个位置的数都是没出现过的,这样子开辟空间显然是有些浪费了,我们上面的写法是一种绝对映射的写法,绝对映射就是这个数本身是多少就映射到下标为多少的位置,但是如果我给出以下这个数组让你排序呢?

在这里插入图片描述

显然,以上数字的最大值是109,也就是说如果用绝对映射的方法那我们至少需要开110个空间,因为109要映射到下标为109的位置,下标从0开始,0-109就是110个数。但是仔细观察你会发现,这些数都是在100-109之间的,换句话说如果你开辟110个空间,那么前100个位置都是0,没有数映射,所以就等于是白白浪费了100个整形的空间,这显然是不能接受的。

所以有人就想出来了一种相对映射的方法,把100映射到0的位置,把109映射到9的位置,其它的也以此类推,每个数在映射的时候都减去100,等到取出数据的时候在加上100就能得到原来的数了。这样一来,我们需要开10个整形的空间就可以了,大大减少了内存的消耗。

那么真正开辟的空间该如何计算呢?

开辟的空间的大小=最大元素-最小元素+1
例如上面的例子就是:开辟空间的大小=109-100+1=10
为什么要+1?因为数组下标是从0开始的,如果不+1,那就是开辟9个空间,那么109就没法映射到109-100=9的位置了。

3.计数排序的代码实现如下:

void CountSort(int* arr, int sz)
{int max = arr[0];int min = arr[0];//找出最大值和最小值for (int i = 0; i < sz; i++){if (arr[i] > max){max = arr[i];}if (arr[i] < min){min = arr[i];}}//求出范围,就是要开辟的空间的大小int range = max - min + 1; int* count = (int *)calloc(range, sizeof(int)*range);if (count == NULL){perror("calloc fail!\n");return;}//统计每个数字出现的次数,相对映射到开辟的数组中for (int i = 0; i < sz; i++){count[arr[i] - min]++;}//把数据进行排序,放回原数组中int j = 0;for (int i = 0; i < range; i++){while (count[i]--){//后置++,先用后加arr[j++] = i + min;}}free(count);count = NULL;}

排序结果如下:

在这里插入图片描述

4.归并排序的时间复杂度和稳定性分析:

1.计数排序的局限性在于它更加适用于范围集中的一组整型数据的排序,这时效率非常高,如果数据的范围较大(就是代码中的 range ),或是排序其他类型的数据,就可能不太适用。
2.时间复杂度:O(N+range)
3.空间复杂度:O(range)
4.稳定性:稳定

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/302159.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 使数组连续的最少操作数

地址&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 难度&#xff1a;困难 题目描述&#xff1a;给你一个整数数组 nums 。每一次操作中&#xff0c;你可以将 nums 中 任意 一个元素替换成 **任意 **整数。 如果 nums 满足以下条件&#xff0c;那么它是 连续的 &#x…

点击上传文件

一、页面样式&#xff1a; &#xff08;1&#xff09;点击前&#xff1a; &#xff08;2&#xff09;点击后&#xff1a; 设计&#xff1a;①自定义elementPlus图标&#xff1b;②使用Tooltip实现鼠标悬浮按钮上出现文字提示&#xff1b;③上传与更换的切换样式&#xff1b;…

Linux 性能分析工具大全

vmstat--虚拟内存统计 vmstat&#xff08;VirtualMeomoryStatistics&#xff0c;虚拟内存统计&#xff09;是 Linux 中监控内存的常用工具,可对操作系统的虚拟内存、进程、CPU 等的整体情况进行监视。vmstat 的常规用法&#xff1a;vmstat interval times 即每隔 interval 秒采…

从概念到实践:揭开枚举与联合体在数字化创新时代的神秘面纱

欢迎来到白刘的领域 Miracle_86.-CSDN博客 系列专栏 C语言知识 先赞后看&#xff0c;已成习惯 创作不易&#xff0c;多多支持&#xff01; 在编程的世界中&#xff0c;枚举和联合体是两种非常基础且重要的数据结构。它们各自具有独特的特点和用途&#xff0c;为程序员提供…

(一)基于IDEA的JAVA基础12

一维数组 为什么使用数组: 当我们需要存储一系列数据的时候&#xff0c;就需要用到数组&#xff0c;如果不使用数组&#xff0c;我们就要需要一个一个的去声明变量&#xff0c;这样浪费内存空间&#xff0c;同时效率低下。 什么是数组: 数组本身就是一个变量&#xff0c;只…

Redis从入门到精通(六)Redis实战(三)优惠券秒杀

↑↑↑下载测试项目原代码↑↑↑ 文章目录 前言4.3 优惠券秒杀4.3.1 数据表与实体类4.3.2 添加优惠券4.3.2.1 添加普通券代码4.3.2.2 添加秒杀券代码 4.3.3 实现秒杀下单4.3.3.1 秒杀下单逻辑分析4.3.3.2 获取秒杀订单ID4.3.3.3 获取用户ID4.3.3.4 实现秒杀下单 前言 Redis实战…

diffusion model(十五) : IP-Adapter技术小结

infopaperhttps://arxiv.org/pdf/2308.06721.pdfcodehttps://github.com/tencent-ailab/IP-Adapterorg.Tencent AI Lab个人博客地址http://myhz0606.com/article/ip_adapter 1 Motivation 为了对文生图diffusion model进行特定概念的定制&#xff0c;常用LoRA[1]、textual in…

JDK下载及安装说明

1&#xff0e;JDK下载 访问oracle官网&#xff1a;http://www.oracle.com 在首页点击Downloads&#xff0c;进入oracle软件下载页。 在下载页面&#xff0c;点击Java。 选择Java (JDK) for Developers&#xff0c;点击。 在 Java SE Downloads 页面&#xff0c;点击中间的DO…

装机指导。

everything winrar snipaste cmake git tortoisegit tortoisesvn inno setup vs2022 安装的时候注意sdk路径一定要默认&#xff01;&#xff01; 否则你会发现在你的sdk安装路径的根盘符下会多出一个Windows Kits&#xff0c;强迫症接受不了 默认的会跟已有的装在一起…

【Python系列】读取 Excel 第一列数据并赋值到指定列

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

Linux的学习之路:4、权限

一、Linux权限的概念 权限我们都熟悉&#xff0c;最常见的就是在看电视时需要vip这个就是权限&#xff0c;然后在Linux就是有两个权限&#xff0c;就是管理员也就是超级用户和普通的用户 命令&#xff1a;su [用户名] 功能&#xff1a;切换用户。 例如&#xff0c;要从root用户…

ZLMediaKit ubantu 下编译

1、获取代码 #国内用户推荐从同步镜像网站gitee下载 git clone --depth 1 https://gitee.com/xia-chu/ZLMediaKit cd ZLMediaKit #千万不要忘记执行这句命令 git submodule update --init二、依赖库 Debian系(包括ubuntu&#xff09;系统下安装依赖的方法&#xff1a; #除了…

Python-VBA函数之旅-ascii函数

ascii函数在Python中主要用于将对象(特别是字符和字符串)转换为它们的ASCII表示形式。这种转换在处理文本数据、调试代码以及确保文本以 ASCII 格式存储或传输时非常有用。常见应用场景有&#xff1a; 1、调试和文本处理&#xff1a;当处理包含非ASCII字符(如Unicode字符)的文…

景联文科技:为AI大模型提供高质海量训练数据

在全球AI浪潮的推动下&#xff0c;大量训练数据已成为AI算法模型发展和演进中的关键一环。 艾瑞咨询数据显示&#xff0c;包括数据采集、数据处理&#xff08;标注&#xff09;、数据存储、数据挖掘等模块在内的AI基础数据服务市场&#xff0c;将在未来数年内持续增长。 预计到…

算法:完全背包问题dp

文章目录 一、完全背包问题的特征二、定义状态三、状态转移四、降维优化五、参考例题5.1、Acwing&#xff1a;3.完全背包问题5.2、Acwing&#xff1a;900. 整数划分 一、完全背包问题的特征 完全背包问题是动态规划中的一种经典问题&#xff0c;它的主要特征可以总结如下&…

ES6中 Promise的详细讲解

文章目录 一、介绍状态特点流程 二、用法实例方法then()catchfinally() 构造函数方法all()race()allSettled()resolve()reject() 三、使用场景# 参考文献 一、介绍 Promise&#xff0c;译为承诺&#xff0c;是异步编程的一种解决方案&#xff0c;比传统的解决方案&#xff08;…

2024/4/5—力扣—在排序数组中查找元素的第一个和最后一个位置

代码实现&#xff1a; 思路&#xff1a;二分法 方法一&#xff1a;分别查找左右侧边界 /*** Note: The returned array must be malloced, assume caller calls free().*/ int GetTargetFirstPosition(int *nums, int numsSize, int target) {int l 0, r numsSize - 1;while …

springboot无人便利店信息管理系统ssm+tomcat+java

jdk版本&#xff1a;1.8 及以上 ide工具&#xff1a;IDEA 或者eclipse 数据库: mysql 编程语言: java 框架&#xff1a;SSM/springboot都有 maven: 3.6.1 前端&#xff1a;layuibootstrapjsp 详细技术&#xff1a;HTMLCSSJSjspspringmvcmybatisMYSQLMAVENtomcat本文以java实现…

Jenkins使用-绑定域控与用户授权

一、Jenkins安装完成后&#xff0c;企业中使用&#xff0c;首先需要绑定域控以方便管理。 操作方法&#xff1a; 1、备份配置文件&#xff0c;防止域控绑定错误或授权策略选择不对&#xff0c;造成没办法登录&#xff0c;或登录后没有权限操作。 [roottest jenkins]# mkdir ba…

iOS 开发中上传 IPA 文件的方法(无需 Mac 电脑

引言 在 iOS 开发中&#xff0c;将 IPA 文件上传到苹果开发者中心是一个重要的步骤。通常情况下&#xff0c;我们需要使用 Mac 电脑上的 Xcode 或 Application Loader 工具来完成这个任务。然而&#xff0c;如果你没有 Mac 电脑&#xff0c;也没有关系&#xff0c;本文将介绍一…