排序进行曲-v2.0

文章目录

- 小程一言
- 直接插入排序
- - 步骤
  - 举例
  - 复杂度分析
  - 应用场景
  - 实际举例
  - 代码实现
- 希尔排序
- - 步骤
  - 举例
  - 复杂度分析
  - 应用场景
  - 实际举例
  - 代码实现
- 堆排序
- - 步骤
  - 举例
  - 复杂度分析
  - 应用场景
  - 实际举例
  - 代码实现

小程一言

这篇文章是在排序进行曲1.0之后的续讲，
由于在上一篇讲的排序的基本概念与分类，所以这篇主要是对几个
简单的排序进行细致的分析，有直接插入排序、希尔排序以及堆排序。

在这里插入图片描述

直接插入排序

直接插入排序是一种简单直观的排序算法，它的基本思想是将待排序的元素依次插入到已排序的序列中的合适
位置，从而逐步形成有序序列。

步骤

1、将待排序的元素序列分为已排序区和未排序区。一开始已排序区只有一个元素，就是待排序序列的第一个元素。
2、从未排序区取出第一个元素，将其与已排序区的元素逐个比较，找到合适的位置插入。
3、比较的过程是从已排序区的最后一个元素开始，如果该元素大于待插入元素，则将该元素后移一位，直到找到一个小于等于待插入元素的元素位置。
4、将待插入元素插入到找到的位置后，已排序区的元素个数加一。
5、重复步骤2~4，直到未排序区的元素全部插入到已排序区。

举例

原始序列：5 3 8 6 4第一轮插入：3 5 8 6 4第二轮插入：3 5 6 8 4第三轮插入：3 4 5 6 8通过例子可以看出，直接插入排序每次将一个元素插入到已排序序列中的合适位置，通过不断地插入操作，最终将序列排序完成。

复杂度分析

直接插入排序的时间复杂度为O(n^2)，其中n是待排序序列的长度。直接插入排序的最好情况时间复杂度为O(n)，即当待排序序列已经有序时，只需要比较n-1次即可完成排序。最坏情况时间复杂度为O(n^2)，即当待排序序列逆序排列时，需要比较和移动的次数最多。平均情况下，直接插入排序的时间复杂度也是O(n^2)。直接插入排序的空间复杂度为O(1)，即只需要常数级别的额外空间。直接插入排序是一种稳定的排序算法，即相等元素的相对顺序在排序前后不会改变。

应用场景

小规模数据排序：直接插入排序对于小规模的数据排序效果较好，因为它的时间复杂度为O(n^2)，在数据规模较小的情况下，其性能优于其他复杂度较高的排序算法。例如，对于一个包含100个元素的数组进行排序，直接插入排序的效率较高。部分有序数据排序：如果待排序的数据已经部分有序，即每个元素距离它的最终位置不远，那么直接插入排序的效果会很好。这是因为直接插入排序每次将一个元素插入到已经有序的部分中，插入的操作比较快速。例如，对于一个近乎有序的数组进行排序，直接插入排序的效率较高。数据量较小且基本有序的在线排序：直接插入排序可以在不断接收新数据的情况下，实时对数据进行排序。例如，一个在线的股票交易系统，需要对新到达的交易数据进行排序，直接插入排序可以满足实时性的要求。

实际举例

假设有一个学生成绩的数组，需要按照成绩从低到高进行排序。可以使用直接插入排序来实现。首先，将第一个元素视为有序的部分，然后从第二个元素开始，逐个将元素插入到已经有序的部分中。具体的操作是，从第二个元素开始，将其与已经有序的部分比较，找到合适的位置插入，然后再将下一个元素插入，直到所有元素都被插入完成。这样就可以得到按照成绩从低到高排序的数组。

代码实现

public class InsertionSort {public static void main(String[] args) {int[] arr = {5, 2, 8, 3, 1};insertionSort(arr);for (int num : arr) {System.out.print(num + " ");}}public static void insertionSort(int[] arr) {int n = arr.length;for (int i = 1; i < n; i++) {int key = arr[i];int j = i - 1;while (j >= 0 && arr[j] > key) {arr[j + 1] = arr[j];j--;}arr[j + 1] = key;}}
}

![在这里插入图片描述](https://img-blog.csdnimg.cn/b9733adc7ec9467cb835499ec469cdac.png

希尔排序

希尔排序（Shell Sort）是插入排序的一种改进算法，也被称为缩小增量排序。希尔排序通过将待排序的元素按照一定的间隔分组，对每组进行插入排序，然后逐渐减小间隔，直到间隔为1时进行最后一次插入排序。

步骤

1、初始化间隔gap的值为数组长度的一半，然后不断将gap缩小为原来的一半，直到gap为1。
2、对于每个gap，将数组分为gap个子序列，分别对每个子序列进行插入排序。
3、在每个子序列中，从第gap个元素开始，依次与前面的元素比较，如果前面的元素较大，则将其后移gap个位置，直到找到合适的位置插入当前元素。
4、继续对每个子序列进行插入排序，直到所有子序列都排好序。
5、缩小gap的值为原来的一半，重复步骤2-4，直到gap为1时完成排序。

举例

假设有一个数组 [9, 5, 7, 1, 3]，我们将使用希尔排序对其进行排序。首先，选择一个增量（gap），可以是数组长度的一半。在这个例子中，数组长度为5，所以我们选择增量为2。然后，我们将数组分为若干个子数组，每个子数组相隔增量个元素。对于这个例子，我们将数组分为两个子数组：[9, 7, 3] 和 [5, 1]。接下来，对每个子数组进行插入排序。在插入排序中，我们将每个元素与它前面的元素进行比较，并将它插入到正确的位置。对于这个例子，我们得到以下两个子数组：[3, 7, 9] 和 [1, 5]。然后，我们将增量减小一半，即变为1。此时，我们将整个数组作为一个子数组进行插入排序。对于这个例子，我们得到最终的排序结果：[1, 3, 5, 7, 9]。

复杂度分析

希尔排序是一种改进的插入排序算法，它通过将数组分成多个子序列进行排序，然后逐步缩小子序列的长度，最终使整个数组有序。希尔排序的时间复杂度取决于步长序列的选择。常用的步长序列有希尔增量序列和Hibbard增量序列。希尔增量序列是将数组长度不断除以2得到的序列，直到序列的最后一个元素为1。例如，对于一个长度为N的数组，希尔增量序列可以是N/2, N/4, N/8, ..., 1。Hibbard增量序列是将2^k - 1作为步长，其中k从1开始递增，直到2^k - 1大于等于数组长度N。例如，对于一个长度为N的数组，Hibbard增量序列可以是1, 3, 7, 15, ..., 2^k - 1。希尔排序的平均时间复杂度为O(n^1.3)，其中n是数组的长度。这个时间复杂度是基于希尔增量序列的选择得出的。然而，希尔排序的时间复杂度并不是确定的，它可能会受到输入数据的影响。对于某些特定的输入数据，希尔排序的时间复杂度可能会更低，甚至接近O(n)。这是因为希尔排序在每一轮排序中，对于相隔较远的元素进行了交换，从而提前将较小或较大的元素移动到了正确的位置，减少了后续排序的次数。总结起来，希尔排序的时间复杂度是不确定的，但平均情况下为O(n^1.3)。

应用场景

数组规模较大：希尔排序在大规模数组排序时具有较好的性能表现，比如对百万级别的数据进行排序。数据分布较均匀：希尔排序对于数据分布较均匀的情况下，排序效率较高。如果数据分布不均匀，可能会导致排序效率下降。对稳定性没有要求：希尔排序是一种不稳定的排序算法，即相同元素的相对位置可能会发生变化。如果对排序结果的稳定性有要求，不适合使用希尔排序。对内存空间要求较低：希尔排序是一种原地排序算法，不需要额外的内存空间，适合在内存空间有限的情况下使用。

实际举例

排序算法：希尔排序可以用于对大规模数据进行排序，尤其是在数据量较大且无序程度较高的情况下，相比于其他排序算法，希尔排序具有较高的效率。数据库索引：在数据库中，索引是对表中的数据进行快速查找的一种数据结构。希尔排序可以用于对索引进行排序，提高数据库查询的效率。编程语言中的排序函数：许多编程语言中的排序函数底层实现使用了希尔排序算法，例如C++中的std::sort函数就是使用希尔排序作为默认实现。数据压缩：希尔排序可以用于对数据进行压缩，通过对数据进行排序，可以使得相同的数据连续出现，从而提高数据的压缩率。图像处理：希尔排序可以用于对图像进行排序，例如对像素点的颜色值进行排序，从而实现图像的特效处理。

代码实现

public class ShellSort {public static void shellSort(int[] arr) {int n = arr.length;for (int gap = n / 2; gap > 0; gap /= 2) {for (int i = gap; i < n; i++) {int temp = arr[i];int j = i;while (j >= gap && arr[j - gap] > temp) {arr[j] = arr[j - gap];j -= gap;}arr[j] = temp;}}}public static void main(String[] args) {int[] arr = {9, 5, 2, 7, 1, 8, 6, 3, 4};shellSort(arr);System.out.println("排序结果：");for (int num : arr) {System.out.print(num + " ");}}
}//排序结果：1 2 3 4 5 6 7 8 9

在这里插入图片描述

堆排序

堆排序是一种基于堆数据结构的排序算法，它的时间复杂度为O(nlogn)。堆排序的基本思想是将待排序的序列构建成一个大顶堆（或小顶堆），然后依次将堆顶元素与最后一个元素交换，再重新调整堆，重复这个过程直到整个序列有序。

步骤

堆排序是一种基于二叉堆的排序算法，1、构建最大堆（或最小堆）：将待排序的数组看作是一个完全二叉树，根据堆的性质，可以通过从最后一个非叶子节点开始，依次向上调整每个节点，使得每个节点都满足堆的性质。这样就可以得到一个最大堆（或最小堆）。2、将堆顶元素与最后一个元素交换：将最大堆（或最小堆）的堆顶元素与数组的最后一个元素交换位置，这样最大（或最小）的元素就被放到了最后的位置。3、调整堆：将交换后的堆顶元素向下调整，使得堆的性质仍然成立。具体操作是将堆顶元素与其左右子节点中较大（或较小）的元素交换位置，然后继续向下调整交换后的节点，直到堆的性质满足。4、重复步骤2和步骤3直到完成排序：重复执行步骤2和步骤3，每次都将堆顶元素与当前未排序的部分的最后一个元素交换，并调整堆，直到所有元素都被交换到了正确的位置。这样就完成了堆排序。

举例

待排序序列：[4, 10, 3, 5, 1]建堆：从最后一个非叶子节点开始，依次向上调整，使得每个节点的值都大于等于其子节点的值。调整后的堆为：[10, 5, 3, 4, 1]排序：将堆顶元素10与最后一个元素1交换位置，并将堆的大小减1。交换后的堆为：[1, 5, 3, 4]。然后再对堆顶元素1进行一次向下调整，使得堆重新满足堆的定义。调整后的堆为：[5, 4, 3, 1]。再次排序：将堆顶元素5与最后一个元素1交换位置，并将堆的大小减1。交换后的堆为：[1, 4, 3]。然后再对堆顶元素1进行一次向下调整，使得堆重新满足堆的定义。调整后的堆为：[4, 1, 3]。再次排序：将堆顶元素4与最后一个元素3交换位置，并将堆的大小减1。交换后的堆为：[3, 1]。然后再对堆顶元素3进行一次向下调整，使得堆重新满足堆的定义。调整后的堆为：[1, 3]。最后排序：将堆顶元素1与最后一个元素3交换位置，并将堆的大小减1。交换后的堆为：[3]。堆的大小为1，排序完成。
最终排序结果：[1, 3, 4, 5, 10]

复杂度分析

建堆：建堆的时间复杂度为O(n)，其中n为待排序序列的长度。调整堆：调整堆的时间复杂度为O(logn)。在堆排序过程中，需要调整堆的次数为n-1次，每次调整堆的时间复杂度为O(logn)。堆排序：堆排序的时间复杂度为O(nlogn)。在堆排序过程中，需要进行n-1次调整堆的操作，每次调整堆的时间复杂度为O(logn)。因此，堆排序的总时间复杂度为O(nlogn)。综上所述，堆排序的时间复杂度为O(nlogn)。

应用场景

需要对大量数据进行排序的场景，堆排序的时间复杂度为O(nlogn)，效率较高。需要稳定性较差的排序算法，堆排序是一种不稳定的排序算法，适用于不要求相同元素的相对位置保持不变的场景。需要对数据进行动态排序的场景，堆排序可以在不断插入新元素的情况下，快速对数据进行排序。需要找出最大或最小的前k个元素的场景，堆排序可以通过构建最大堆或最小堆，快速找到最大或最小的元素。

实际举例

优先级队列：堆排序可以用于实现优先级队列，其中每个元素都有一个优先级。通过使用最大堆，可以确保优先级最高的元素始终位于堆的根节点，从而可以快速找到并删除具有最高优先级的元素。任务调度：在任务调度中，每个任务都有一个优先级和执行时间。通过使用最小堆，可以按照任务的优先级和执行时间对任务进行排序，从而实现高效的任务调度。多路归并排序：堆排序可以用于多路归并排序，其中有多个有序序列需要合并成一个有序序列。通过使用最小堆，可以选择每个有序序列的最小元素进行合并，从而实现高效的多路归并排序。求Top K问题：在一组数据中，找到最大或最小的K个元素。通过使用最大堆，可以维护一个大小为K的堆，每次从数据中取出一个元素与堆顶元素比较，如果比堆顶元素大，则替换堆顶元素并重新调整堆，最终堆中的元素就是最大的K个元素。中位数问题：在一组数据中，找到中间位置的元素。通过使用最大堆和最小堆，可以将数据分为两部分，其中最大堆存储较小的一半数据，最小堆存储较大的一半数据。这样可以快速找到中位数，并支持动态添加和删除元素。

代码实现

public class HeapSort {public void heapSort(int[] arr) {int n = arr.length;// 建立最大堆for (int i = n / 2 - 1; i >= 0; i--)heapify(arr, n, i);// 逐个将堆顶元素移到数组末尾for (int i = n - 1; i >= 0; i--) {// 将当前堆顶元素（最大值）与数组末尾元素交换int temp = arr[0];arr[0] = arr[i];arr[i] = temp;// 重新调整堆，找出剩下元素的最大值heapify(arr, i, 0);}}// 调整堆void heapify(int[] arr, int n, int i) {int largest = i; // 初始化最大值为根节点int left = 2 * i + 1; // 左子节点int right = 2 * i + 2; // 右子节点// 如果左子节点大于根节点，将最大值设为左子节点if (left < n && arr[left] > arr[largest])largest = left;// 如果右子节点大于当前最大值，将最大值设为右子节点if (right < n && arr[right] > arr[largest])largest = right;// 如果最大值不是根节点，交换根节点与最大值，并继续调整堆if (largest != i) {int swap = arr[i];arr[i] = arr[largest];arr[largest] = swap;heapify(arr, n, largest);}}// 测试代码public static void main(String[] args) {int[] arr = {9, 5, 2, 7, 1, 8, 3};HeapSort heapSort = new HeapSort();heapSort.heapSort(arr);System.out.println("排序结果：");for (int num : arr) {System.out.print(num + " ");}}
}
//输出结果为：1 2 3 5 7 8 9。