Fork me on GitHub

常见排序算法总结

一、冒泡排序

冒泡排序原理:

  1. 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
  2. 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
  3. 针对所有的元素重复以上的步骤,除了最后一个。
  4. 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

Java代码实现:

1
2
3
4
5
6
7
8
9
10
11
12
public static void BubbleSort(int[] nums) {
for (int i = 0; i < nums.length - 1; i++) {
for (int j = 1; j < nums.length - i; j++) {
if (nums[j] < nums[j - 1]) {
int temp = nums[j];
nums[j] = nums[j - 1];
nums[j - 1] = temp;
}

}
}
}

冒泡排序时间空间复杂度及算法稳定性分析

对于长度为 n 的数组,冒泡排序需要经过 n(n-1)/2 次比较,最坏的情况下,即数组本身是倒序的情况下,需要经过 n(n-1)/2 次交换,所以:

冒泡排序的算法时间平均复杂度为O(n²)。空间复杂度为 O(1)。

可以想象一下:如果两个相邻的元素相等是不会进行交换操作的,也就是两个相等元素的先后顺序是不会改变的。如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个元素相邻起来,最终也不会交换它俩的位置,所以相同元素经过排序后顺序并没有改变。
所以冒泡排序是一种稳定排序算法。所以冒泡排序是稳定排序。这也正是算法稳定性的定义:

排序算法的稳定性:通俗地讲就是能保证排序前两个相等的数据其在序列中的先后位置顺序与排序后它们两个先后位置顺序相同。

二、选择排序

选择排序是另一种简单的排序算法。选择排序之所以叫选择排序就是在一次遍历过程中找到最小元素的角标位置,然后把它放到数组的首端。我们排序过程都是在寻找剩余数组中的最小元素,所以就叫做选择排序。

选择排序的思想

选择排序的思想也很简单:

  1. 从待排序序列中,找到关键字最小的元素;起始假定第一个元素为最小
  2. 如果最小元素不是待排序序列的第一个元素,将其和第一个元素互换;
  3. 从余下的 N - 1 个元素中,找出关键字最小的元素,重复1,2步,直到排序结束。

Java代码实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public static void selectSort(int[] nums) {
int n = nums.length;
for (int i = 0; i < n - 1; i++) {
int index = i;
for (int j = i + 1; j < n; j++) {
if (nums[j] < nums[index]) {
index = j;
}
}
int temp = nums[index];
nums[index] = nums[i];
nums[i] = temp;
}
}

选择排序时间空间复杂度及算法稳定性分析

上述 java 代码可以看出我们除了交换元素并未开辟额外的空间,所以额外的空间复杂度为O(1)。
对于时间复杂度而言,选择排序序冒泡排序一样都需要遍历 n(n-1)/2 次,但是相对于冒泡排序来说每次遍历只需要交换一次元素,这对于计算机执行来说有一定的优化。但是选择排序也是名副其实的慢性子,即使是有序数组,也需要进行 n(n-1)/2 次比较,所以其时间复杂度为O(n²)。
即便无论如何也要进行n(n-1)/2 次比较,选择排序仍是不稳定的排序算法,我们举一个例子如:序列5 8 5 2 9, 我们知道第一趟选择第1个元素5会与2进行交换,那么原序列中两个5的相对先后顺序也就被破坏了。

选择排序总结:

  1. 选择排序的算法时间平均复杂度为O(n²)。
  2. 选择排序空间复杂度为 O(1)。
  3. 选择排序为不稳定排序。

三、插入排序

对于插入排序,大部分资料都是使用扑克牌整理作为例子来引入的,我们打牌都是一张一张摸牌的,没摸到一张牌就会跟手里所有的牌比较来选择合适的位置插入这张牌,这也就是直接插入排序的中心思想。

插入排序的思想

  1. 从第一个元素开始,该元素可以认为已经被排序
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描
  3. 如果该元素(已排序)大于新元素,将该元素移到下一位置
  4. 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置
  5. 将新元素插入到该位置后
  6. 重复步骤 2~5

Java代码实现:

1
2
3
4
5
6
7
8
9
10
11
private static void insertSort(int[] nums) {
int n = nums.length;
for (int i = 0; i < n; i++) {
int temp = nums[i];
int j = i;
for (; j > 0 && nums[j - 1] > temp; j--) {
nums[j] = nums[j - 1];
}
nums[j] = temp;
}
}

插入排序的时间复杂度和空间复杂度分析

对于插入的时间复杂度和空间复杂度,通过代码就可以看出跟选择和冒泡来说没什么区别同属于 O(n²) 级别的时间复杂度算法 ,只是遍历方式有原来的 n n-1 n-2 … 1,变成了 1 2 3 … n 了。最终得到时间复杂度都是 n(n-1)/2。
对于稳定性来说,插入排序和冒泡一样,并不会改变原有的元素之间的顺序,如果遇见一个与插入元素相等的,那么把待插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序仍是排好序后的顺序,所以插入排序是稳定的。
对于插入排序这里说一个非常重要的一点就是:由于这个算法可以提前终止内层比较( arr[j-1] > arr[j])所以这个排序算法很有用!因此对于一些 NlogN 级别的算法,后边的归并和快速都属于这个级别的,算法来说对于 n 小于一定级别的时候(Array.sort 中使用的是47)都可以用插入算法来优化,另外对于近乎有序的数组来说这个提前终止的方式就显得更加又有优势了。

插入排序总结:

插入排序的算法时间平均复杂度为O(n²)。
插入排序空间复杂度为 O(1)。
插入排序为稳定排序。
插入排序对于近乎有序的数组来说效率更高,插入排序可用来优化高级排序算法

四、归并排序

前面介绍的排序算法都是O(n²)的排序算法,下面我们一个NlogN级别的算法,归并算法。 归并算法正如其名字一样采用归并的方法进行排序:
我们总是可以将一个数组一分为二,然后二分为四直到,每一组只有两个元素,这可以理解为个递归的过程,然后将两个元素进行排序,之后再将两个元素为一组进行排序。直到所有的元素都排序完成。

归并算法的思想

归并算法其实可以分为递归法和迭代法(自低向上归并),两种实现对于最小集合的归并操作思想是一样的区别在于如何划分数组,我们先介绍下算法最基本的操作:

  1. 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
  2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置
  3. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
  4. 重复步骤3直到某一指针到达序列尾
  5. 将另一序列剩下的所有元素直接复制到合并序列尾

假设我们现在在对一个数组的 arr[l…r] 部分进行归并,按照上述归并思想我们可将数组分为两部分 假设为 arr[l…mid] 和 arr[mid+1…r]两部分,注意这两部分可能长度并不相同,因为基数个数的数组划分的时候总是能得到一个 长度为1 和长度为2 的部分进行归并.
那么我们按照上述思路进行代码编写:

Java代码实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
// 将arr[l...mid]和arr[mid+1...r]两部分进行归并
public static void merge(int[] arr, int l, int mid, int r) {
int[] nums = new int[r - l + 1];
for (int i = l; i <= r; i++) {
nums[i - l] = arr[i];
}
// 初始化,i指向左半部分的起始索引位置l;j指向右半部分起始索引位置mid+1
int i = l, j = mid + 1;
for (int k = l; k <= r; k++) {
// 如果右半部分元素已经全部处理完毕
if (i > mid) {
arr[k] = nums[j - l];
j++;
}
// 如果右半部分元素已经全部处理完毕
else if (j > r) {
arr[k] = nums[i - l];
i++;
}
// 左半部分所指元素 < 右半部分所指元素
else if (nums[i - l] < nums[j - l]) {
arr[k] = nums[i - l];
i++;
}
// 左半部分所指元素 >= 右半部分所指元素
else {
arr[k] = nums[j - l];
j++;
}
}

}

private static void mergeSort(int[] arr, int l, int r) {
if (l >= r) {
return;
}
int mid = (l + r) / 2;
mergeSort(arr, l, mid);
mergeSort(arr, mid + 1, r);
//优化点1.检查是否上一步归并完的数组是否有序,如果有序则直接进行下一次归并
if (arr[mid] <= arr[mid + 1]) {
return;
}
merge(arr, l, mid, r);
}

public static void mergeSort(int[] arr) {
int n = arr.length;
mergeSort(arr, 0, n - 1);
}

这里对于归并排序还有一些可以改进的地方:
1.检查归并的左右两边的数组大小,如果arr[mid] <= arr[mid + 1],也就代表着归并已经完成,直接完成归并。
2.当我们递归到元素量非常小的时候,可以转而使用插入排序,因为数组比较小的时候,数组近乎有序的概率比较大,再者,数据量比较小的时候,插入排序快于归并排序,具体的数组大小需要根据测试用例的大小来判断。

自底向上迭代实现:

对于迭代实现归并其实和递归实现有所不同,迭代的时候我们是将数组分为 一个一个的元素,然后每两个归并一次,第二次我们将数组每两个分一组,两个两个的归并,知道分组大小等于待归并数组长度为止,即先局部排序,逐步扩大到全局排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
public static void merge(int[] arr, int l, int mid, int r) {
int[] nums = new int[r - l + 1];
for (int i = l; i <= r; i++) {
nums[i - l] = arr[i];
}
// 初始化,i指向左半部分的起始索引位置l;j指向右半部分起始索引位置mid+1
int i = l, j = mid + 1;
for (int k = l; k <= r; k++) {
// 如果右半部分元素已经全部处理完毕
if (i > mid) {
arr[k] = nums[j - l];
j++;
}
// 如果右半部分元素已经全部处理完毕
else if (j > r) {
arr[k] = nums[i - l];
i++;
}
// 左半部分所指元素 < 右半部分所指元素
else if (nums[i - l] < nums[j - l]) {
arr[k] = nums[i - l];
i++;
}
// 左半部分所指元素 >= 右半部分所指元素
else {
arr[k] = nums[j - l];
j++;
}
}

}

public static void mergeSortBU(int[] arr) {
int n = arr.length;
for (int sz = 1; sz < n; sz *= 2) {
for (int i = 0; i < n - sz; i += sz * 2) {
// 对于arr[mid] <= arr[mid+1]的情况,不进行merge
if (arr[i + sz - 1] > arr[i + sz]) {
merge(arr, i, i + sz - 1, Math.min(i + sz * 2 - 1, n - 1));
}
}
}
}

比如我们看第一次是 sz = 1 个长度的归并即 i = 0 i = 1 的元素归并 下次归并应该为 i= 2 i = 3 一次类推 所以内层循环 i 每次应该递增 两个 sz 那么大 为了避免角标越界且保证归并的右半部分存在 所以 i + sz < n ,又考虑到数组长度为奇数的情况,所以右半边的右边为 Math.min(i + sz + sz - 1, n - 1);

归并排序的时间复杂度和空间复杂度分析

其实对于归并排序的时间复杂对有一个递归公式来推断出时间复杂度,但简单来讲假设数组长度为 N ,那么我们就有 logN 次划分区间,而最终会划分为常数 级别的归并,将所有层的归并时间加起来得到了一个 NlogN.
对于空间复杂度,我们通过算法实现可以看出我们归并过程申请了 长度为 N 的临时数组,来进行归并所以空间复杂度为 O(n);
又由于我们在排序过程中对于 nums[i - l] = nums[j - l] 并没有进行位置交换直接取得靠前的元素先赋值,所以算法是稳定的。

归并排序总结:

  1. 归并排序的算法时间平均复杂度为O(nlog(n))。
  2. 归并排序空间复杂度为 O(n)。
  3. 归并排序为稳定排序。
钱聪 wechat
欢迎交流学习。
么么!