在上篇文章介绍的并归排序(Merge Sort)后,再来了解下插入排序。
简介
插入排序(英语:Insertion Sort)是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。


分类 | 排序算法 |
---|---|
数据结构 | 数组 |
最差时间复杂度 | |
最优时间复杂度 | |
平均时间复杂度 | |
最差空间复杂度 | 总共 |
记载
最早拥有排序概念的机器出现在1901至1904年间由Hollerith发明出使用基数排序法的分类机,此机器系统包括打孔,制表等功能,1908年分类机第一次应用于人口普查,并且在两年内完成了所有的普查数据和归档。 Hollerith在1896年创立的分类机公司的前身,为电脑制表记录公司(CTR)。他在电脑制表记录公司(CTR)曾担任顾问工程师,直到1921年退休,而电脑制表记录公司(CTR)在1924年正式改名为IBM。
算法描述
一般来说,插入排序都采用in-place在数组上实现。具体算法描述如下:
- 从第一个元素开始,该元素可以认为已经被排序
- 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 如果该元素(已排序)大于新元素,将该元素移到下一位置
- 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
- 将新元素插入到该位置后
- 重复步骤2~5
如果比较操作的代价比交换操作大的话,可以采用二分查找法来减少比较操作的数目。该算法可以认为是插入排序的一个变种,称为二分查找插入排序。
范例程式码(C++)
[code lang=”cpp”]
#include <iostream>
using namespace std;
template<typename T>
void insertion_sort(T arr[], int len)
{
int i, j;
T tmp;
for (i = 1; i < len; i++) { tmp = arr[i]; for (j = i – 1; j >= 0 && tmp < arr[j]; j–)
{
arr[j + 1] = arr[j];
}
arr[j + 1] = tmp;
}
}
int main()
{
int a[10] = {3,4,2,2,3,4,21,1,3,4};
insertion_sort(a, 10);
for (int i = 0; i < 10; i++)
{
cout<<a[i]<<endl;
}
return 0;
}
[/code]
算法复杂度
如果目标是把n个元素的序列升序排列,那么采用插入排序存在最好情况和最坏情况。最好情况就是,序列已经是升序排列了,在这种情况下,需要进行的比较操作需(n-1)次即可。最坏情况就是,序列是降序排列,那么此时需要进行的比较共有n(n-1)/2次。插入排序的赋值操作是比较操作的次数加上(n-1)次。平均来说插入排序算法复杂度为O(n2)。因而,插入排序不适合对于数据量比较大的排序应用。但是,如果需要排序的数据量很小,例如,量级小于千,那么插入排序还是一个不错的选择。 插入排序在工业级库中也有着广泛的应用,在STL的sort算法和stdlib的qsort算法中,都将插入排序作为快速排序的补充,用于少量元素的排序(通常为8个或以下)。
总结
并归排序的时间复杂度为O(nlgn),而该算法(插入排序)的时间复杂度为O(n^2)。所以,到排序的个数较少时,插入排序是一个很好的选择,然而当n过大时,插入排序则无能为力,需要考虑使用并归排序。这个n大约在30左右(本人没有做过实验),并归的运算时间将小于插入的运算时间。
参考文章:https://zh.wikipedia.org/wiki/%E6%8F%92%E5%85%A5%E6%8E%92%E5%BA%8F