排序算法研究之希尔排序(shell sort)
前面几个小节,我们分别介绍了,, ,本节,我们介绍插入排序的改进版的希尔排序。
希尔排序是1959年,Shell发明的,这是第一个突破O(n2)的排序算法,他与直接插入排序不同的是,他会优先比较距离较近的元素。因此,希尔排序又叫做缩小增量排序。
1、算法思想
其工作原理是定义一个间隔序列来表示排序过程中进行比较的元素之间有多远的间隔,每次将具有相同间隔的数分为一组,进行插入排序,大部分场景中,间隔是可以提前定义好的,也可以动态生成。
希尔排序的实质就是分组的插入排序
2、优缺点
优点: 空间复杂度较好,O(1);作为改进版的插入排序,是一种相对高效的基于交换元素的排序方法。 缺点: (i) 不稳定,在交换的过程中,会改变元素的相对次序。 (ii) 希尔排序的时间复杂度依赖于增量序列函数,所以分析起来比较困难,当n在某个特定范围的时候,希尔排序的时间复杂都约为O(n1.3)
3、关键点
确定增量划分序列组,在不同的组中进行直接插入排序。实际上每次都是在间隔为gap的距离中进行比较(根据下图来理解)
4、图例演示过程
最原始的那种增量,即从 gap=length/2 逐步减半,其实这还不算最快的希尔,有几个增量在实践中表现更出色,希尔排序是实现简单但是分析极其困难的一个算法的例子。 说了这么多理论性的文字,可能不太好理解,所以用图示来帮助大家更好的理解希尔排序和直接插入排序的关系。
给定一个数组 [55,2,6,4,32,12,9,73,26,37] 对其进行希尔排序的操作过程如下图所示:
5、程序代码c++
/*************************************************************************** * @file Shell_sort.cpp * @author Shawn * @date 7 Jan 2019 * @remark 7 Jan 2019 * @theme Shell Sort ***************************************************************************/ # include<iostream> using namespace std; void shellsort(int[], int); int main() { int array [] = { 55,2,6,4,32,12,9,73,26,37}; int len = sizeof(array) / sizeof(int); cout<<"输入的原始序列: "; for(int i=0; i<len; i++) // 输出原序列 cout<<array[i]<<","; cout<<endl<<endl; cout<<" ----希尔排序开始---- " << endl; shellsort(array,len); // 调用排序函数 return 0; } void shellsort(int a[], int size) { int i, j, gap; for (gap = size / 2; gap > 0; gap /= 2) // 每次的增量,递减趋势 { for (i = gap; i < size; i++) //每次增量下,进行几组插入排序,如第一步就是(从12,9,73,26,37)5次 for (j = i ; j -gap >= 0 && a[j-gap] > a[j]; j -= gap)// 每个元素组中进行直接插入排序,看例子 swap(a[j-gap], a[j]); //如果增量为2时他的插入查询操作下标为: //(2-0,3-1/ 4-2-0,5-3-1/ 6-4-2-0,7-5-3-1/ 8-6-4-2-0,9-7-5-3-1) for(int k=0; k<size; k++) // 输出每轮排序结果 cout<<a[k]<<","; cout<<endl; } }
后记思考:
为什么希尔能突破O(n2)的界,可以用逆序数来理解,假设我们要从小到大排序,一个数组中取两个元素如果前面比后面大,则为一个逆序,容易看出排序的本质就是消除逆序数,可以证明对于随机数组,逆序数是O(n2)的,而如果采用“交换相邻元素”的办法来消除逆序,每次正好只消除一个,因此必须执行O(n2)的交换次数,这就是为什么冒泡、插入等算法只能到平方级别的原因,反过来,基于交换元素的排序要想突破这个下界,必须执行一些比较,交换相隔比较远的元素,使得一次交换能消除多个逆序,希尔、快排、堆排等等算法都是交换比较远的元素,只不过规则各不同罢了。 本段部分内容参考知乎冒泡的回答: