【排序算法】希尔排序算法原理

希尔排序(递减增量排序)

    • 希尔排序是基于插入排序的以下两点性质而提出改进方法的:
    • 原理
    • 算法描述
    • 伪代码
    • 代码
      • Donald Shell增量
      • 其他增量
    • 希尔排序是不稳定的排序算法。
    • 复杂度

【排序算法】希尔排序算法原理

希尔排序是基于插入排序的以下两点性质而提出改进方法的:

  插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率

  但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位

  希尔排序通过将比较的全部元素分为几个区域来提升插入排序的性能

  可以让一个元素可以一次性地朝最终位置前进一大步。

  然后算法再取越来越小的步长进行排序,算法的最后一步就是普通的插入排序,但是到了这步,需排序的数据几乎是已排好的了(此时插入排序较快)。

原理

  希尔排序是将待排序的数组元素 按下标的一定增量分组 ,分成多个子序列,然后对各个子序列进行直接插入排序算法排序;

  然后依次缩减增量再进行排序,直到增量为1时,进行最后一次直接插入排序,排序结束。

算法描述


  1.先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

  2.选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;

  3.按增量序列个数k,对序列进行 k 趟排序;

  4.每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。

注意:"tk间隔"排序后的有序的序列,在执行"tk+1间隔"排序后,"Dk间隔"排序后的结果依然是有序的

  5.仅当增量因子为1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

伪代码

代码

Donald Shell增量

  增量元素不互质,则小增量可能根本不起作用

void shellSort(int [] arr){ 
	int temp; 
	for (int delta = arr.length/2;delta>=1;delta/=2){ //对每个增量进行一次排序
		for (int i=delta; i`<arr.length; i++){
			for (int j=i;j>=delta && arr[j]<arr[j-delta]; j-=delta){
			// 注意每个地方增量和差值都是delta
				temp=arr[j-delta];
				arr[j-delta]=arr[j];
				arr[j]=temp;
			}
		} //loop i
 	} //loop delta 
 }

其他增量

void ShellSort( ElementType A[], int N )
{ /* 希尔排序 - 用Sedgewick增量序列 */
     int Si, D, P, i;
     ElementType Tmp;
     /* 这里只列出一小部分增量 */
     int Sedgewick[] = {929, 505, 209, 109, 41, 19, 5, 1, 0};
      
     for ( Si=0; Sedgewick[Si]>=N; Si++ ) 
         ; /* 初始的增量Sedgewick[Si]不能超过待排序列长度 */
 
     for ( D=Sedgewick[Si]; D>0; D=Sedgewick[++Si] )
         for ( P=D; P<N; P++ ) { /* 插入排序*/
             Tmp = A[P];
             for ( i=P; i>=D && A[i-D]>Tmp; i-=D )
                 A[i] = A[i-D];
             A[i] = Tmp;
         }
}

希尔排序是不稳定的排序算法。

  虽然一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱。

复杂度

  最差时间复杂度 ---- 根据步长序列的不同而不同。已知最好的为O(n(logn)^2)

  最优时间复杂度 ---- O(n)

版权声明:如无特殊标注,文章均来自网络,本站编辑整理,转载时请以链接形式注明文章出处,请自行分辨。

本文链接:https://www.shbk5.com/dnsj/72675.html