首页 > 代码库 > python实现希尔排序(已编程实现)

python实现希尔排序(已编程实现)

 

希尔排序:

观察一下”插入排序“:其实不难发现她有个缺点:

  如果当数据是”5, 4, 3, 2, 1“的时候,此时我们将“无序块”中的记录插入到“有序块”时,估计俺们要崩盘,

每次插入都要移动位置,此时插入排序的效率可想而知。

   

  shell根据这个弱点进行了算法改进,融入了一种叫做“缩小增量排序法”的思想,其实也蛮简单的,不过有点注意的就是:

增量不是乱取,而是有规律可循的。

技术分享

 

希尔排序时效分析很难,关键码的比较次数与记录移动次数依赖于增量因子序列d的选取,特定情况下可以准确估算出关键码的比较次数和记录的移动次数。目前还没有人给出选取最好的增量因子序列的方法。增量因子序列可以有各种取法,有取奇数的,也有取质数的,但需要注意:增量因子中除1 外没有公因子,且最后一个增量因子必须为1。希尔排序方法是一个不稳定的排序方法。

 

首先要明确一下增量的取法(这里图片是copy别人博客的,增量是奇数,我下面的编程用的是偶数):

      第一次增量的取法为: d=count/2;

      第二次增量的取法为:  d=(count/2)/2;

      最后一直到: d=1;

 

好,注意看图了,第一趟的增量d1=5, 将10个待排记录分为5个子序列,分别进行直接插入排序,结果为(13, 27, 49, 55, 04, 49, 38, 65, 97, 76)

第二趟的增量d2=3, 将10个待排记录分为3个子序列,分别进行直接插入排序,结果为(13, 04, 49, 38, 27, 49, 55, 65, 97, 76)

第三趟的增量d3=1, 对整个序列进行直接插入排序,最后结果为(04, 13, 27, 38, 49, 49, 55, 65, 76, 97)

 

重点来了。当增量减小到1时,此时序列已基本有序,希尔排序的最后一趟就是接近最好情况的直接插入排序。可将前面各趟的"宏观"调整看成是最后一趟的预处理,比只做一次直接插入排序效率更高。

 

本人是学python的,今天用python实现了希尔排序。

 1 def ShellInsetSort(array, len_array, dk):  # 直接插入排序
 2     for i in range(dk, len_array):  # 从下标为dk的数进行插入排序
 3         position = i
 4         current_val = array[position]  # 要插入的数
 5 
 6         index = i
 7         j = int(index / dk)  # index与dk的商
 8         index = index - j * dk
 9 
10         # while True:  # 找到第一个的下标,在增量为dk中,第一个的下标index必然 0<=index<dk
11         #     index = index - dk
12         #     if 0<=index and index <dk:
13         #         break
14 
15 
16         # position>index,要插入的数的下标必须得大于第一个下标
17         while position > index and current_val < array[position-dk]:
18             array[position] = array[position-dk]  # 往后移动
19             position = position-dk
20         else:
21             array[position] = current_val
22 
23 
24 
25 def ShellSort(array, len_array):  # 希尔排序
26     dk = int(len_array/2)  # 增量
27     while(dk >= 1):
28         ShellInsetSort(array, len_array, dk)
29         print(">>:",array)
30         dk = int(dk/2)
31 
32 if __name__ == "__main__":
33     array = [49, 38, 65, 97, 76, 13, 27, 49, 55, 4]
34     print(">:", array)
35     ShellSort(array, len(array))

输出:

>: [49, 38, 65, 97, 76, 13, 27, 49, 55, 4]
>>: [13, 27, 49, 55, 4, 49, 38, 65, 97, 76]
>>: [4, 27, 13, 49, 38, 55, 49, 65, 97, 76]
>>: [4, 13, 27, 38, 49, 49, 55, 65, 76, 97]

首先你得先会插入排序,不会你必然看不懂。

技术分享

 

插入排序,即是对上图三个黄色框中的数进行插入排序。举个例子:13,55,38,76

直接看55,55<13, 不用移动。接着看38,38<55,那么55后移,数据变为[13,55,55,76],接着比较13<38, 那么38替换55,变成[13,38,55,76]。其它同理,略。

这里有个问题,比如第二个黄色框[27,4,65],4<27, 那27往后移,接着4就替换第一个,数据变成[4,27,65],但是计算机怎么知道4就是在第一个啊??

我的做法是,先找出[27,4,65]第一个数的下标,在这个例子中27的下标为1。当要插入的数的下标大于第一个下标1时,才可以往后移,前一个数不可以往后移有两种情况,一种是前面有数据,且小于要插入的数,那你只能插在它后面。另一种,很重要,当要插入数比前面所有数都小时,那插入数肯定是放在第一个,此时要插入数的下标=第一个数的下标。(这段话,感觉初学者应该不大懂……)

 

为了找到第一个数的下标,最开始想的是用循环,一直到最前面:

        while True:  # 找到第一个的下标,在增量为dk中,第一个的下标index必然 0<=index<dk
            index = index - dk
            if 0<=index and index <dk:
                break

在Debug时,发现用循环太浪费时间了,特别是当增量d=1时,直接插入排序为了插入列表最后一个数,得循环减1,直到第一个数的下标,后来我学聪明了,用下面的方法:

        j = int(index / dk)  # index与dk的商
        index = index - j * dk

时间复杂度:

希尔排序的时间复杂度是所取增量序列的函数,尚难准确分析。有文献指出,当增量序列为d[k]=2^(t-k+1)时,希尔排序的时间复杂度为O(n^1.5), 其中t为排序趟数。

稳定性: 不稳定

 

希尔排序效果:

技术分享

 

 

参考资料: 编程是我自己实现的。建议Debug看看运行过程
http://blog.csdn.net/hguisu/article/details/7776068#t2

http://www.blogjava.net/todayx-org/archive/2012/01/08/368091.html

http://www.cnblogs.com/huangxincheng/archive/2011/11/20/2255695.html

python实现希尔排序(已编程实现)