首页 > 代码库 > 桶排序

桶排序

http://blog.csdn.net/houapple/article/details/6480100

桶排序 (Bucket sort)或所谓的箱排序,是一个排序算法,工作的原理是将阵列分到有限数量的桶子里。每个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。桶排序是鸽巢排序的一种归纳结果。当要被排序的阵列内的数值是均匀分配的时候,桶排序使用线性时间(Θ(n))。但桶排序并不是 比较排序,他不受到 O(n log n) 下限的影响。
      例如要对大小为[1..1000]范围内的n个整数A[1..n]排序,可以把桶设为大小为10的范围,具体而言,设集合B[1]存储[1..10]的整数,集合B[2]存储(10..20]的整数,……集合B[i]存储((i-1)*10, i*10]的整数,i = 1,2,..100。总共有100个桶。然后对A[1..n]从头到尾扫描一遍,把每个A[i]放入对应的桶B[j]中。 然后再对这100个桶中每个桶里的数字排序,这时可用冒泡,选择,乃至快排,一般来说任何排序法都可以。最后依次输出每个桶里面的数字,且每个桶中的数字从小到大输出,这样就得到所有数字排好序的一个序列了。   
      假设有n个数字,有m个桶,如果数字是平均分布的,则每个桶里面平均有n/m个数字。如果对每个桶中的数字采用快速排序,那么整个算法的复杂度是O(n+m*n/m*log(n/m))=O(n+nlogn-nlogm)  
      从上式看出,当m接近n的时候,桶排序复杂度接近O(n)   
      当然,以上复杂度的计算是基于输入的n个数字是平均分布这个假设的。这个假设是很强的,实际应用中效果并没有这么好。如果所有的数字都落在同一个桶中,那就退化成一般的排序了。

 

  • #include <stdio.h>   
  • #include <stdlib.h>   
  • #include <string.h>   
  •   
  • extern void quick_sort(int a[], int p, int q);/* not necessary */  
  •   
  • struct barrel {   
  •     int node[10];   
  •     int count;/* the num of node */  
  • };   
  •   
  • void bucket_sort(int data[], int size)   
  • {   
  •     int max, min, num, pos;   
  •     int i, j, k;   
  •     struct barrel *pBarrel;   
  •   
  •     max = min = data[0];   
  •     for (i = 1; i < size; i++) {   
  •         if (data[i] > max) {   
  •             max = data[i];   
  •         } else if (data[i] < min) {   
  •             min = data[i];   
  •         }   
  •     }   
  •     num = (max - min + 1) / 10 + 1;   
  •     pBarrel = (struct barrel*)malloc(sizeof(struct barrel) * num);   
  •     memset(pBarrel, 0, sizeof(struct barrel) * num);   
  •   
  •     /* put data[i] into barrel which it belong to */  
  •     for (i = 0; i < size; i++) {   
  •         k = (data[i] - min + 1) / 10;/* calculate the index of data[i] in barrel */  
  •         (pBarrel + k)->node[(pBarrel + k)->count] = data[i];   
  •         (pBarrel + k)->count++;   
  •     }   
  •        
  •     pos = 0;   
  •     for (i = 0; i < num; i++) {   
  •         quick_sort((pBarrel+i)->node, 0, (pBarrel+i)->count);/* sort node in every barrel */  
  •   
  •         for (j = 0; j < (pBarrel+i)->count; j++) {   
  •             data[pos++] = (pBarrel+i)->node[j];   
  •         }   
  •     }   
  •     free(pBarrel);   
  • }   
  •   
  • main()   
  • {   
  •     int data[] = {78, 17, 39, 26, 72, 94, 21, 12, 23, 91}, i;   
  •     int size = sizeof(data) / sizeof(int);   
  •     bucket_sort(data, size);   
  •   
  •     for (i = 0; i < size; i++)   
  •         printf("%d ", data[i]);   
  • }  

题目:有无序的实数列V[N],要求求里面大小相邻的实数的差的最大值,关键是要求线性空间和线性时间

用基于桶排序的方式。
注意到,最后只需要求间隔的最大值,所以任何间隔小于bar= (max - min)/(N-1) 的值都可以不计。
这样,首先求随机数组中的max , min 这些都是线性时间的

然后,分配从[min, max]间分配(N-1)个桶,每个桶是一个有序实数对,(a,b)
将所有数往桶里塞,把欲塞进去的数记为x,如果桶里本身没有数,那么a=b=x
如果x>b,那么b=x,如果x <a那么a=x,反正就是说这个桶里的(a,b)表示进入该桶中的数的范围。此操作是线性的。

然后按顺序对每个相邻桶(跳过没有数的桶)进行比较。例如,相邻桶(a,b), (c,d)的距离D = 就是c - b
最终就是,比较的D的最大值。这时间也是线性的。空间也是线性的。

可能的问题:为什么我不必计算(b-a)或者(d-c)呢?很显然,b-a和d-c都是 <=bar的,最大相邻间隔肯定是大于bar的。