首页 > 代码库 > 利用堆实现堆排序&优先队列
利用堆实现堆排序&优先队列
数据结构之(二叉)堆 一文末尾提到“利用堆可以实现:堆排序、优先队列”。本文代码实现之。
1、堆排序
假设要将无序数组按非递减(递增)排序,则应使用大(小)顶堆。这里涉及到大堆排序涉及到三种操作:(1)、MaxHeapify操作(自顶向下即SiftDown操作);(2)、BuildMaxHeap操作(线性时间内将无序数组构造成一个最大堆);(3)将堆顶元素和堆的最后一个元素交换,并将堆元素大小减去1,对堆顶元素调用MaxHeapify操作重新调整为大顶堆,重复直到数组有序。下面是详细的实现代码:
//已知L[i,...,n)除L[i]之外均满足大顶堆的定义,本函数向下调整L[i] //使得在具有n个结点的堆中,以i为下标的根结点的子树重新遵循最大堆的性质 //n为结点总数,从0开始计算,i结点的子结点为 2*i+1, 2*i+2 void MaxHeapify(int L[], int i, int n) { int j, tmp; j = 2 * i + 1; //父结点i的左孩子结点 tmp = L[i]; while (j < n) { if (j + 1 < n && L[j + 1] > L[j])//找左右孩子中最大的 j++; if (L[j] <= tmp) // 父结点tmp=L[i]比孩子结点L[j]大 break; L[i] = L[j]; //把较大的子结点往上移动,替换它的父结点 i = j; j = 2 * i + 1; } L[i] = tmp; }
//子数组L[n/2+1,..,n)中的元素都是树的叶子结点,每个叶结点都可以看成只包含一个元素的堆。 //该函数对树中的其余结点都调用一次MaxHeapify() void BuildMaxHeap(int L[], int n) { for (int i = n / 2 - 1; i >= 0; i--) //注意是从最后一个结点(n-1)的父结点((n-1)-1)/2 = (n-2)/2 = n/2-1 开始 MaxHeapify(L, i, n); }
void MaxHeapSort(int L[], int n) { BuildMaxHeap(L, n); //先建立大顶堆 for (int i = n - 1 ; i > 0; i--) //从最后一个元素起 { //L[0]永远是大顶堆堆L[0,i]的堆顶元素,最大值 std::swap(L[0], L[i]); //将L[0]和最末尾元素交换后:最大的元素现在位于数组末尾,堆的结点个数减一 //但L[0..i)因为修改了L[0]可能会破坏堆的性质,因此需要调整L[0,...,i)使之依然满足最大堆: //已知L[0,...,i)除L[0]之外均满足大顶堆的定义,本函数向下调整L[0] //使得在具有i个结点的堆中,以0为下标的根结点的子树重新遵循最大堆的性质 MaxHeapify(L, 0, i); } }
测试代码:
void heap_sort_test() { const int MAXSIZE = 10; int L[MAXSIZE] = {49,38,49,97,76,13,27,49, 40, 2}; cout << "\n排序前:"; Print(L, MAXSIZE); MaxHeapSort(L, MAXSIZE); cout << "排序后:"; Print(L, MAXSIZE); }
2、优先队列
利用大(小)顶堆可以分别实现最大(小)优先队列。涉及到的基本操作有:(1)maximum(minimum)操作,获取具有最大(小)键值的元素;(2)ExtractMax(ExtractMin)操作,获取最大(小)键值的元素后将其从优先队列中删除;(3)InCreaseKey(DeCreaseKey)操作,将元素x的关键字增加(减少)到k,这里假设k的值不小于(不大于)x的原关键值;此外还有插入、删除操作,其中大部分操作都借助于堆的SiftDown&SiftUp操作实现。
具体代码如下:
(1)最大优先队列
#pragma once #include "maxHeap.h" template<class T> class MaxPriQueue : public MaxHeap<T> { public: MaxPriQueue(const int nmax = 20) : MaxHeap(nmax) {} ~MaxPriQueue(){} T maximum() const; //返回具有最大键值的元素 T ExtractMax(); //去掉并返回最大键值的元素 void InCreaseKey(const T &x, const T &k); //将元素x的关键字增加到k,这里假设k的值不小于x的原关键值 virtual void Insert(const T &key);//算法导论第三版p92的方法;也可以调用继承来的Insert方法 }; template<class T> T MaxPriQueue<T>::maximum()const { if (size > 0) return arr[0]; return T(0); } template<class T> T MaxPriQueue<T>::ExtractMax() { if (size < 0) return T(0); T max = arr[0]; arr[0] = arr[--size];//最末尾的值补上去,同时size减1 SiftDown(0); //向下调整 return max; } template<class T> void MaxPriQueue<T>::InCreaseKey(const T &x, const T &k) { if (k < x) //假设k的值不小于x的原关键值 return; int pos = Search(x); if (pos == -1) return; arr[pos] = k; SiftUp(pos); //向上调整 } template<class T> void MaxPriQueue<T>::Insert(const T &key) { arr[size++] = -INFINITY; //首先增加一个-∞的叶结点 InCreaseKey(-INFINITY, key); //将该叶结点的值增大至key }
(2)最小优先队列
#pragma once #include "minHeap.h" template<class T> class MinPriQueue : public MinHeap<T> { public: MinPriQueue(const int nmax = 20) : MinHeap(nmax) {} ~MinPriQueue(){} T minimum() const; //返回具有最小键值的元素 T ExtractMin(); //去掉并返回最小键值的元素 void DeCreaseKey(const T &x, const T &k); //将元素x的关键字减少到k,这里假设k的值不大于x的原关键值 virtual void Insert(const T &key);//算法导论第三版p92的方法;也可以调用继承来的Insert方法 }; template<class T> T MinPriQueue<T>::minimum()const { if (size > 0) return arr[0]; return T(0); } template<class T> T MinPriQueue<T>::ExtractMin() { if (size < 0) return T(0); T min = arr[0]; arr[0] = arr[--size];//最末尾的值补上去,同时size减1 SiftDown(0); //向下调整 return min; } template<class T> void MinPriQueue<T>::DeCreaseKey(const T &x, const T &k) { if (k >= x) //假设k的值不大于x的原关键值 return; int pos = Search(x); if (pos == -1) return; arr[pos] = k; SiftUp(pos); //向上调整 } template<class T> void MinPriQueue<T>::Insert(const T &key) { arr[size++] = INFINITY; //首先增加一个∞的叶结点 DeCreaseKey(INFINITY, key); //将该叶结点的值减少至key }
void priqueue_test() { int a[12] = {15, 13, 9, 5, 12, 8, 7, 4, 0, 6, 2, 1}; cout << "原始数组元素: "; for (int i = 0; i < 12; i++) cout << a[i] << " "; cout << endl; MaxPriQueue<int> maxpriqueue(20); MinPriQueue<int> minpriqueue(20); for (int i = 0; i < 12; i++) maxpriqueue.Insert(a[i]); //向上调整 cout << "\n最大优先队列元素为: "; maxpriqueue.Print(); cout << "max = " << maxpriqueue.maximum() << endl; cout << "删掉最大元素 " << maxpriqueue.ExtractMax() << "后 :" ; maxpriqueue.Print(); cout << "将元素 12 增加到 23 后:"; maxpriqueue.InCreaseKey(12, 23);maxpriqueue.Print(); cout << "删掉元素4后: "; maxpriqueue.Delete(4); maxpriqueue.Print(); for (int i = 0; i < 12; i++) minpriqueue.Insert(a[i]); //向上调整 cout << "\n最小优先队列元素为: "; minpriqueue.Print(); cout << "min = " << minpriqueue.minimum() << endl; cout << "删掉最小元素 " << minpriqueue.ExtractMin() << "后 :" ; minpriqueue.Print(); cout << "将元素 12 减小到 3 后:"; minpriqueue.DeCreaseKey(12, 23);minpriqueue.Print(); cout << "删掉元素4后: "; minpriqueue.Delete(4); maxpriqueue.Print(); }运行示例截图:
3、STL中的heap
STL中与堆相关的4个函数主要是:(1)建立堆make_heap();(2)在堆中添加数据push_heap();(3)在堆中删除数据pop_heap();以及(4)堆排序sort_heap():
头文件 #include <algorithm>
下面的_First与_Last为可以随机访问的迭代器(指针),_Comp为比较函数(仿函数),其规则——如果函数的第一个参数小于第二个参数应返回true,否则返回false。
(1)建立堆
make_heap(_First, _Last, _Comp)
默认是建立最大堆的(less<T>())。对int类型,可以在第三个参数传入greater<int>()得到最小堆,最小堆的时候的push_heap()、pop_heap()、sort_heap()均要显示地将greater<int>()作为第三个参数传入。
(2)在堆中添加数据
push_heap (_First, _Last)
要先在容器中加入数据;再调用push_heap (),使包括新添加的元素在内的整个容器数组成为大顶堆
(3)在堆中删除数据
pop_heap(_First, _Last)
要先调用pop_heap():将堆顶元素和堆的最末尾元素交换,堆大小减去1,并向下调整堆顶元素使得新的堆满足最大堆的性质;再在容器中删除数据
(4)堆排序
sort_heap(_First, _Last)
排序之后就不再是一个合法的heap了。
下面是STL中heap使用的一个示例:
#include <iostream> #include <vector> #include <algorithm> #include <functional> //for function object like greater<int>() #include <ctime> using namespace std; void print(vector<int> &vet) { for (vector<int>::const_iterator iter = vet.begin(); iter != vet.end(); iter++) cout << *iter << " "; cout << endl; } int main() { const int MAXN = 10; int a[MAXN]; srand((unsigned)time(0)); for (int i = 0; i < MAXN; ++i) a[i] = rand() % (MAXN * 2); //动态申请vector,并对vector建堆 vector<int> *pvet = new vector<int>(20); pvet->assign(a, a + MAXN); cout << "\n无序数组:\t\t";print(*pvet); //默认建大顶堆 make_heap(pvet->begin(), pvet->end()); cout << "大顶堆:\t\t\t";print(*pvet); //添加数据 pvet->push_back(25); //先在容器中加入 cout << "\n容器push_back(25)后:\t";print(*pvet); push_heap(pvet->begin(), pvet->end()); //再调用push_heap() cout << "堆push_heap()操作后:\t";print(*pvet); //删除数据 pop_heap(pvet->begin(), pvet->end()); // 先调用pop_heap() cout << "\n堆pop_heap()操作后:\t";print(*pvet); pvet->pop_back(); //再在容器中删除 cout << "容器pop_back()后:\t";print(*pvet); pop_heap(pvet->begin(), pvet->end()); cout << "\n堆pop_heap()操作后:\t";print(*pvet); pvet->pop_back(); cout << "容器pop_back()后:\t";print(*pvet); //堆排序 sort_heap(pvet->begin(), pvet->end()); cout << "\n堆排序结果:\t\t";print(*pvet); delete pvet; return 0; }
示例运行截图:
4、利用堆解决top_k
编写算法,从10亿个浮点数当中,选出其中最大的10000个。
//典型的Top K问题,用堆是最典型的思路。 //建10000个数的小顶堆,然后将10亿个数依次读取,大于堆顶,则替换堆顶,做一次堆调整。 //结束之后,小顶堆中存放的数即为所求。代码如下(为了方便,这里直接使用了STL容器): void top_k() { const int nmax = 1000000000; //10亿个数 vector<float>bigs(10000, 0); //init vector array srand((unsigned)time(0)); for (vector<float>::iterator iter = bigs.begin(); iter != bigs.end(); iter++) *iter = (float)rand() / 7; //random values; cout << bigs.size() << endl; make_heap(bigs.begin(), bigs.end(), greater<float>());//little heap, the first one is the smallest one! float f; for (int i = 0; i < nmax; i++) { srand((unsigned)time(0)); f = (float)rand() / 7; if (f > bigs.front())//replace the first element? { //set the smallest one to the end! pop_heap(bigs.begin(), bigs.end(), greater<float>()); //remove the smallest one bigs.pop_back(); //add to the last one bigs.push_back(f); //make the heap again, the first element is still the smallest one push_heap(bigs.begin(), bigs.end(), greater<float>()); } } //sort by ascent sort_heap(bigs.begin(), bigs.end(), greater<float>()); //for (int i = 0; i < 10; i++) // cout << bigs[i] << " "; //cout << endl; }
参考文献:数据结构p279-283、算法导论第三版p89-92、编程珠玑p145-150
STL系列之四 heap 堆
ps:(1)优先级队列提供了一种向量排序算法(编程珠玑p148):首先在优先级队列中依次插入每个元素,然后按序删除它们,但这回需要额外的空间。
(2)优先级队列中的继承类的代码可以在 数据结构之(二叉)堆 一文中查看。
(白天本来都发布了的,下午修改完发布的时候,出现什么“无效的主机名”错误,打开其他的博文都是出现这个错误,换台电脑后还是。下午饭毕回来后发现可以访问博文了但发现这个文章不见了,尼玛呀我没有误删啊,垃圾箱草稿箱都没有,害的浪费那么多时间白写了
现在趁思路清晰赶紧补上~~)