首页 > 代码库 > 归并排序:二路归并

归并排序:二路归并

归并排序(Merge Sort)是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个有序的子序列,再把有序的子序列合并为整体有序序列。

归并排序的具体做法:

  1. 把原序列不断地递等分,直至每等份只有一个元素,此时每等份都是有序的。
  2. 相邻等份合,不断合并,直至合并完全。

二路归并

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。归并排序最常用的是二路归并,即把两个小的有序的序列和并成一个大的有序序列:合二为一。

一个二路归并的流程图是这样的:

多路归并无非是多个有序的小序列合并成一个大的有序序列,道理和二路归并一样。

先来看下如何把两个有序的序列合并成一个大的有序序列,代码如下:

/*
 *把有序序列a和b,合并成c 
 *该算法成立前提: a和b已经有序  
 */ 
void merge(int a[], int na, int b[], int nb, int c[])
{
	if(a && b && c && na >0 && nb >0)
	{
		int i,j,k;
		i = j = k = 0;
		//不断地比较a和b的头部元素,较小的存入c 
		while(i < na && j < nb)
		{
			if(a[i] <= b[j]) // <= 保持算法的稳定性
				c[k++] = a[i++];
			else
				c[k++] = b[j++];
			/*另一种更有效的做法是这样的 
			while(i < na && a[i] <= b[j])
				c[k++] = a[i++];
			while(j < nb && b[j] < a[i])
				c[k++] = b[j++];
			*/
		}
		//把a或b中剩余的元素直接存入c 
		/*  也可以这样:
	     *  memcpy(c+k, a+i, (na-i)sizeof(int));
	     * 下同
	     */
		while(i < na)
			c[k++] = a[i++];
		while(j < nb)
			c[k++] = b[j++];
	}
}

可以看出,二路归并的时间复杂度是O(n),n是原序列的数据规模。以上代码是归并排序的基础,弄懂了它,就很好写归并排序了,看下归并排序的流程图:


可以看出,上半部分不断地递归深入:不断地均分原序列,直到每一部分只含有一个元素。下半部分,开始递归返回,通过反复调用二路归并算法,把相邻的有序子序列合并成一个规模更大的序列。

理解了这些,相信就很容易写出归并排序的代码了:

//把[first, mid]和[mid+1, last]范围内的数据合并  
void mergeArray(int a[], int b[], int first, int mid, int last)
{
	int i, j, k;
	i = first, j = mid + 1, k = 0;
	while (i <= mid && j <= last)
	{
		while(i <= mid && a[i] <= a[j])
			b[k++] = a[i++];
		while(j <= last && a[j] < a[i])
			b[k++] = a[j++];	
	}
	/*  也可以这样:
	 *  memcpy(b+k, a+i, (mid-i+1)sizeof(int));
	 * 下同
	 */
	while (i <= mid)
		b[k++] = a[i++];
	while (j <= last)
		b[k++] = a[j++];
	//[first,last]范围内的数据已有序,则写回原数组
	for (i = 0; i < k; i++)
		a[first + i] = b[i];
}
void mergesort(int a[], int b[], int first, int last)
{
	if (first < last)
	{
		int mid = first + ((last - first) >> 1);
		mergesort(a, b, first, mid);
		mergesort(a, b, mid + 1, last);
		mergeArray(a, b, first, mid, last);
	}
}
void MergeSort(int a[], int n)
{
	if (a && n > 1)
	{
		int *b = new int[n];  //构建辅助数组
		mergesort(a, b, 0, n - 1);
		delete[]b;
	}
}


在排序过程中,我们使用了一个相同大小的临时辅助数组。

算法分析:

1.算法的复杂度

对数组长度为n的序列进行归并排序,则大约要进行logn次归并,每一次合并都是线性时间O(n)。故粗略的计算出归并排序的时间复杂度是O(nlogn)(最好、最差都是这样)。空间复杂度是O(n)。详细的时间复杂度分析是这样的:

对长度为n的序列归并排序,需要递归的对长度为n/2的子序列进行归并排序,最后把两段子序列二路归并。递推关系是这样的:T(n)=2T(n/2)+O(n),显然T(1)=O(1),解得T(n)=o(nlogn)。

2.稳定性

归并排序是稳定的,并且是时间复杂度为o(nlogn)的几种排序(快速排序、堆排序)中唯一稳定的排序算法。

3.存储结构

顺序存储和链式存储都行。

另外,归并排序多用于外排序中。


转载请注明出处,本文地址:http://blog.csdn.net/zhangxiangdavaid/article/details/34463409

若是有所帮助,顶一个哦!

专栏目录:数据结构与算法目录