首页 > 代码库 > 经典算法问题 - 最大连续子数列和
经典算法问题 - 最大连续子数列和
文章来自:http://conw.net/archives/9/
(不是抄袭,那是我自己的博客,源地址查看代码有高亮)
最大连续子数列和一道很经典的算法问题,给定一个数列,其中可能有正数也可能有负数,我们的任务是找出其中连续的一个子数列(不允许空序列),使它们的和尽可能大。我们一起用多种方式,逐步优化解决这个问题。
为了更清晰的理解问题,首先我们先看一组数据:8
-2 6 -1 5 4 -7 2 3
第一行的8是说序列的长度是8,然后第二行有8个数字,即待计算的序列。
对于这个序列,我们的答案应该是14
,所选的数列是从第2个数到第5个数,这4个数的和是所有子数列中最大的。
最暴力的做法,复杂度O(N^3)
暴力求解也是容易理解的做法,简单来说,我们只要用两层循环枚举起点和终点,这样就尝试了所有的子序列,然后计算每个子序列的和,然后找到其中最大的即可,C语言代码如下:
#include <stdio.h>//N是数组长度,num是待计算的数组,放在全局区是因为可以开很大的数组int N, num[1024];int main(){ //输入数据 scanf("%d", &N); for(int i = 1; i <= N; i++) scanf("%d", &num[i]); int ans = num[1]; //ans保存最大子序列和,初始化为num[1]能保证最终结果正确 //i和j分别是枚举的子序列的起点和终点,k所在循环计算每个子序列的和 for(int i = 1; i <= N; i++) { for(int j = i; j <= N; j++) { int s = 0; for(int k = i; k <= j; k++) { s += num[k]; } if(s > ans) ans = s; } } printf("%d\n", ans); return 0;}
这个算法的时间复杂度是O(N^3),复杂度的计算方法可参考《算法导论》第一章,如果我们的计算机可以每秒计算一亿次的话,这个算法在一秒内只能计算出500左右长度序列的答案。
一个简单的优化
如果你读懂了刚才的程序,我们可以来看一个简单的优化。
如果我们有这样一个数组sum,sum[i]
表示第1个到第i个数的和。那么我们如何快速计算第i个到第j个这个序列的和?对,只要用sum[j] - sum[i-1]
就可以了!这样的话,我们就可以省掉最内层的循环,让我们的程序效率更高!C语言代码如下:
#include <stdio.h>//N是数组长度,num是待计算的数组,sum是数组前缀和,放在全局区是因为可以开很大的数组int N, num[16384], sum[16384];int main(){ //输入数据 scanf("%d", &N); for(int i = 1; i <= N; i++) scanf("%d", &num[i]); //计算数组前缀和 sum[0] = 0; for(int i = 1; i <= N; i++) { sum[i] = num[i] + sum[i - 1]; } int ans = num[1]; //ans保存最大子序列和,初始化为num[1]能保证最终结果正确 //i和j分别是枚举的子序列的起点和终点 for(int i = 1; i <= N; i++) { for(int j = i; j <= N; j++) { int s = sum[j] - sum[i - 1]; if(s > ans) ans = s; } } printf("%d\n", ans); return 0;}
这个算法的时间复杂度是O(N^2)。如果我们的计算机可以每秒计算一亿次的话,这个算法在一秒内能计算出10000左右长度序列的答案,比之前的程序已经有了很大的提升!此外,我们在这个程序中创建了一个sum数组,事实上,这也是不必要的,我们我就也可以把数组前缀和直接计算在num数组中,这样可以节约一些内存。
换个思路,继续优化
你应该听说过分治法,正是:分而治之。我们有一个很复杂的大问题,很难直接解决它,但是我们发现可以把问题划分成子问题,如果子问题规模还是太大,并且它还可以继续划分,那就继续划分下去。直到这些子问题的规模已经很容易解决了,那么就把所有的子问题都解决,最后把所有的子问题合并,我们就得到复杂大问题的答案了。可能说起来简单,但是仍不知道怎么做,接下来分析这个问题:
首先,我们可以把整个序列平均分成左右两部分,答案则会在以下三种情况中:
1、所求序列完全包含在左半部分的序列中。
2、所求序列完全包含在右半部分的序列中。
3、所求序列刚好横跨分割点,即左右序列各占一部分。
前两种情况和大问题一样,只是规模小了些,如果三个子问题都能解决,那么答案就是三个结果的最大值。我们主要研究一下第三种情况如何解决:
我们只要计算出:以分割点为起点向左的最大连续序列和、以分割点为起点向右的最大连续序列和,这两个结果的和就是第三种情况的答案。因为已知起点,所以这两个结果都能在O(N)的时间复杂度能算出来。
递归不断减小问题的规模,直到序列长度为1的时候,那答案就是序列中那个数字。
综上所述,C语言代码如下,递归实现:
#include <stdio.h>//N是数组长度,num是待计算的数组,放在全局区是因为可以开很大的数组int N, num[16777216];int solve(int left, int right){ //序列长度为1时 if(left == right) return num[left]; //划分为两个规模更小的问题 int mid = left + right >> 1; int lans = solve(left, mid); int rans = solve(mid + 1, right); //横跨分割点的情况 int sum = 0, lmax = num[mid], rmax = num[mid + 1]; for(int i = mid; i >= left; i--) { sum += num[i]; if(sum > lmax) lmax = sum; } sum = 0; for(int i = mid + 1; i <= right; i++) { sum += num[i]; if(sum > rmax) rmax = sum; } //答案是三种情况的最大值 int ans = lmax + rmax; if(lans > ans) ans = lans; if(rans > ans) ans = rans; return ans;}int main(){ //输入数据 scanf("%d", &N); for(int i = 1; i <= N; i