首页 > 代码库 > LIS小结(O(∩_∩)O~哄哄)
LIS小结(O(∩_∩)O~哄哄)
~\(≧▽≦)/~啦啦啦,昨天说的是LCS,今天我们要学习的是LIS,什么是LIS呢?
LIS: 最长有序子序列(递增/递减/非递增/非递减)这么说还是有些模糊,举个例子:
在一个无序的序列a1,a2,.....,am里,找到一个最长的序列,满足ai<=aj...<=ak; 且i<j<k;
例如该无序子序列为a[1]=1,a[2]=4,a[3]=5,a[4]=2;则最长序列为1,4,5.
小盆友们是不是明白了什么是最长有序子序列了呢?下面我们说说怎么求最长有序子序列:
先来说说经典的求法吧:
设a[i]表示序列中的第i个数,f[i]表示从1到i这一段中以i结尾的最长上升子序列的长度,初始时设f[i] = 0(i = 1, 2, ..., len(A))。则有动态规划方程:f[i] = max{1, f[j] + 1} (j = 1, 2, ..., i - 1, 且a[j] < a[i])。
现在,我们仔细考虑计算f[i]时的情况。假设有两个元素a[x]和a[y],满足
(1)y < x < i
(2)a[x] <a[y] < a[i]
(3)f[x] = f[y]
此时,选择f[x]和选择f[y]都可以得到同样的f[i]值,那么,在最长上升子序列的这个位置中,应该选择a[x]还是应该选择a[y]呢?
很明显,选择a[x]比选择a[y]要好。因为由于条件a[x] < a[y] < a[i],在a[x+1] ~a[i-1]这一段中,如果存在a[z],a[x] < a[z] < a[y],则与选择a[y]相比,将会得到更长的上升子序列。
再根据条件f[x] = f[y],我们会得到一个启示:根据f[]的值进行分类。对于f[]的每一个取值k,我们只需要保留满足f[i] = k的所有a[i]中的最小值。设d[k]记录这个值,即d[k] = min{ a[i] } ( f[i] = k )。
特别关注D[]的几个特点:
(1) D[k]的值是在整个计算过程中是单调不上升的。//此处需要特别注意!!!关键之所在!
(2) D[]的值是有序的,即D[1] < D[2] < D[3] < ... < D[n]。
利用D[],我们可以得到另外一种计算最长上升子序列长度的方法。设当前已经求出的最长上升子序列长度为len。先判断a[i]与D[len],若a[i] > D[len],则将a[i]接在D[len]后将得到一个更长的上升子序列,len = len + 1,D[len+1] = a[i];否则,在D[1]..D[len]中,找到最大的j,满足D[j] < a[i].令k = j + 1,则有D[j] < a[i] <= D[k],将a[i]接在D[j]后将得到一个更长的上升子序列,同时更新D[k] = a[i].最后,len即为所要求的最长上升子序列的长度。
在上述算法中,若使用朴素的顺序查找在D[1]..D[len]查找,由于共有O(n)个元素需要计算,每次计算时的复杂度是O(n),则整个算法的时间复杂度为O(n^2),与原来的算法相比没有任何进步.但是由于D[]的特点a[x] <a[y] < a[i],我们在D[]中查找时,可以使用二分查找高效地完成,则整个算法的时间复杂度下降为O(nlogn),有了非常显著的提高.需要注意的是,D[]在算法结束后记录的并不是一个符合题意的最长上升子序列.
这个算法还可以扩展到整个最长子序列系列问题,整个算法的难点在于二分查找的设计,需要非常小心注意.
1 // By Fandywang 2008.7.21 2 // Call: LIS(a, n); 求最大递增/上升子序列(如果为最大非降子序列,只需把上面的注释部分给与替换) 3 const int N = 1001; 4 int a[N], f[N], d[N]; // d[i]用于记录a[0...i]的最大长度 5 int bsearch(const int *f, int size, const int &a) 6 { 7 int l=0, r=size-1; 8 while( l <= r ) 9 {10 int mid = (l+r)/2;11 if( a > f[mid-1] && a <= f[mid] ) return mid; // >&&<= 换为: >= && <12 else if( a < f[mid] ) r = mid-1;13 else l = mid+1;14 }15 }16 int LIS(const int *a, const int &n){17 int i, j, size = 1;18 f[0] = a[0]; d[0] = 1;19 for( i=1; i < n; ++i ){20 if( a[i] <= f[0] ) j = 0; // <= 换为: <21 else if( a[i] > f[size-1] ) j = size++; // > 换为: >=22 else j = bsearch(f, size, a[i]);23 f[j] = a[i]; d[i] = j+1;24 }25 return size;26 }
上面的算法多少有些繁琐,下面介绍另一种算法:
如果前i-1个数中的最长非降子序列的最后一个数是ak;那么下一步就是在求前k-1个数中的的最长非降子序列;
因此我们可以设计一个状态opt[j]表示前i个数中用到a[i]所构成的最优解。
那么决策就是在前i-1个数中找到最大的opt[j] 使得a[j]<=a[i],那么opt[j]+1 就是opt[i]的值;
方程可以这样表示:
max[opt[j]] a[i] < a[j] && 0<=j<i
opt[i] ={
max[opt[j]]+1 a[i] >= a[j] && 0<=j<i
1 #include <stdio.h> 2 3 #include <stdlib.h> 4 5 6 7 int main() 8 9 { 10 11 int seq[10] = {4,5,7,8,3,2,6,7,33,4};12 13 int opt[10], i, j, max = 0;14 15 16 17 for(i=0; i<10; i++)18 19 opt[i] = 0;20 21 opt[0] = 1; //只有一个数时最长非降序列长度为122 23 24 25 for(i=1; i<10; i++)26 27 {28 29 opt[i] = 1;30 31 for(j=0; j<i; j++)32 33 {34 35 if(seq[j]<=seq[i] && opt[j]+1>opt[i])36 37 {38 39 opt[i] = opt[j]+1;40 41 }42 43 }44 45 }46 47 48 49 for(i=0; i<10; i++)50 51 if(opt[i] > max)52 53 max = opt[i];54 55 printf("max:%d\n", max);56 57 return 0;58 59 }
感谢:
http://www.cnblogs.com/dartagnan/archive/2011/08/29/2158230.html
http://hi.baidu.com/fandywang_jlu/item/da673a3d83e2a65980f1a7e1