首页 > 代码库 > POJ 1458 Common Subsequence(最长公共子序列LCS)

POJ 1458 Common Subsequence(最长公共子序列LCS)

POJ1458 Common Subsequence(最长公共子序列LCS)

http://poj.org/problem?id=1458

题意:

       给你两个字符串, 要你求出两个字符串的最长公共子序列长度.

分析:

       本题不用输出子序列,很简单,直接处理即可.

       首先令dp[i][j]==x表示A串的前i个字符和B串的前j个字符的最长公共子序列长度为x.

       初始化: dp全为0.

       状态转移:

       IfA[i]==B[j] then

              dp[i][j]= dp[i-1][j-1]+1

       else

              dp[i][j]= max( dp[i-1][j] , dp[i][j-1] )

       上述公式: 当A[i]==B[j]时, A的第i个字符和B的第j个字符必然在A[1..i]和B[1..j]的最长公共子序列中, 所以dp[i][j]==dp[i-1][j-1]+1.

       当A[i]!=B[j]时, A[i]和B[j]至少有一个是不可能在A[1..i]和B[1..j]的最长公共子序列中的, 所以dp[i][j] = max( dp[i-1][j] , dp[i][j-1] )

       最终所求: dp[n][m].

AC代码:

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn=1000+5;

int n,m;
int dp[maxn][maxn];
char s1[maxn],s2[maxn];

int main()
{
    while(scanf("%s%s",s1,s2)==2)
    {
        n=strlen(s1);//s1串长度
        m=strlen(s2);//s2串长度
        memset(dp,0,sizeof(dp));

        for(int i=1;i<=n;i++)
        for(int j=1;j<=m;j++)
        {
            if(s1[i-1]==s2[j-1])
                dp[i][j]=dp[i-1][j-1]+1;
            else
                dp[i][j]=max( dp[i-1][j] , dp[i][j-1] );
        }
        printf("%d\n",dp[n][m]);
    }
    return 0;
}

 

现在的问题是如何按字典序输出所有的LCS串呢?

       可以看到如果我们想求A[1..i]与B[1..j]的LCS, 那么当A[i]==B[j]时,

A[i](也是B[j]字符)这个字符是必然要被选的, 那么我们下面考虑A[1..i-1]和B[1..j-1]的LCS即可. 我写了一个DFS逆序递推求出所有串的方法, 然后把串保存入set中, 就是按字典序排序且去重后的结果了.

       DFS过程其实就是一个逆序递推的过程. S字符数组保存了我们当前已经确定了LCS的末尾num个字符. 如果当前A[i]==B[j], 那么A[i]就是一个我们需要保存入S的字符数组. 如果A[i]!=B[j], 那么我们最多有两条不同的路继续前进. 每个DFS都是一条可行路, 必然会找到一个可行的LCS.

       不过上面方法会出现很多重复的串, 所以效率比较低. 如果想提高效率还需要记录每个字符出现的位置并做一定的优化.

代码如下:

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<string>
#include<set>
using namespace std;
const int maxn=100+5;

int n,m;
int dp[maxn][maxn];
char s1[maxn],s2[maxn];

set<string> st;
char s[maxn];
char stmp[maxn];
int cnt;
//dfs从s1串的i位置和s2串的j位置开始逆序递推
//num是当前已经确定了LCS的末尾num个字符
//所有LCS保存到st中排序去重最后输出.
void dfs(int i,int j,int num)
{
    if(num>=cnt)//已经找到了一个LCS
    {
        for(int i=num;i>=1;i--)
            stmp[num-i]=s[i];
        stmp[num]='\0';

        string tmp(stmp);
        st.insert(tmp);
        return ;
    }
    if(s1[i]==s2[j])//该字符必选
    {
        s[++num]=s1[i];
        dfs(i-1,j-1,num);
    }
    else            //分情况讨论
    {
        if(dp[i-1][j]>dp[i][j-1])
            dfs(i-1,j,num);
        else if(dp[i-1][j]<dp[i][j-1])
            dfs(i,j-1,num);
        else
        {
            dfs(i-1,j,num);
            dfs(i,j-1,num);
        }
    }
}

int main()
{
    while(scanf("%s%s",s1,s2)==2)
    {
        n=strlen(s1);//s1串长度
        m=strlen(s2);//s2串长度
        memset(dp,0,sizeof(dp));

        for(int i=1;i<=n;i++)
        for(int j=1;j<=m;j++)
        {
            if(s1[i-1]==s2[j-1])
                dp[i][j]=dp[i-1][j-1]+1;
            else
                dp[i][j]=max( dp[i-1][j] , dp[i][j-1] );
        }
        printf("%d\n",dp[n][m]);
        
        cnt=dp[n][m];//cnt为LCS的长度
        
        dfs(n-1,m-1,0);
        
        set<string>::iterator it;
        for(it=st.begin(); it!=st.end(); ++it)
            cout<<*it<<endl;
    }
    return 0;
}

POJ 1458 Common Subsequence(最长公共子序列LCS)