首页 > 代码库 > 比较字符串总结:如果计算两个字符串的相似度或者距离
比较字符串总结:如果计算两个字符串的相似度或者距离
有关字符串相关比较问题,一般处理方法都选择动态规划处理方法。或者是单个循环,或者是多个循环;dp
遇到这种两个串的问题,很容易想到DP。但是这道题的递推关系不明显。可以先尝试做一个二维的表int[][] dp,用来记录匹配子序列的个数(以S="rabbbit"
,T = "rabbit"
为例):
r a b b b i t
1 1 1 1 1 1 1 1
r 0 1 1 1 1 1 1 1
a 0 0 1 1 1 1 1 1
b 0 0 0 1 2 3 3 3
b 0 0 0 0 1 3 3 3
i 0 0 0 0 0 0 3 3
t 0 0 0 0 0 0 0 3
从这个表可以看出,无论T的字符与S的字符是否匹配,dp[i][j] = dp[i][j - 1].就是说,假设S已经匹配了j - 1个字符,得到匹配个数为dp[i][j - 1].现在无论S[j]是不是和T[i]匹配,匹配的个数至少是dp[i][j - 1]。除此之外,当S[j]和T[i]相等时,我们可以让S[j]和T[i]匹配,然后让S[j - 1]和T[i - 1]去匹配。所以递推关系为:
dp[0][0] = 1; // T和S都是空串.
dp[0][1 ... S.length() - 1] = 1; // T是空串,S只有一种子序列匹配。
dp[1 ... T.length() - 1][0] = 0; // S是空串,T不是空串,S没有子序列匹配。
dp[i][j] = dp[i][j - 1] + (T[i - 1] == S[j - 1] ? dp[i - 1][j - 1] : 0).1 <= i <= T.length(), 1 <= j <= S.length()
Java代码:
public int numDistinct(String S, String T) { int sl=S.length(); int tl=T.length(); int[][] dp=new int[sl+1][tl+1]; dp[0][0]=1; for(int i=1;i<sl;i++){ dp[i][0]=1; } for(int i=1;i<tl;i++){ dp[0][i]=0; } for(int i=1;i<=sl;i++){ for(int j=1;j<=tl;j++){ dp[i][j]=dp[i-1][j]; if(S.charAt(i-1)==T.charAt(j-1)){ dp[i][j]+=dp[i-1][j-1]; } } } return dp[sl][tl]; }