首页 > 代码库 > Distinct Subsequences(不同子序列的个数)——b字符串在a字符串中出现的次数、动态规划
Distinct Subsequences(不同子序列的个数)——b字符串在a字符串中出现的次数、动态规划
Given a string S and a string T, count the number of distinct subsequences ofT inS.
A subsequence of a string is a new string which is formed from the original string by deleting some (can be none) of the characters without disturbing the relative positions of the remaining characters. (ie,"ACE"
is a subsequence of"ABCDE"
while "AEC"
is not).
Here is an example:
S = "rabbbit"
, T = "rabbit"
Return 3
.
简单翻译一下,给定两个字符串S和T,求S有多少个不同的子串与T相同。S的子串定义为在S中任意去掉0个或者多个字符形成的串。
递归求解:
首先找到在S中与T的第一个字符相同的字符,从这个字符开始,递归地求S和T剩下的串。T为空串时,返回1。因为空串本身是另外一个串的一个子序列。这个算法实现简单,但是果然不出意料,大集合超时。
Java代码:
1 public int numDistinct(String S, String T) { 2 // Start typing your Java solution below 3 // DO NOT write main() function 4 if (S.length() == 0) { 5 return T.length() == 0 ? 1 : 0; 6 } 7 if (T.length() == 0) { 8 return 1; 9 } 10 int cnt = 0; 11 for (int i = 0; i < S.length(); i++) { 12 if (S.charAt(i) == T.charAt(0)) { 13 cnt += numDistinct(S.substring(i + 1), T.substring(1)); 14 } 15 } 16 return cnt; 17 }
遇到这种两个串的问题,很容易想到DP。但是这道题的递推关系不明显。可以先尝试做一个二维的表int[][] dp,用来记录匹配子序列的个数(以S ="rabbbit"
,T = "rabbit"
为例):
r a b b b i t
1 1 1 1 1 1 1 1
r 0 1 1 1 1 1 1 1
a 0 0 1 1 1 1 1 1
b 0 0 0 1 2 3 3 3
b 0 0 0 0 1 3 3 3
i 0 0 0 0 0 0 3 3
t 0 0 0 0 0 0 0 3
从这个表可以看出,无论T的字符与S的字符是否匹配,dp[i][j] = dp[i][j - 1].就是说,假设S已经匹配了j - 1个字符,得到匹配个数为dp[i][j - 1](即若S[j]!=T[i],则该出现次数等于T[0-i]在S[0-(j-1)]出现的次数).现在无论S[j]是不是和T[i]匹配,匹配的个数至少是dp[i][j - 1]。除此之外,当S[j]和T[i]相等时,我们可以让S[j]和T[i]匹配,然后让S[j - 1]和T[i - 1]去匹配(T[0-(i-1)]在S[0-(j-1)]出现的次数*(T[i]==S[j])=1)
所以递推关系为:
dp[0][0] = 1; // T和S都是空串.
dp[0][1 ... S.length() - 1] = 1; // T是空串,S只有一种子序列匹配。
dp[1 ... T.length() - 1][0] = 0; // S是空串,T不是空串,S没有子序列匹配。
dp[i][j] = dp[i][j - 1] + (T[i - 1] == S[j - 1] ? dp[i - 1][j - 1] : 0).1 <= i <= T.length(), 1 <= j <= S.length()
1 class Solution { 2 public: 3 int numDistinct(string S, string T) { 4 if(S.empty()||T.empty()) return 0; 5 if(S.length()<T.length()) return 0; 6 int dp[T.length()+1][S.length()+1]; 7 dp[0][0]=1; 8 for(int i=1;i<=T.length();i++){ 9 dp[i][0]=0; 10 } 11 for(int j=1;j<=S.length();j++){ 12 dp[0][j]=1; 13 } 14 for(int i=1;i<=T.length();i++){ 15 for(int j=1;j<=S.length();j++){ 16 dp[i][j]=dp[i][j-1]; 17 if(T[i-1]==S[j-1]) 18 dp[i][j]+=dp[i-1][j-1]; 19 } 20 } 21 return dp[T.length()][S.length()]; 22 } 23 };
Distinct Subsequences(不同子序列的个数)——b字符串在a字符串中出现的次数、动态规划