首页 > 代码库 > UVA1368- DNA Consensus String

UVA1368- DNA Consensus String

题意:给定m个长度均为n的DNA序列,求一个DNA序列,使其到所有序列的总Hamming距离尽量小。两个等长字符串的Hamming距离等于字符不同的位置个数。求字典序最小的解。


思路:我们可以依次枚举每一个位置上的字母,要使得总的Hamming最小,那么每个位置上要取相同个数最多的那个字母,相同的话要取字典序最小的那个。


#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>

using namespace std;

const int MAXN = 1005;
const int N = 55;

char str[N][MAXN], s[MAXN];
int m, n, Min;
int num[4];

int Max(int a, int c, int g, int t) {
    return max(a, max(c, max(g, t)));
}

int main() {
    int cas;
    scanf("%d", &cas);
    while (cas--) {
        scanf("%d%d", &m, &n); 
        for (int i = 0; i < m; i++)
            scanf("%s", str[i]);
        Min = 0;
        int a, c, g, t;
        for (int i = 0; i < n; i++) { 
            a = c = g = t = 0;
            for (int j = 0; j < m; j++) {
                if (str[j][i] == 'A')
                    a++;
                else if (str[j][i] == 'C')
                    c++;
                else if (str[j][i] == 'G')
                    g++;
                else if (str[j][i] == 'T')
                    t++; 
            }
            int k = Max(a, c, g, t);
            Min += m - k;
            if (k == a) 
                s[i] = 'A';
            else if (k == c) 
                s[i] = 'C';
            else if (k == g) 
                s[i] = 'G';
            else if (k == t) 
                s[i] = 'T'; 
        }
        s[n] = '\0';
        printf("%s\n",s);
        printf("%d\n", Min);

    }
    return 0;
}