首页 > 代码库 > 贪心:字典树openjudge1799-最短前缀

贪心:字典树openjudge1799-最短前缀

描述

一个字符串的前缀是从该字符串的第一个字符起始的一个子串。例如 "carbon"的字串是: "c", "ca", "car", "carb", "carbo", 和 "carbon"。注意到这里我们不认为空串是字串, 但是每个非空串是它自身的字串. 我们现在希望能用前缀来缩略的表示单词。例如, "carbohydrate" 通常用"carb"来缩略表示. 现在给你一组单词, 要求你找到唯一标识每个单词的最短前缀
在下面的例子中,"carbohydrate" 能被缩略成"carboh", 但是不能被缩略成"carbo" (或其余更短的前缀) 因为已经有一个单词用"carbo"开始
一个精确匹配会覆盖一个前缀匹配,例如,前缀"car"精确匹配单词"car". 因此 "car" 是 "car"的缩略语是没有二义性的 , “car”不会被当成"carriage"或者任何在列表中以"car"开始的单词.
输入输入包括至少2行,至多1000行. 每行包括一个以小写字母组成的单词,单词长度至少是1,至多是20.输出输出的行数与输入的行数相同。每行输出由相应行输入的单词开始,后面跟着一个空格接下来是相应单词的没有二义性的最短前缀标识符。

样例输入

carbohydrate
cart
carburetor
caramel
caribou
carbonic
cartilage
carbon
carriage
carton
car
carbonate

样例输出

carbohydrate carboh
cart cart
carburetor carbu
caramel cara
caribou cari
carbonic carboni
cartilage carti
carbon carbon
carriage carr
carton carto
car car
carbonate carbona
贪心考虑先按字典序排序,然后逐个将单词与前后的作比较,直到找到所求最短前缀。
先贴代码
#include<bits/stdc++.h>
using namespace std;
struct mode{
    char w[30],z[30];
    int num;
}a[1010];
bool cmp1(mode x,mode y){
    int i,lx=strlen(x.w),ly=strlen(y.w);
    for( i = 0 ; i <lx&& i<ly ; ++i){
        if(x.w[i]!=y.w[i])return x.w[i]<y.w[i];
    }
    return lx<ly;
}
bool cmp2(mode x,mode y){
    return x.num<y.num;
}
int main(){
    int i = 1,j;
    while((scanf("%s",a[i].w))!=EOF){
        a[i].num=i;
        ++i;
    }
    int sum=i-1;
    sort(a+1,a+sum+1,cmp1);
    for( i = 1 ; i <= sum ; ++i){
        bool flag1=true;
        bool flag2=true;
        int l=strlen(a[i].w);
        for( j = 0 ; j < l ; ++j){
            if(a[i].w[j]!=a[i-1].w[j]){
                flag1=false;
            }
            if(a[i].w[j]!=a[i+1].w[j]){
                flag2=false;
            }
            if(!flag1&&!flag2)break;
        }
        if(j==l)--j;
        for(int k = 0 ; k <= j ; ++k )a[i].z[k]=a[i].w[k];
    }
    sort(a+1,a+sum+1,cmp2);
    for(int i = 1 ; i <= sum ; ++i){
        printf("%s %s\n",a[i].w,a[i].z);
    }
    return 0;
}

需要注意的是,在比较前与后时不能用如下判断:

for( i = 1 ; i <= sum ; ++i){
        int l=strlen(a[i].w);
        for( j = 0 ; j < l ; ++j){
            if(a[i].w[j]!=a[i-1].w[j]&&a[i].w[j]!=a[i+1].w[j]){
                break;
            }
        }

比如:

abct

abcxt

abext

第二个的最短为abcx,若用如上方法判断会得到abcxt。

所以需要开两个flag,当上下两个都为false时,就找到了前缀的尾。(特别鸣谢马哥出了这个数据,毕竟自己调了好久也没发现这个错误QAQ)

就是这样了。

贪心:字典树openjudge1799-最短前缀