首页 > 代码库 > 字符串集合的合并

字符串集合的合并

将多个集合合并成没有交集的集合。    
给定一个字符串的集合,格式如:{aaa bbb ccc}, {bbb ddd},{eee fff},{ggg},{ddd hhh}要求将其中交集不为空的集合合并,要求合并完成后的集合之间无交集,例如上例应输出{aaa bbb ccc ddd hhh},{eee fff}, {ggg}。   
(1)请描述你解决这个问题的思路;   
(2)请给出主要的处理流程,算法,以及算法的复杂度   
(3)请描述可能的改进。

采用并查集。(关于并查集,上篇博文讲了)

首先所有的字符串都在单独的并查集中。然后依扫描每个集合,顺序合并将两个相邻元素合并。例如,对于,首先查看aaa和bbb是否在同一个并查集中,如果不在,那么把它们所在的并查集合并,然后再看bbb和ccc是否在同一个并查集中,如果不在,那么也把 它们所在的并查集合并。接下来再扫描其他的集合,当所有的集合都扫描完了,并查集代表的集合便是所求。复杂度应该是O(NlgN)的。改进的话,首先可以 记录每个节点的根结点,改进查询。合并的时候,可以把大的和小的进行合,这样也减少复杂度。

 

#include <stdio.h>
#include <stdlib.h>

#define MAX 26

//将给定的字符串的集合转化为如下的关系“aaa”编号为1,以此类推。。。。 
int relation[6][2] = {
        {1,2},//{"aaa","bbb"}
        {1,3},//{"aaa","ccc"}
        {2,4},
        {5,6},
        {4,8},
        {7,7}//{ggg}
      };
//(之所以这么复杂去实现,主要是为了输出ggg,目前使用并查集没有更好的办法) 
//找主根(一开始初始化为-1,如果A[x]<0,首先
//给其根节点赋值为本身并返回,其次其根节点为本身的,返回其本身。)
//此函数主要目的是在集合合并处使用           
int find_root(int A[], int x)
{
//结合调用的for循环i=0~6;故只有出现的字母才会出现自己的根节点是自己,没有出现的字母根节点仍然是-1;(为了以后再输出时方便,加以控制)    
  if(A[x]<0)
      {
          A[x]=x;
        return x;
    }
  else if(A[x]==x)
          return x;
  else
    return find_root(A, A[x]); 
}
//(此函数主要是在最后结果输出时使用 ) 
//返回根节点 
int findroot(int A[],int x)
{
  if(A[x]==x||A[x]==-1)
    return A[x];
  else
    return findroot(A, A[x]); 
}

int main(int argc, char *argv[])
{
  int i;
  int root1;
  int root2;
  int A[MAX];//根节点的存储 
//一开始根节点的数组里面的值初始化为-1 
  for(i=0;i<26;i++)
    A[i] = -1;
//遍历relation二维数组来实现集合的合并   
  for(i=0;i<6;i++)
   {
    root1 = find_root(A, relation[i][0]); 
    root2 = find_root(A, relation[i][1]);
    if(root1!=root2)//集合根节点的合并 (此处还可以优化?) 
            A[root1]=root2;
   } 
   
//结果的输出  
   int flag[26]={0};
   for(i=1;i<26;i++)
   {
           if(flag[i])
               continue;
           int mark=findroot(A,i);//为了输出找根节点  之前是A[i]  by felix
        //根节点为-1的不考虑 
           if(mark!=-1)
           {
               flag[i]=1;
               printf("%c%c%c\t",i+a-1,i+a-1,i+a-1);
               for(int j=i+1;j<26;j++)
               {
                   if(flag[j])
                       continue;
                   int marks=findroot(A,A[j]);
                   if(marks==mark)
                   {
                       flag[j]=1;
                       printf("%c%c%c\t",j+a-1,j+a-1,j+a-1);
                }
            }
            puts("");
        }
        
   }
  system("PAUSE");    
  return 0;
}

 方法二:使用hash_table方法

http://www.cnblogs.com/ttltry-air/archive/2012/08/14/2638437.html

字符串集合的合并