字符串集合的合并

首页 > 代码库 > 字符串集合的合并

2024-10-04 10:03:02 220人阅读

将多个集合合并成没有交集的集合。
给定一个字符串的集合，格式如：{aaa bbb ccc}， {bbb ddd}，{eee fff}，{ggg}，{ddd hhh}要求将其中交集不为空的集合合并，要求合并完成后的集合之间无交集，例如上例应输出{aaa bbb ccc ddd hhh}，{eee fff}， {ggg}。
（1）请描述你解决这个问题的思路；
（2）请给出主要的处理流程，算法，以及算法的复杂度
（3）请描述可能的改进。

采用并查集。（关于并查集，上篇博文讲了）

首先所有的字符串都在单独的并查集中。然后依扫描每个集合，顺序合并将两个相邻元素合并。例如，对于，首先查看aaa和bbb是否在同一个并查集中，如果不在，那么把它们所在的并查集合并，然后再看bbb和ccc是否在同一个并查集中，如果不在，那么也把它们所在的并查集合并。接下来再扫描其他的集合，当所有的集合都扫描完了，并查集代表的集合便是所求。复杂度应该是O(NlgN)的。改进的话，首先可以记录每个节点的根结点，改进查询。合并的时候，可以把大的和小的进行合，这样也减少复杂度。

#include <stdio.h>
#include <stdlib.h>

#define MAX 26

//将给定的字符串的集合转化为如下的关系“aaa”编号为1，以此类推。。。。 
int relation[6][2] = {
        {1,2},//{"aaa","bbb"}
        {1,3},//{"aaa","ccc"}
        {2,4},
        {5,6},
        {4,8},
        {7,7}//{ggg}
      };
//（之所以这么复杂去实现，主要是为了输出ggg，目前使用并查集没有更好的办法） 
//找主根（一开始初始化为-1，如果A[x]<0,首先
//给其根节点赋值为本身并返回，其次其根节点为本身的，返回其本身。）
//此函数主要目的是在集合合并处使用           
int find_root(int A[], int x)
{
//结合调用的for循环i=0~6;故只有出现的字母才会出现自己的根节点是自己，没有出现的字母根节点仍然是-1；（为了以后再输出时方便，加以控制）    
  if(A[x]<0)
      {
          A[x]=x;
        return x;
    }
  else if(A[x]==x)
          return x;
  else
    return find_root(A, A[x]); 
}
//（此函数主要是在最后结果输出时使用 ） 
//返回根节点 
int findroot(int A[],int x)
{
  if(A[x]==x||A[x]==-1)
    return A[x];
  else
    return findroot(A, A[x]); 
}

int main(int argc, char *argv[])
{
  int i;
  int root1;
  int root2;
  int A[MAX];//根节点的存储 
//一开始根节点的数组里面的值初始化为-1 
  for(i=0;i<26;i++)
    A[i] = -1;
//遍历relation二维数组来实现集合的合并   
  for(i=0;i<6;i++)
   {
    root1 = find_root(A, relation[i][0]); 
    root2 = find_root(A, relation[i][1]);
    if(root1!=root2)//集合根节点的合并 （此处还可以优化？） 
            A[root1]=root2;
   } 
   
//结果的输出  
   int flag[26]={0};
   for(i=1;i<26;i++)
   {
           if(flag[i])
               continue;
           int mark=findroot(A,i);//为了输出找根节点  之前是A[i]  by felix
        //根节点为-1的不考虑 
           if(mark!=-1)
           {
               flag[i]=1;
               printf("%c%c%c\t",i+‘a‘-1,i+‘a‘-1,i+‘a‘-1);
               for(int j=i+1;j<26;j++)
               {
                   if(flag[j])
                       continue;
                   int marks=findroot(A,A[j]);
                   if(marks==mark)
                   {
                       flag[j]=1;
                       printf("%c%c%c\t",j+‘a‘-1,j+‘a‘-1,j+‘a‘-1);
                }
            }
            puts("");
        }
        
   }
  system("PAUSE");    
  return 0;
}

方法二：使用hash_table方法

http://www.cnblogs.com/ttltry-air/archive/2012/08/14/2638437.html

字符串集合的合并

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 字符串集合的合并

字符串集合的合并

看完仍有疑问？有类似问题直接问程序猿