Giraph源码分析（八）—— 统计每个SuperStep中参与计算的顶点数目

首页 > 代码库 > Giraph源码分析（八）—— 统计每个SuperStep中参与计算的顶点数目

Giraph源码分析（八）—— 统计每个SuperStep中参与计算的顶点数目

2024-07-03 03:46:21 226人阅读

【题目】

原文：

1.3 Design an algorithm and write code to remove the duplicate characters in a string without using any additional buffer. NOTE: One or two additional variables are fine. An

extra copy of the array is not.

FOLLOW UP

Write the test cases for this method.

译文：

设计算法并写出代码移除字符串中重复的字符，不能使用额外的缓存空间。注意：可以使用额外的一个或两个变量，但不允许额外再开一个数组拷贝。

【分析】

这道题目其实是要你就地(in place)将字符串中重复字符移除。你可以向面试官问清楚，不能使用额外的一份数组拷贝是指根本就不允许开一个数组，还是说可以开一个固定大小，与问题规模(即字符串长度)无关的数组。

根据面试官的回答，制定相应的解题策略。

【思路一】

如果根本就不允许你再开一个数组，只能用额外的一到两个变量。那么，最先想到的方法就是暴力求解法了。

你可以依次访问这个数组的每个元素，每访问一个，就将该元素与前面的元素进行比较，如果相同就去掉，如果不相同就添加到前面序列中。

时间复杂度为O（n^2）

相应代码为代码一

【思路二】

如果根本就不允许你再开一个数组，只能用额外的一到两个变量。第二种方法就是先排序，再去重。

排序之后重复元素必定是相邻的，这样去重就简单多了。

排序时间复杂度最快为快速排序为O（nlogn）

去重时间复杂度为O（n）

最终为O（nlogn）

相应代码为代码二

【思路三】

1 如果可以开一个固定大小，与问题规模(即字符串长度)无关的数组，那么可以用一个数组来表征每个字符的出现(假设是ASCII字符，则数组大小为256)，这样的话只需要遍历一遍字符串即可，时间复杂度O(n)。

相应代码为代码三

2 如果字符集更小一些，比如只是a-z，即字符串里只包含小写字母，那么使用一个int变量中的每一位来表征每个字符的出现，用位运算来实现。也可以在O(n)的时间里移除重复字符，而且还不需要额外开一个数组。

相应代码为代码四

【代码一】

/*********************************
*   日期：2014-5-6
*   作者：SJF0115
*   题目: 字符串中字符去重
*   来源：CareerCup
**********************************/
#include <iostream>
#include <algorithm>
#include <string.h>
using namespace std;

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    int i,j;
    if(str == NULL){
        return;
    }
    int len = strlen(str);
    //去重
    int index = 0;
    for(i = 0;i < len;i++){
        //str[i]为待考察的元素 与前面元素比较看是否重复
        for(j = 0;j < i;j++){
            //有重复的元素
            if(str[i] == str[j]){
                break;
            }
        }
        //str[i] 前面没有与之重复的元素
        if(j >= i){
            str[index++] = str[i];
        }
    }
    str[index] = ‘\0‘;
}

int main() {
    char str[] = "abababa";
    RemoveDuplicates(str);
    cout<<str<<endl;
    return 0;
}

【代码二】

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    if(str == NULL){
        return;
    }
    int len = strlen(str);
    //排序
    sort(str,str+len);
    int index = 1;
    //去重
    for(int i = 1;i < len;i++){
        if(str[i] != str[i-1]){
            str[index++] = str[i];
        }
    }
    str[index] = ‘\0‘;
}

【代码三】

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    bool vis[256];
    //初始化
    memset(vis,false,sizeof(vis));
    int len = strlen(str);
    int index = 0;
    for(int i = 0;i < len;i++){
        if(!vis[str[i]]){
            str[index++] = str[i];
            vis[str[i]] = true;
        }
    }
    str[index] = ‘\0‘;
}

【代码四】

void RemoveDuplicates(char str[]){
    int len = strlen(str);
    if(len < 2) return;
    int check = 0;
    int index = 0;
    //去重
    for(int i=0; i<len; ++i){
        int v = (int)(str[i]-‘a‘);
        if((check & (1<<v))==0){
            str[index++] = str[i];
            check |= (1<<v);
        }
    }
    str[index] = ‘\0‘;
}

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Giraph源码分析（八）—— 统计每个SuperStep中参与计算的顶点数目