首页 > 代码库 > 由编程珠玑字符串倒置问题拓展到split之C\C++实现

由编程珠玑字符串倒置问题拓展到split之C\C++实现

一道字符串倒置的题目,不是全部倒置,而是每个单词倒置,单词之间顺序不变。

这道题目应该是很经典的,好多次看到,包含编程珠玑的案例,还有某博客写的百度一面面试题,典型的O(n)算法,每个word倒置,再整个string倒置。

这次要上战场了,却发现C C++的 字符串函数不熟练了,最近写的都是Java,一个Split函数爽到爆,于是决定要吧C C++的常用字符串函数过一遍,
并对各种方法实现,此处总结下Split。另外发现leetcode里面居然只支持new node(data), 不支持常用的new node();因为之前习惯后者,可能leetcode都是写成类,而且头文件基本包括,总之提交的代码不能直接运用,后台会自动扩充成完整的,而且是面向对象的思想,我还用malloc去弄。

IT面试C C++ 是永恒的王道,尤其是字符串处理,必须信手拈来,函数的参数,返回值,功能,是否指针可写,C C++字符串转换必须熟记在心。

自己写的reverseWord,虽然AC掉了,但是代码极其丑陋,C C++字符串操作混乱,完全不统一。。。
void reverseWords(string &s) {
        
    string s_result="";
	char *s_dup=strdup(s.c_str());


	// first split, outside loop
	char *splitpoint=strtok(s_dup," ");

	while(splitpoint!=NULL)
	{
		//reverse each split word in place, 
		int splitlength=strlen(splitpoint);
		for(int i=0;i<splitlength/2;i++)
		{
			char tmp=splitpoint[i];
			splitpoint[i]=splitpoint[splitlength-i-1];
			splitpoint[splitlength-i-1]=tmp;
		}

		//change char* to string, then each time concatenate to new string
		string reversesplitword=splitpoint;

		splitpoint=strtok(NULL," ");
		if(splitpoint!=NULL)
			s_result+=reversesplitword+" ";
		else
			s_result+=reversesplitword;
		
	}

	//reverse s_result;
	string tmp="";
	for(int i=0;i<s_result.length();i++)
		tmp=s_result[i]+tmp;
	s=tmp;
        
}


这里对Split功能的几种实现做一个总结,当时处理MCluster输入参数路径的时候,也用了这个函数,但是C C++字符串转换感觉很不爽。。。因为strtok源串必须为可修改的指针,string.c_str()是一个只读的char* 类型
之前习惯的都是C的那个函数strtok()
char *splitpoint=strtok(s_dup," ");
while(splitpoint!=NULL)
{
	splitpoint=strtok(NULL," ");
}

strtok函数有个非常奇怪的地方,就是源串居然会被修改,
"  zhang rui   chang "
执行一次,源串变为"   zhang", splitpoint变为"zhang",因为他把zhang 后面分隔符自动填了\0,所以源字符串被截断了
但是他可以自动实现多个连续的分隔符split时全部都被删掉,恰好符合题目要求

这是C的split函数,由于string还是比较方便,直接转的时候c_str()不行,因此需要拷贝一个char* 出来很麻烦,也慢,于是考虑直接split string字符串
前几天和好基友伟哥聊了会儿,伟哥突然提到一个stringstream, 我都差点忘了,当年C++教材里有一个这例子,专门处理那种ACM题目里一行的数据的个数是未知的情况,
但是我到后面一直没怎么用,没体会到他的好处。于是有了下面的代码,但是这个方法有个最大的局限,就是只能处理他设置好的delim,也即space \t 和\n这三种, 

#include<stringstream>
...
str="  zhang rui   chang ";
istringstream istr(str);
while(str>>splitstr)
{
	//process for each splitted str, splitstr;
}

如果修改delim的话,用getline函数改下就好了

www.haogongju.net/art/1554996

std::string token, text("Here,is,some:text"); //声明两个string token为空, text初始化为 "Here, is, some:text" 
std::stringstream iss(text); //声明一个stringstream类型 对象iss, 并将其赋值给 text
while ( getline(iss, token, ',') ) //从iss 读取字符串,并写入给字符串 token, 截断符使用 ',' 代替默认的截断符 '\n', 直到读到iss的结尾位置为止 
{ 
	std::cout << token << std::endl; //输出每次截断的新内容 ...即 token的值 11 
}


String的实现,也可以考虑迭代器实现
blog.csdn.net/butterfly_dreaming/article/details/10142443 
//注意:当字符串为空时,也会返回一个空字符串  

void split(std::string& s, std::string& delim,std::vector< std::string >* ret)  
{  
    size_t last = 0;  
    size_t index=s.find_first_of(delim,last);  
    while (index!=std::string::npos)  
    {  
        ret->push_back(s.substr(last,index-last));  
        last=index+1;  
        index=s.find_first_of(delim,last);  
    }  
    if (index-last>0)  
    {  
        ret->push_back(s.substr(last,index-last));  
    }  
}
char* 也可以实现,但是和上面没本质区别

另外还有一种方法,就是用boost,但是这个感觉对我比较冷门,虽然有了这个,库就估计可以和Java比了,boost里面有专门的token处理

blog.diveinedu.net/%E4%B8%89%E7%A7%8D%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%88%86%E5%89%B2%E6%96%B9%E6%B3%95cc/
正如上面这位仁兄总结的三条主线差不多了。所以对于多数情况用string,就用stringstream吧,如果输入的char*, 也可以先转string,或者直接用strtok哈~


指针传递的笔记:
指针传递是 传值,不是引用,因此创建一个链表最好返回一个指针值,而不要期待传递一个类似于引用传递的指针参数,因为穿进去的是一个拷贝了原指针指的指针变量

另外还有一个细节就是char string[ ]=”C++ programming language”;

用strlen 是24, 但是sizeof 25, 原因是strlen是基于字符串本身的长度,当然不算结束符了,而sizeof是占得内存字节数,\0是占内存,切腹属于该字符串

char *a="C++ programming language";
cout<<strlen(a)<<endl<<sizeof(a)<<endl;

结果是:24和4,所以大家可以体会给char a[] 和char*a赋一个字符串的巨大区别了吧 


但是如果 cout<<a<<endl<<(void*)a<<endl 前面输出的居然是字符串值,而不是一个地址值,而后面要转换成泛型指针才能输出地址值,小伙伴们都惊呆了,想起了C++书当时提到的C++智能处理。

再次感谢博主帮我回忆了C++字符串处理

www.weixueyuan.net/view/5851.html