首页 > 代码库 > C语言字符串处理库函数

C语言字符串处理库函数

http://blog.csdn.net/pipisorry/article/details/36898405

使用C语言字符串处理的库函数,务必包含头文件string.h,即#include <string.h>

1、 比较字符串大小函数  

  1) 忽略大小写---strcasecmp

函数原型: int strcasecmp (const char *s1, const char *s2);

函数说明: 用来比较参数s1和s2字符串,比较时会自动忽略大小写的差异

2)忽略大小写—stricmp

函数原型:int stricmp(char *str1, char *str2);

函数说明:以大小写不敏感方式比较两个串

3) 不忽略大小写—strcmp

函数原型:int strcmp(char*str1,char*str2);

函数说明:通过比较字串中各个字符的ASCII码,来比较参数Str1和Str2字符串,比较时考虑字符的大小写。

4) 比较一部分—strncmpi

函数原型:int strncmpi(char *str1, char *str2, unsigned maxlen);

函数说明:比较字符串str1和str2的前maxlen个字符

5)内存区域比较---memcmp

函数原型:int memcmp(void*buf1,void *buf2,unsigned int count)

函数说明:比较内存区域buf1和buf2的前count个字节。Void*是指任何类型的指针。

6)内存区域部分比较-- memicmp Void*是指任何类型的指针。

函数原型:int memicmp(void*buf1,void *buf2,unsigned int count)

函数说明:比较内存区域buf1和buf2的前count个字节,但不区分大小写。

以上比较函数的返回值: 若参数1中字符串和参数中2字符串相同则返回0;

            若参数1中字符串长度大于参数2中字符串长度则返回大于0 的值;

            若参数1中字符串 长度小于参数2中字符串 长度则返回小于0的值。
2、 从字符串中提取子串  

1) 提取子串--strstr

函数原型:char* strstr(char*src,char*find)

函数说明:从字符串src中寻找find第一次出现的位置(不比较结束符NULL)

返回值:返回指向第一次出现find位置的指针,如果没有找到则返回NULL

2) 提取分隔符间字串—strtok

函数原型:char *strtok(char*src, char*delim);

函数说明:分解字符串诶一组标记串,src为要分解的字符串,delim为分隔符字符串。

            首次调用时,src必须指向要分解的字符串,随后调用要把s设成NULL;

              strtok中src中查找包含在delim中的字符,并用NULL(’\0’)来替换直到找遍整个字符串。

返回值:从s开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

             所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。

 

举例:

    #include<string.h>

    #include<stdio.h>

    int main(){

        char*s="Golden Global View";

        char*d=" ";

        char *p;

        p=strtok(s,d);

        while(p){

         printf("%s\n",p);

         strtok(NULL,d);

        }

        return 0;

}

输出:Golden

           Global

           View

3、 字符串复制

1) 字串复制--strcpy

函数原型:char*strcpy(char*dest,char*src)

函数说明:把src所指由NULL结束的字符串复制到dest所指的数组中。

                  其中,src和dest所致内存区域不可重叠且dest必须有足够的空间来容纳src的字符串。

返回值:返回指向dest的指针。

strcpy 是依据 /0 作为结束判断的,如果 to 的空间不够,则会引起 buffer overflow。strcpy 常规的实现代码如下(来自 OpenBSD 3.9):

char * strcpy(char *to, const char *from){

       char *save = to; 

       for (; (*to = *from) != ‘/0‘; ++from, ++to);

       return(save);

}

但通常,我们的 from 都来源于用户的输入,很可能是非常大的一个字符串,因此 strcpy 不够安全。


利用strncpy替代strcpy来防止缓冲区越界,但是如果还要考虑运行效率的话,也许strlcpy是一个更好的方式。

2. strncpy

原型:extern  char *strncpy(char   *dest,   char   *src,   int   n);    

功能:把src所指由NULL结束的字符串的前n个字节复制到dest所指的数组中。

说明:

如果src的前n个字节不含NULL字符,则结果不会以NULL字符结束。  

如果src的长度小于n个字节,则以NULL填充dest直到复制完n个字节。src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。  

返回指向dest的指针。  


在 ANSI C 中,strcpy 的安全版本是 strncpy,但 strncpy 其行为是很诡异的(不符合我们的通常习惯)。

标准规定 n 并不是 sizeof(s1),而是要复制的char 的个数。一个最常见的问题,就是 strncpy 并不帮你保证 /0结束。

char buf[8];

strncpy( buf, "abcdefgh", 8 );

看这个程序,buf 将会被 "abcdefgh" 填满,但却没有 /0 结束符了。

另外,如果 s2 的内容比较少,而 n 又比较大的话,strncpy 将会把之间的空间都用 /0 填充。这又出现了一个效率上的问题,如下:

char buf[80];

strncpy( buf, "abcdefgh", 79 );

上面的 strncpy 会填写 79 个 char,而不仅仅是 "abcdefgh" 本身。

strncpy 的标准用法为:(手工写上 /0)

strncpy(path, src, sizeof(path) - 1);

path[sizeof(path) - 1] = ‘/0‘;

len = strlen(path);

3. strlcpy

// Copy src to string dst of size siz. At most siz-1 characters will be copied. Always NUL terminates (unless siz == 0).

// Returns strlen(src); if retval >= siz, truncation occurred.

size_t   strlcpy(char *dst, const char *src, size_t siz);

而使用 strlcpy,就不需要我们去手动负责 /0 了,仅需要把 sizeof(dst) 告之 strlcpy 即可:

strlcpy(path, src, sizeof(path));

len = strlen(path);

if ( len >= sizeof(path) )

       printf("src is truncated.");

并且 strlcpy 传回的是 strlen(str),因此我们也很方便的可以判断数据是否被截断。

[* 一点点历史 *]

strlcpy 并不属于 ANSI C,至今也还不是标准。

strlcpy 来源于 OpenBSD 2.4,之后很多 unix-like 系统的 libc 中都加入了 strlcpy 函数,我个人在FreeBSD、Linux 里面都找到了 strlcpy。(Linux使用的是 glibc,

glibc里面有 strlcpy,则所有的 Linux 版本也都应该有 strlcpy)

但 Windows 下是没有 strlcpy 的,对应的是strncpy和memset函数


2) 字串复制--strdup

函数原型:char* strdup(char*src)

函数说明:复制字符串src

返回值:返回指向被复制字符串的指针,所需空间有malloc()分配且可以有free()释放。

3) 内存空间复制--memcpy

函数原型:void *memcpy(void *dest,void *src,unsigned int count);

函数说明:src和dest 所指内存区域不能重叠;由src所致内存区域复制count个字节到dest所指内存区域中。

返回值:返回指向dest的指针。

4、字符串连接   

1)接尾连接--strcat

函数原型:char* strcat(char*dest,char*src)

函数说明:把src所指字符串添加到dest结尾处(覆盖dest结尾处的‘\0‘)并添加‘\0‘

2)部分连接--strncat

函数原型:char* strncat(char*dest,char*src,int n);

函数说明:把src所指字符串的前n个字符添加到dest结尾处(覆盖dest结尾处的’\0’)并添加’’\0’.

返回值:返回指向dest的指针。

5、从字符串中查找字符

1)内存区域找字符--memchr

函数原型:void *memchr(void*buf,char ch,usigned count)

函数说明:从buf所指内存区域的前count个字节查找字符ch,当第一次遇到字符ch时停止查找。

返回值:如果找到了,返回指向字符ch的指针;否则返回NULL

2)字串中找字符--strchr

函数原型:char*strchr(char*src,char ch)

函数说明:查找字符串s中首次出现字符ch的位置

返回值:返回首次出现c的位置的指针,如果s中不存在c则返回NULL

3)搜所现字符--strcspn

函数原型:int strcspn(char*src,char*find)

函数说明:在字符串src中搜寻find中所出现的字符

返回值:返回第一个出现的字符在src中的下标值,即src中出现而不在find中出现的字串的长度。

举例:

#include<string.h>

#include<stdio.h>

int main(){

    char*s="Golden Global View";

    char*r="new";

    int n;

   n=strcspn(s,r);

   printf("The first char both in s1 and s2 is: %c",s[n]);

   return 0;

}

输出:The first char both in s1 and s2 is :e

4)匹配任一字符--strpbrk

函数原型:char*strpbrk(char*s1,char*s2)

函数说明:在字符串S1中寻找字符串S2中任何一个字符相匹配的第一个字符的位置,空字符不包括在内。

返回值:返回指向S1中第一个相匹配的字符的指针,如果没有匹配字符则返回空指针。

举例:

#include<stdio.h>

#include<string.h>

int main(){

    char *s1="WelcomeTo Beijing";

    char*s2="BIT";

    char *p;

   p=strpbrk(s1,s2);

    if(p)

       printf("%s\n",p);

    elseprintf("Not Found!\n");

    return 0;

}

输出:To Beijing

6、其他函数

1)全部转成大写---strupr

函数原型:char*strupr(char*src)

函数说明:将字符串src转换成大写形式,只转换src中出现的小写字母,不改变其他字符

返回值:返回指向src的指针。

2)全部转成小写---strlwr

函数原型:char*strlwr(char*src)

函数说明:将字符串src转换成小写形式,只转换src中出现的大写字母,不改变其他字符

返回值:返回指向src的指针。

3)将字串逆向--strrev

函数原型:char*strrev(char*src)

函数说明:把字符串src的所有字符的顺序颠倒过来(不包括NULL, 原地颠倒),会改变原来的str,返回的也是改变之后的str

不是标准string库里包含的,是微软自己发明的,类似还有atoi之类(在标准的g++中编译可能不会通过)

只能自己实现:

char * strrev(char *str){					//字符串反转,不包括'\0'
	char * head = str,* tail = str;
	while(*tail++);
	tail -= 2;//tail指向最后一个非'\0'字符

	char tmp;
	while(head < tail){
		tmp= *head;
		*head++ = *tail;
		*tail-- = tmp;
	}
	return str;
}

返回值:返回指向颠倒顺序后的字符串指针

4)计算字符串长度--strlen

原型:extern int strlen(char *s);

用法:#include <string.h>

功能:计算字符串s的(unsigned int型)长度

说明:返回s的长度,不包括结束符NULL


ref:http://blog.csdn.net/pipisorry/article/details/36898405

http://blog.csdn.net/tigerjibo/article/details/6412759

http://blog.csdn.net/21aspnet/article/details/1539970