首页 > 代码库 > Linux下自带的regex

Linux下自带的regex

Linux下可直接用regex.h来支持正则表达式。

Android同样也有该头文件,可认为Android也是支持的。

 

#include <sys/types.h>
#include <regex.h>

int regcomp(regex_t *preg, const char *regex, int cflags);

int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);

size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);

void regfree(regex_t *preg);

 

rm_so为匹配字符串起始偏移(start offset),rm_eo为匹配字符串的终止偏移(end offset)。

typedef struct {
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;

 

 1 #include <stdio.h> 2 #include <regex.h> 3 #include <string.h> 4  5 int main(void) 6 { 7     const char *str = "aabbccdd.com"; 8     const char *pattern = "^(.+?)\\.com$"; 9     regex_t reg;10     regmatch_t match[10];11 12     int ret = 0;13     ret = regcomp(&reg, pattern, REG_EXTENDED | REG_NEWLINE);14     if(ret != 0)15         printf("error\n");16     else17     {18         ret = regexec(&reg, str, 10, match, 0);19         if(ret != REG_NOMATCH)20         {21             int len = match[1].rm_eo - match[1].rm_so;22             char buf[1024] = {0};23             memcpy(buf, str + match[1].rm_so, len);24             printf("final buf %s\n", buf);25         }26     }27     regfree(&reg);28     return 0;29 }

regmatch_t数组用来存储匹配的结果,该参数为数组的原因实际上是为了匹配group,其规则和Java等实现一致,若匹配成功,数组的[0]为整个匹配串,即group(0),其他为各个匹配到的组。

man regex

Linux下自带的regex