首页 > 代码库 > 复制一个空洞文件且忽略掉其空洞内容

复制一个空洞文件且忽略掉其空洞内容

原文:复制一个空洞文件且忽略掉其空洞内容

  首先说一下什么叫做空洞文件!比如说,下面这段代码:

 1 #include<stdio.h> 2 #include<string.h> 3 #include<stdlib.h> 4 #include<errno.h> 5 #include<sys/types.h> 6 #include<sys/stat.h> 7 #include<fcntl.h> 8 #include<unistd.h> 9 10 #define MODE O_CREAT|O_RDWR|O_TRUNC11 int main(int argc,char *argv[])12 {13     int fd;14 15     if(argc != 2)16     {17     printf("Usage:%s <filename>\n",argv[0]);18     exit(EXIT_FAILURE);19     }20     if(-1 == (fd=open(argv[1],MODE,0644)))21     {22     printf("%s[open]%s\n",argv[0],strerror(errno));23     exit(EXIT_FAILURE);24     }25     if(-1 == write(fd,"abcde",5))26     {27     printf("%s[write]%s\n",argv[0],strerror(errno));28     exit(EXIT_FAILURE);29     }30     if(-1 == lseek(fd,5,SEEK_END))31     {32     printf("%s[lseek]%s\n",argv[0],strerror(errno));33     exit(EXIT_FAILURE);34     }35     if(-1 == write(fd,"ABCDE",5))36     {37     printf("%s[write]%s\n",argv[0],strerror(errno));38     exit(EXIT_FAILURE);39     }40     if(-1 == close(fd))41     {42     printf("%s[close]%s\n",argv[0],strerror(errno));43     exit(EXIT_FAILURE);44     }45     printf("空洞文件已经创建成功!\n");46     return 0;47 }

 在这段代码中,我首先在文件中写入abcde五个字节的内容,然后在把文件指针从文件尾端向后移动5个字节,再写入ABCDE5个字节的内容!这样在这个文件中,两次abcde中间就会产生一个5个字节空洞,这个空洞的内容都被写成了0。文件的空洞并不要求在磁盘上占用存储区,具体的处理方式和文件系统的实现有关!我这个文件如果用vim打开的话会是这样的效果!

中间蓝色的^@就表示内容为0的空洞!

  接下来,我们再来谈一谈如何来复制一个空洞文件,并且让忽略掉它的空洞部分的内容!这里我们就利用了空洞内容为0的这个特性!具体的实现方法就是通过查看读出来的文件内容的值是否为0,如果是则忽略,否则就存储起来!具体的实现代码如下:

#include<stdio.h>#include<string.h>#include<stdlib.h>#include<errno.h>#include<sys/types.h>#include<sys/stat.h>#include<fcntl.h>#include<unistd.h>#define MODE O_RDWR#define SIZE 4096int main(int argc,char *argv[]){    if(argc != 3)    {    printf("Usage: %s source_file destination_file\n",argv[0]);    exit(EXIT_FAILURE);    }    int fd_s,fd_d;    //分别用来存储读出和写入的文件内容    char buf_r[SIZE],buf_w[SIZE];    //写入缓存指针的计数器    int w_l;    //read_length,write_length    //读出和写入的长度    int r_len,w_len;    if(-1 == (fd_s=open(argv[1],MODE)))    {      printf("%s[open]%s\n",argv[1],strerror(errno));      exit(EXIT_FAILURE);    }    if(-1 == (fd_d=open(argv[2],MODE|O_CREAT|O_TRUNC,0644)))    //如果目标文件已经存在,则将其截短成0    {      printf("%s[open]%s\n",argv[2],strerror(errno));      exit(EXIT_FAILURE);    }    //如果文件的内容过于庞大,我这里是分批存储的!且在《Unix环境高级编程》的3.9节已经论证过当SIZE为4096的时候I/O的效率最佳!    while((r_len=read(fd_s,buf_r,SIZE)) > 0)    {      w_l=0;      //将读出内容中的非空洞内容赋值到buf_w中      for(int i=0;i<r_len;i++)      {          if(buf_r[i] != 0)          buf_w[w_l++]=buf_r[i];      }      //这里得到的w_l表示的是字符数组的长度,注意数组是从0开始的      if(-1 == (w_len=write(fd_d,buf_w,w_l)))      {          printf("%s[write]%s\n",argv[0]+2,strerror(errno));          exit(EXIT_FAILURE);      }    }    if(-1 == close(fd_s))    {      printf("%s[close]%s\n",argv[1]+2,strerror(errno));      exit(EXIT_FAILURE);    }    if(-1 == close(fd_d))    {      printf("%s[close]%s\n",argv[2]+2,strerror(errno));      exit(EXIT_FAILURE);    }    return 0;}

  上面那个程序的思路就是每次读取4096字节,分批读取源文件的内容到buf_r中,然后检查buf_r的内容,如果是0则忽略,否则就暂存到buf_w中,然后将其写入到目标文件中!

检验这个程序的运行结果我用了一个较大的空洞文件,具体的运行结果如下图:

  

复制一个空洞文件且忽略掉其空洞内容