首页 > 代码库 > APUE读书笔记:File I/O
APUE读书笔记:File I/O
文件描述符:
- 进程通过文件描述符来操作文件,文件描述符可以通过open, openat, creat系统调用返回;
- shell和其他应用默认打开标准输入(STDIN_FILENO),标准输出(STDOUT_FILENO),标准错误(STDERR_FILENO)三个文件描述符。
open和openat函数:
- 文件可以通过调用open或者openat函数打开或者创建;
- 新文件描述符使用最小未使用原则;
- TOCTTOU(time of check of time of use)的基本含义:程序是脆弱的,如果它调用两个基于文件的函数,并且后一个调用依赖于前一个调用的结果。因为这两个调用不是原子操作,在两个调用之间文件是可以被改变的,导致前一个调用的结果失效,错误发生。
creat函数:
- creat函数以只写的方式创建文件;
- creat函数完全可以用open函数代替:open(path, O_WRONLY | O_CREAT | O_TRUNC, mode)。
lseek函数:
1. 用于显式指定被打开文件的偏移量,返回当前文件的新偏移量;
2. 测试标准输入是否可以seek:
1 #include "apue.h" 2 3 int main(void) 4 { 5 if (lseek(STDIN_FILENO, 0, SEEK_CUR) == -1) { 6 printf("canot seek\n"); 7 } 8 else { 9 printf("seek OK\n");10 }11 exit(0);12 }
3. 由于文件当前偏移量可能为负数,lseek的返回值应该和 -1 比较,而不是测试是否小于0;
4. 设置的当前文件偏移量大于文件长度时,文件中允许形成空洞,空洞不需要存储空间来存储;
5. 在文件中创建一个空洞:
1 #include "apue.h" 2 #include <fcntl.h> 3 4 char buf1[] = "abcdefghij"; 5 char buf2[] = "ABCDEFGHIJ"; 6 7 int main(void) 8 { 9 int fd;10 11 if ((fd = creat("file.hole", FILE_MODE)) < 0) {12 err_sys("creat error");13 }14 15 if (write(fd, buf1, 10) != 10) {16 err_sys("buf1 write error");17 }18 /*offset now = 10*/19 20 if (lseek(fd, 16384, SEEK_SET) == -1) {21 err_sys("lseek error");22 }23 /*offset now = 16384*/24 25 if (write(fd, buf2, 10) != 10) {26 err_sys("buf2 write error");27 }28 29 exit(0);30 }
read/write函数:
- read函数被用于从打开的文件中读取数据,返回读取的字节数;
- write函数被用于向打开的文件中写数据,返回写入的字节数;
I/O效率:
1. 利用缓冲将标准输入复制到标准输出:
1 #include "apue.h" 2 3 #define BUFFSIZE 4096 4 5 int main(void) 6 { 7 int n; 8 char buf[BUFFSIZE]; 9 10 while ((n = read(STDIN_FILENO, buf, BUFFSIZE)) > 0) {11 if (write(STDOUT_FILENO, buf, n) != n) {12 err_sys("write error");13 }14 }15 if (n < 0) {16 err_sys("read error");17 }18 19 exit(0);20 }
2. Linux ext4文件系统,块大小是4096,缓冲大小最佳值是4096。
文件共享:
1. 内核使用三个数据结构表示打开的文件:
- 每个进程在进程表中都有一个记录项,记录项中包含一张打开文件描述符的表,与每个文件描述符相关联的是: 文件描述符标志和指向文件表项的指针;
- 内核维护一张所有已打开文件的文件表,每个文件表包括:文件状态标志,当前偏移量,指向文件V节点表项的指针;
- 每个已打开文件(或者设备)都有一个V节点结构,Linux只有i节点;
原子操作:
- 任何需要多个函数的操作都不是原子操作;
- 调用pread相当于调用lseek后再调用read, 调用pwrite相当于调用lseek后再调用write,但是调用pread/pwrite是原子操作,且当前文件偏移量不更新;
dup和dup2函数:
- 一个已经存在的文件描述符可以用dup和dup2复制;
- dup返回最小可用文件描述符,dup2用fd2指定新文件描述符,如果fd2已经打开,则先关闭,如果fd2和fd1相等,则直接返回fd2不关闭它;
- dup/dup2总是清除新文件描述的close-on-exec标志;
- dup(fd)/fcntl(fd, F_DUPFD, 0),dup2(fd1, fd2)/close(fd2);fcntl(fd, F_DUPFD, fd2);
sync, fsync和fdatasync函数:
- sysc函数只将所有修改过的缓冲块排在写队列,然后返回,不等写磁盘发生;
- fsync只对fd单一文件起作用,它等磁盘写完成后再返回;
- fdatasync和fsync类似,但是它不同步更新文件属性,fsync同步更新;
未完待续。。。。。
APUE读书笔记:File I/O
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。