首页 > 代码库 > UNIX环境编程学习笔记(2)——不带缓冲的 I/O
UNIX环境编程学习笔记(2)——不带缓冲的 I/O
lienhua34
2014-08-25
1 文件描述符
对于内核而言,所有打开的文件都通过文件描述符引用。文件描述符是一个非负整数。当打开一个现有文件或创建一个新文件时,内核向进程返回一个文件描述符。当读或写一个文件时,使用 open 或 creat 返回的文件描述符标识该文件,将其作为参数传送给 read 或 write。
按照惯例,UNIX 系统 shell 使用文件描述符 0 与进程的标准输入相关联,文件描述符 1 与进程的标准输出相关联,文件描述符 2 与进程的标准出错输出相关联。
2 不带缓冲的 I/O 函数
术语不带缓冲指的是每个 read 或 write 都调用内核中的一个系统调用。这些不带缓冲的 I/O 函数不是 ISO C 的组成部分,但是,它们是POSIX.1 和 Single UNIX Specification 的组成部分。下面分别来说明一下5 个基本的函数:open、read、write、lseek 以及 close。
2.1 open 函数
调用 open 函数可以打开或者创建一个文件。
#include <fcntl.h>
int open(const char *pathname, int oflag, ... /* mode_t mode */);
返回值:若成功则返回文件描述符,若出错则返回-1.
其中第三个参数... 表明余下的参数的数量及其类型根据具体的调用会有所不同。对于 open 函数而言,仅当创建新文件时才使用第三个参数。pathname 是要打开或创建文件的名字。oflag 参数用于说明此函数的多个选项。用下列一个或多个常量进行“或”运算构成 oflag 参数(这些常量定义在 <fcntl.h> 头文件中)。
O_RDONLY 只读打开
O_WRONLY 只写打开
O_RDWR 读、写打开
这三个常量中必须指定一个且只能指定一个。下列常量则是可选的:
O_APPEND 每次写时都追加到文件的尾端。
O_CREAT 若文件不存在,则创建它。使用此选项时,需要第三个参数 mode,用于指定该新文件的访问权限位。
O_EXCL 如果同时指定了O_CREAT,而文件已经存在,则会出错。用此可以测试一个文件是否存在,如果不存在,则创建此文件。
O_TRUNC 如果此文件存在,而且为只写或者读写成功打开,则将其长度截短为 0.
O_NOCTTY 如果 pathname 指的是终端设备,则不将该设备分配为此进程的控制终端。
O_NONBLOCK 如果指的是一个 FIFO、一个块特殊文件或一个字符特殊文件,则此选项为文件的本地打开操作和后续的 I / O 操作设置非阻塞模式。
例1:
下面程序以只读的方式打开文件 foo.txt,并设置 open 函数的O_CREAT和O_EXCL 选项。
#include <fcntl.h>#include <stdlib.h>#include <stdio.h>intmain(void){ int fd; if ((fd = open("foo.txt", O_RDONLY | O_CREAT | O_EXCL,S_IRUSR | S_IWUSR | S_IRGRP)) == -1) { printf("open error\n"); } else { printf("open success\n"); } exit(0);}
编译该程序,生成open_demo,然后执行它,其结果如下:
lienhua34:demo$ gcc -o open_demo open_demo.clienhua34:demo$ lsopen_demoopen_demo.clienhua34:demo$ ./open_demoopen successlienhua34:demo$ ls -l foo.txt-rw-r----- 1 lienhua34 lienhua34 08月 19 22:56 foo.txtlienhua34:demo$ ./open_demoopen error
当指定了O_CREAT 选项时,第三个参数取下面列表中的这些常量的“或”运算结果用于指定新文件的访问权限(这些常量定义在 <sys/stat.h>中)。
S_IRUSR | 用户 -读 |
S_IWUSR | 用户 -写 |
S_IXUSR | 用户 -执行 |
S_IRGRP | 组 -读 |
S_IWGRP | 组 -写 |
S_IXGRP | 组 -执行 |
S_IROTH | 其他 -读 |
S_IWOTH | 其他 -写 |
S_IXOTH | 其他 -执行 |
由 open 返回的文件描述符一定是最小的未用描述符数值。这一点可用于在标准输入、标准输出或标准出错输出上打开新的文件。
open 函数的 oflag 参数还支持三个可选常量,他们是 Single UNIXSpecification 中同步输入和输出选项的一部分。
O_DSYNC 使每次 write 等待物理 I/O 操作完成,但是,如果写操作并不影响读取刚写入的数据,则不等待文件属性被更新。
O_RSYNC 使每一个以文件描述符作为参数的 read 操作等待,直至任何对文件同一部分进行的未决写操作都完成。
O_SYNC 使每次 write 都等待物理 I/O 操作完成,包括由 write 操作引起的文件属性更新所需的I/O。
当文件用O_DSYNC 标志打开时,在重写其现有的部分内容时,文件时间属性不会同步更新。与此相反,如果文件是用O_SYNC 标志打开时,那么对该文件的每一次 write 操作都将在 write 返回之前更新文件时间。
2.2 creat 函数
可调用 creat 函数创建一个新文件。
#include <fcntl.h>
int creat(const char *pathname, mode_t mode);
返回值:若成功则返回以只写打开的文件描述符,若出错则返回-1.
此函数等效于:
open(pathname, O_WRONLY | O_CREAT | O_TRUNC, mode);
creat 函数的一个不足之处是它以只写方式打开所创建的文件。之所以存在creat 函数,是因为早期的 UNIX 系统中,open 函数的第二个参数只能是0、1 或 2。没有办法打开一个尚未存在的文件,于是需要 creat 函数来创建新文件。现在 open 函数支持O_CREAT 选项之后,creat 函数就没有存在的必要了。
2.3 close 函数
调用 close 函数关闭一个打开的文件。
#include <unistd.h>
int close(int filedes);
返回值:若成功则返回0,若出错则返回-1.
当一个进程终止时,内核自动关闭它所有打开的文件。
2.4 read 函数
调用 read 函数从打开的文件中读数据。
#include <unistd.h>
ssize_t read(int filedes, void *buf, size_t nbytes);
返回值:若成功则返回读到的字节数,若已到文件结尾则返回0,若出错则返回-1.
读操作从文件的当前偏移量处开始,在成功返回之前,该偏移量将增加实际读到的字节数。
2.5 write 函数
调用 write 函数想打开的文件写数据。
#include <unistd.h>
ssize_t write(int filedes, const void *buf, size_t nbytes);
返回值:若成功则返回已写的字节数,若出错则返回-1.
对于普通文件,写操作从文件的当前偏移量处开始。如果在打开该文件时,制定了O_APPEND 选项,则在每次写操作之前,将文件偏移量设置在文件的当前结尾处。在一次成功写之后,该文件的偏移量增加实际写的字节数。
2.6 lseek 函数
调用 lseek 显示地为一个打开的文件设置其偏移量。
#include <unistd.h>
off_t lseek(int filedes, off_t offset, int whence);
返回值:若成功则返回新的文件偏移量,若出错则返回-1.
每个打开的文件都有一个与其关联的“当前文件偏移量”。它通常是一个非负整数,用以度量从文件开始处计算的字节数。按系统默认的情况,当打开一个文件时,除非指定O_APPEND 选项,否则该偏移量被设置成 0.
对 lseek 函数的 offset 参数的解释与参数 whence 的值有关。
• 若 whence 是SEEK_SET,则将该文件的偏移量设置为距离文件开始处offset 个字节。
• 若 whence 是SEEK_CUR,则将该文件的偏移量设置为其当前值加 offset,offset 可为正或负。
• 若 whence 是SEEK_END,则将该文件的偏移量设置为文件长度家 offset,offset 可为正或负。
管道、FIFO 和网络套接字都不支持设置偏移量,如果一个文件描述符引用的是这三者之一,则 lseek 函数返回 -1,并将 errno 设置为 ESPIPE。对于普通文件,其偏移量只能是非负值。但是,某些设置可能支持负的偏移量。所以,在比较 lseek 函数的返回值时应当谨慎,不要测试它是否小于 0,而要测试它是否等于 -1.
文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个空洞。位于文件中但没有写过的字节都被读为 0.
实例:
下面程序创建一个新文件 file.hole,先在文件开始处写入“abcd”,然后将文件偏移量移动到距离开始处的 10 字节处,在该处写入“ABCD”,则在文件 file.hole 从第 4 个字节处到第 9 个字节之间就形成了一个空洞。
#include <stdlib.h>#include <stdio.h>#include <fcntl.h>#include <unistd.h>char buf1[] = "abcd";char buf2[] = "ABCD";intmain(void){ int fd; if ((fd = open("file.hole", O_WRONLY | O_CREAT | O_TRUNC,S_IRUSR | S_IWUSR | S_IRGRP)) < 0) { printf("open error"); } if (write(fd, buf1, 4) != 4) { printf("write buf1 error"); } if (lseek(fd, 10, SEEK_SET) == -1) { printf("lseek error"); } if (write(fd, buf2, 4) != 4) { printf("write buf2 error"); } exit(0);}
编译该程序,生成文件 writedemo,然后执行 writedemo 文件,
lienhua34:demo$ gcc -o writedemo write_demo.clienhua34:demo$ ./writedemolienhua34:demo$ ls -l file.hole-rw-r----- 1 lienhua34 lienhua34 14 8月 20 21:37 file.holelienhua34:demo$ od -c file.hole0000000 a b c d \0 \0 \0 \0 \0 \0 A B C D000001
UNIX环境编程学习笔记(2)——不带缓冲的 I/O