首页 > 代码库 > 文件操作
文件操作
在电脑上打开文件的操作:
1.打开文件
2.读取,修改等操作文件
3.关闭文件
对文件操作流程
- 打开文件,得到文件句柄并赋值给一个变量
- 通过句柄对文件进行操作
- 关闭文件
打开文件的语法:
open(file, mode=‘r‘, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
file为文件相对路径或名称,mode为读取操作的模式(见下文),encoding是对字符编码的操作设置。
在window上环境下打开文档,使用的操作系统的默认字符编码,windows操作系统的默认字符编码是GBK,因此需要对在open()的时候指定encoding=‘utf-8‘。
1 data=http://www.mamicode.com/open(‘yesterday‘,encoding=‘utf-8‘).read() 2 print(data) 3 #一次性输出文件的所有内容
想要在打开文件后对文件进行更多的操作,需要将打开的文件内存对象赋一个变量。然后,再通过找到该文件对象,对文件进行操作。
一般情况下,文件名的对象取名为‘f‘.
1 f = open(‘yesterday‘,encoding=‘utf-8‘) #文件句柄——就是这个文件的内存对象。文件句柄内包含该文件的文件名,字符集,大小,在内存上的起始位。 2 data =http://www.mamicode.com/f.read() 3 data2=f.read() 4 print(data) 5 print(‘DATA2‘.center(50,‘-‘),data2)
返回的是第一遍的文件输出,以及格式化的”DATA2“。
print(‘DATA2‘.center(50,‘-‘),data2) 并未重新返回文件内容。
原因在于:文件中有文件指针(相当于文档中的光标,它是按字符位向后移动)
文件最初打开开始,从第一行开始读取文件内容,读完以后,不会重头开始,文件的读取指针还是停留在末尾。
如果需要重新阅读该文件,将文件指针移回相应的位置即可(如头)。
打开文件,想要对文件进行各种操作,需要指定打开文件的模式,即设置mode.
下面介绍所有的模式:
打开文件的模式有:
- r,只读模式(默认)。 __read
- w,只写模式。【不可读;不存在则创建;存在则删除内容;】——注意:不要随便使用该模式,如果不熟悉,请使用备份文件!!!!___write
- a,追加模式。【不可读; 不存在则创建;存在则只追加内容;】___append
"+" 表示可以同时读写某个文件
- r+,可读写文件。【可读;可写;可追加】
- w+,写读
- a+,同a
"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)
- rU
- r+U
"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)
- rb
- wb
- ab
关于打开的读取方式:
f.read()是将所有的行都读到内存中去,f.readline()是一行一行的读取。
1 #打印前5行 2 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 3 ‘‘‘方法1: 4 print(f.readline()) 5 print(f.readline()) 6 print(f.readline()) 7 print(f.readline()) 8 print(f.readline()) 9 ‘‘‘ 10 11 #方法2: 12 for i in range(5): 13 print(f.readline())
而f.readlines()返回的是一个包含所有行的列表:
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.readlines()) 3 [out]:[‘Somehow, it seems the love I knew was always the most destructive kind\n‘, ‘不知为何,我经历的爱情总是最具毁灭性的的那种\n‘, ‘Yesterday when I was young\n‘, ‘昨日当我年少轻狂\n‘, ... ‘The time has come for me to pay for yesterday\n‘, ‘终于到了付出代价的时间 为了昨日\n‘, ‘When I was young\n‘, ‘当我年少轻狂‘]
由于f.readlines()是先把所有的行加载到内存中,存入到对象中作为一个列表再进行操作。由于从硬盘读取速度远远低于内存读取速度,因此,f.readlines()仅支持小文件操作。
适合大文件操作的读取方式,是一行一行地读取到内存中,操作(动作)完成后就在内存中删除该行,保持内存中永远不会堆积文件。
1 count=0 #计数器 2 for line in f: #最佳读取方式,打印只保存一行。f是迭代器 3 if count==9: 4 print(‘我是分割线‘.center(100,‘-‘)) 5 count += 1 6 continue 7 print(line) 8 count+=1
文件光标 f.tell():
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.tell()) #打印光标所处位置 3 print(f.readline().strip()) 4 print(f.tell()) #打印当前光标所处位置,上面读取了一行的,故光标固定在了第一行的末尾,即“kind\n”之后。 5 f.close()
返回:
如果只想读取5个字符数,则:
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.tell()) 3 print(f.read(5)) 4 print(f.tell()) 5 f.close()
返回:
f.seek()是重新指定光标位置的函数:
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.tell()) 3 print(f.readline()) 4 print(f.readline()) 5 print(f.tell()) 6 f.seek(0) #重新定位光标到位置0 7 print(f.readline()) 8 print(f.tell()) 9 f.close()
返回:
f.encoding() 打印文件的编码
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.encoding) 3 f.close()
返回:
f.fileno() 返回整数的底层实现使用请求从操作系统的I / O操作的文件描述符。
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.fileno()) #返回整数的底层实现使用请求从操作系统的I / O操作的文件描述符。 3 ##操作系统会有专门的接口去调度所有文件,返回的是在内存中的编号。 4 f.close()
返回:
f.isatty() 判断读取的文件是否为tty(终端设备)
打印机,linux下的terminal等都属于终端设备。
1 f=open(‘lyrics.txt‘,‘r‘,encoding=‘utf-8‘) 2 print(f.isatty()) #判断读取的该文件是否为tty(终端设备) 3 f.close()
在tty文件上无法移动光标,f.seekable()用来判断文件是否可以进行光标的定位。
f.readable() 判断文件是否可读;
f.writable() 判断文件是否可写。
f.flush() 强制刷新
文件读写有一个缓存的机制,一般情况下是内存中的数据大小达到限定的大小,会写入硬盘中;如果操作没有成功从内存中写入到硬盘中,可以使用f.flush()进行强制刷新。
f.buffer 是内存中的一个临时文件,
文件操作