首页 > 代码库 > JAVA的IO学习
JAVA的IO学习
IO 有具体的分类: 有具体的分类:
1:根据处理的数类型不同:字节流和字符流。
2:根据流向不同:输入流和输出流。
=============(补充字节跟字符概念区分)==============================
字符:可使用多种不同字符方案或代码页来表示的抽象实体。例如,Unicode UTF-16 编码将字符表示为 16 位整数序列,而Unicode UTF-8 编码则将相同的字符表示为 8 位字节序列。公共语言运行库使用 Unicode UTF-16(Unicode 转换格式,16位编码形式)表示字符。
字节:字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。
一个英文字母占一个字节的空间,一个中文汉字占两个字节的空间.
符号:英文标点占一个字节,中文标点占两个字节.
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为:
字符 人们使用的记号,抽象意义上的一个符号。 ‘1‘, ‘中‘, ‘a‘, ‘$‘, ‘¥‘, ……
字节 计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。 0x01, 0x45, 0xFA, ……
==============================================================
字符流的由来:
因为文件编码的不同,而有了对字符进行高效操作流象。 原理:其实就是基于字节流读取时,去查了指定的码表。
字节流和字符流的区别:
1,字节流读取的时候,到一个就返回。
字符流使用了字节流读到一个或多个字节,去查指定的编码表,将查到的字符返回。
2,字节流可以处理所有类型数据如图片mp3、avi等。
而字符流只能处理字符数据。
结论:只要是纯文本数据,都要优先考虑字符流来处理。其他的都要使用字节流。
----------------------------------------------------------------------
IO体系,具备的功能就只有两个:读写
字节流的处理方式:
InputStream、OutputStream
字符流的处理方式:
Reader、Writer
.字符流与字节流转换
转换流的特点:
- 其是字符流和字节流之间的桥梁
- 可对读取到的字节数据经过指定编码转换成字符
- 可对读取到的字符数据经过指定编码转换成字节
何时使用转换流?
- 当字节和字符之间有转换动作时;
- 流操作的数据需要编码或解码时。
具体的对象体现:
- InputStreamReader:字节到字符的桥梁
- OutputStreamWriter:字符到字节的桥梁
这两个流对象是字符体系中的成员,它们有转换作用,本身又是字符流,所以在构造的时候需要传入字节流对象进来。
Buffered开头的流只是加了缓冲区,为了读写提高效率。字符流不能直接输出,需要转换成字节流才能输出(这个确实是刚知道的)!
Java 2 SDK中有三种基本类型的节点:文件(file)、内存(memory)、管道(pipe)。
File类
File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。 File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名,判断指定文件是否存在、获得当前目录中的文件列表,创建、删除文件和目录等方法。
RandomAccessFile类
该对象并不是流体系中的一员,其封装了字节流,同时还封装了一个缓冲区(字符数组),通过内部的指针来操作字符数组中的数据。 该对象特点:
- 该对象只能操作文件,所以构造函数接收两种类型的参数:a.字符串文件路径;b.File对象。
- 该对象既可以对文件进行读操作,也能进行写操作,在进行对象实例化时可指定操作模式(r,rw)
注意:该对象在实例化时,如果要操作的文件不存在,会自动创建;如果文件存在,写数据未指定位置,会从头开始写,即覆盖原有的内容。 可以用于多线程下载或多个线程同时写数据到文件。
----------------------------------------------------------------------
读一个文本文件并打印:
1 package comz; 2 3 import java.io.File; 4 import java.io.FileReader; 5 import java.io.IOException; 6 7 public class T { 8 public static void main(String[] args) throws IOException { 9 FileReader r = new FileReader(new File("d:\\a.txt"));10 char[] cs = new char[500];11 int len = 0;12 int count = 0;13 while ((len = r.read(cs)) != -1) {14 count++;15 System.out.println(new String(cs, 0, len));16 }17 r.close();18 System.out.println(count);19 }20 }
处理字符流的时候,使用的是char数组,在处理字节流的时候,使用的是byte数组
1 FileInputStream fis = new FileInputStream(new File("d:\\a.txt")); 2 byte[] ss = new byte[1024]; 3 while (true) { 4 int c = fis.read(ss); 5 if (c == -1) {// 到达结尾 6 break; 7 } else { 8 System.out.println(new String(ss)); 9 }10 }
--------------------------------------
字节流可以处理任意的文件。比如说我们要copy一个图片,那么可以
1 import java.io.BufferedInputStream; 2 import java.io.BufferedOutputStream; 3 import java.io.File; 4 import java.io.FileInputStream; 5 import java.io.FileOutputStream; 6 import java.io.FileReader; 7 import java.io.IOException; 8 9 public class JavaIO {10 public static void main(String[] args) throws IOException {11 12 BufferedInputStream bufin=new BufferedInputStream(new FileInputStream("d:\\b.jpg"));13 BufferedOutputStream bufout=new BufferedOutputStream(new FileOutputStream("d:\\c.jpg"));14 15 int byt=0;16 while((byt=bufin.read())!=-1)17 {18 bufout.write(byt);19 20 }21 bufin.close();22 bufout.close();23 24 }25 }
看bufferedinputstream的源码,
可以知道,虽然我们没有设置buffer的大小,这里默认了就是8192个byte了。
--------------------------------------
面是一个比较有意思的点。
---------------
在java的IO系统中,除了字节流和字符流之外,还存在把二者相互转换的功能。
具体就体现在:
InputStreamReader和OutputStreamWriter
这二者是字符流体系中的成员。
他们本身就是字符流,而又有转换功能,所以在构造的时候要传入字节流作为参数。
看二者的构造函数:
他们的构造函数都是传入一个字节流作为参数。
当然二者还有其他的构造函数,可以指定编码表等。
操作文件的字符流对象,是这些转换类的子类。看以下类结构:
转换流已经完成了编码转换的工作。所以对于直接操作文本文件的filereader来说,就不用再重新定义了!
所以,需要注意,在对文本文件进行操作的时候,是使用filereader,则使用的是默认编码表。如果要自己制定编码表,则必须使用转换流。
比如说,FileReader r = new FileReader(new File("d:\\a.txt"));
操作这个文件的时候使用的是系统默认的GBK编码。
如果a.txt中的数据是通过utf8编码的,那么就必须这样子来用:
InputStreamReader r=new InputStreamReader(new FileInputStream(new File("d:\\a.txt")),"UTF-8");
----------------------------------------
用于合并多个流的sequenceinputstream:
1 import java.io.File; 2 import java.io.FileInputStream; 3 import java.io.FileOutputStream; 4 import java.io.IOException; 5 import java.io.InputStream; 6 import java.io.SequenceInputStream; 7 import java.util.ArrayList; 8 import java.util.Collections; 9 import java.util.Enumeration;10 11 public class SequenceInputstream {12 public static void main(String[] args) throws IOException {13 ArrayList<InputStream> al = new ArrayList<InputStream>(); //字节流14 15 al.add(new FileInputStream("d:\\" + 2 + ".txt"));16 al.add(new FileInputStream("d:\\" + 3 + ".txt"));17 al.add(new FileInputStream("d:\\" + 1 + ".txt"));18 19 Enumeration<InputStream> en = Collections.enumeration(al); //为参数生成一个旧式的Enumeration20 SequenceInputStream sis = new SequenceInputStream(en);// 将三个数据源合并到一个数据源,字节流21 22 FileOutputStream fos = new FileOutputStream(new File("d:\\5.txt"));23 24 int len = 0;25 byte[] bu = new byte[1024];26 while ((len = sis.read(bu)) != -1) {27 fos.write(bu, 0, len);28 }29 30 sis.close();31 fos.close();32 33 }34 }
--------------------
下面看一下DateInputStream。
--------------------
下面看一下DateInputStream。
在实习的时候做过C#版本的一个东西,内容就是使用流将界面上操作的东西保存起来。内容就是每次都保存一个int或者double或者是字符等。与DateInputStream的功能类似。
---------------------------------------------
这些操作数组的流对象,数据的源是内存,目的也是内存。
所以这些流在使用的时候不需要close。这几个流的出现,实际上就是以流的思想来操作数组而已。
-----------------------------
编码问题
tomcat服务器的默认编码是iso8859-1
-------------------------------
数据使用了什么样的编码方式进行编码,就需要用什么样的编码方式进行解码
JAVA的IO学习