首页 > 代码库 > Java处理大文件

Java处理大文件

  对于小文件中的内容,在进行处理的时候,可以简单地将其全部加载到内存中,而后进行处理:

        /**
         * 将文件内容全部读取到内存中
         */
        try {
            List<String> list = FileUtils.readLines(new File(fileDerec), Charsets.UTF_8);
            System.out.println(list.get(0));
        } catch (IOException e) {
            e.printStackTrace();
        }

  但是处理大文件(GB级)时,如果简单地将其加载到内存中,可能会导致内存溢出。所以通常会用以下的办法对其进行处理:

        /**
         * java.util.*文件流处理
         */
        FileInputStream fi = null;
        Scanner sc = null;
        try {
            fi = new FileInputStream(new File(fileDerec));
            sc = new Scanner(fi, "UTF-8");
            if (sc.hasNextLine()) {
                System.out.println(sc.nextLine());
            }
        } catch (Exception e) {
        } finally {
            if (fi != null) {
                try {
                    fi.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            if (sc != null) {
                sc.close();
            }
        }

  也可以使用第三方使用的包:

        /**
         * Apache-commons-io提供的流处理
         */
        LineIterator li = null;
        try {
            li = FileUtils.lineIterator(new File(fileDerec), "UTF-8");
            if (li.hasNext()) {
                System.out.println(li.next());
            }
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } finally {
            LineIterator.closeQuietly(li);
        }

 

Java处理大文件