首页 > 代码库 > 文档截取

文档截取

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.StringBufferInputStream;

public class 文档截取 {
    
    

    public static void main(String []args)throws IOException{
        File f = new File("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt");//new 一个File类对象
        
        FileInputStream f2=new FileInputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt");
        FileOutputStream fos=new FileOutputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话1.txt"     );
        int a=(int) f.length();//获取文件长度
        byte [] b = new byte[a];//定义一个与文件同长度的数组
        
        f2.read(b);//将数据读入数组    
        String str = new String (b,"UTF-8");
        
    
        
        int c=str.indexOf("<p>央视");//确定开始字段
        int d =str.indexOf("<p class=");//结束字段
        String str1=new String();
        str1=str.substring(c, d);//截取固定范围内字符串
        //System.out.println(str1);//输出显示
        
        //String e=str1.delete(c,d);
        String str2=str1.replace("<p>","");//先将<p>标签去除,成为str2
        String str3=str2.replace("</p>","");//str2的基础上再去除</p>成为str3
        //System.out.println(str3);//输出str3
        
        
        
         byte[]f1 = str3.getBytes();
         fos.write(f1);
            fos.flush();
            
            f2.close();
            fos.close();
        }
    }

 

文档截取