首页 > 代码库 > Java--正则表达式

Java--正则表达式

最近做了一个Java实验,下面是实验要求:

实验类型:验证性 
实验目的:掌握Java 语言的字符串处理、文本文件的读写 
实验内容: 
Java 语言共有 50 个关键字(自行查找相关文档),已知 Java 源程序是以“.java”为
扩展名的文本文件。可以考虑在 Java源程序中共有 3 类元素: 
<1> 代码行,可运行的 Java源代码; 
<2> 注释行,3种注释均可; 
<3> 空行,既无代码,也无注释; 
编写一个类名为 JavaCodeAnalyzer的类,实现以下功能: 
<1> 该类可以以一个 Java 源程序文件名创建一个对象,如果文件不存在,或扩展名不
是“.java”,应提示文件错误; 
<2> 对该源程序文件进行分析其中的:代码行数、注释行数和空行数。说明:行是指以
回车结束的。 
<3> 统计并按从多到少输出出现次数最多的 5个关键字及其出现次数。

<4> 统计分析的结果输出到名为:result.txt 的文本文件中,
 
分析XXXXX.java 源程序的结果: 
代码行数:xxx,占xx.xx% 
注释行数:xxx,占xx.xx% 
空白行数:xxx,占xx.xx% 
源程序总行数:xxxx 
出现最多的5个关键字是: 
关键字1:xx次 
关键字2:xx次 
关键字3:xx次 
关键字4:xx次 
关键字5:xx次 
分析时间:年-月-日,时-分-秒

在这次实验中,要用到String类中的matches()方法,进而要用到正则表达式。坦率来说,对正则表达式的运用是一头雾水,不知如何下手。经过调试和请教,对于一般的正则表达式可能看懂。为了加深理解,下面来介绍一下正则表达式。

所谓的正则表达式,是对字符串操作的一种逻辑公式。用预先定义好的一些特殊字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

下面来说一些基本的正则表达式的构造:

常用到的是字符类

构造                         匹配

字符类
[abc]ab 或 c(简单类)
[^abc]任何字符,除了 ab 或 c(否定)
[a-zA-Z]a 到 z 或 A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]]a 到 d 或 m 到 p[a-dm-p](并集)
[a-z&&[def]]de 或 f(交集)
[a-z&&[^bc]]a 到 z,除了 b 和 c[ad-z](减去)
[a-z&&[^m-p]]a 到 z,而非 m 到 p[a-lq-z](减去)

预定义字符类
.任何字符(与行结束符可能匹配也可能不匹配)
\d数字:[0-9]
\D非数字: [^0-9]
\s空白字符:[ \t\n\x0B\f\r]
\S非空白字符:[^\s]
\w单词字符:[a-zA-Z_0-9]
\W非单词字符:[^\w]

我的代码:

 

/*
 * To change this template, choose Tools | Templates
 * and open the template in the editor.
 */
package javaanalize;

import java.io.FileNotFoundException;
import java.util.*;
import javax.swing.*;

public class JavaAnalize {

    public static void main(String[] args) throws FileNotFoundException {
        JavaCodeAnalyzer it = new JavaCodeAnalyzer();
        it.lineAnalyze();
        it.writeFile();
    }
}

class JavaCodeAnalyzer {

    private int codeLineNum;
    private int commentLineNum;
    private int spaceLineNum;
    private int allLine;
    int[] wordNumber = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0};
    String[] keyword = {"abstract", "boolean", "break", "byte", "case", "catch", "char", "class", "continue", "default",
        "do", "double", "else", "extends", "false", "final", "finally", "float", "for", "if", "implements", "import",
        "instanceof", "int", "interface", "long", "native", "new", "null", "package", "private",
        "protected", "public", "return", "short", "static", "super", "switch", "synchronized", "this", "throw", "throws",
        "transient", "true", "try", "void", "volatile", "while", "goto", "const"};
    Calendar date = new GregorianCalendar();
    java.io.File file = new java.io.File("");

    public void lineAnalyze() throws FileNotFoundException {
        JFileChooser fileChooser = new JFileChooser();

        if (fileChooser.showOpenDialog(null) == JFileChooser.APPROVE_OPTION) {
            file = fileChooser.getSelectedFile();
        } else {
            System.out.println("没有选择文件");
            System.exit(0);
        }
        if (file.getName().matches("[^\\s]+java")) {
            System.out.println("The file " + file.getName() + " is exist!");
        } else {
            JOptionPane.showMessageDialog(null, "文件类型不正确, 请重新选择!谢谢!");
            System.exit(0);
        }
        Scanner input = new Scanner(file);
        boolean comment = false;
        while (input.hasNextLine()) {
            String lineData = http://www.mamicode.com/input.nextLine();
            allLine++;
            if (comment) {
                commentLineNum++;
                if (lineData.matches(".*\\*/\\s*")) {
                    comment = false;
                }
            } else {
                if (lineData.matches("\\s*")) {
                    spaceLineNum++; //空白行加1 
                } else if (lineData.matches("\\s*/\\*.*")) {
                    commentLineNum++;//注释行加1 
                    comment = true;
                    if (lineData.matches(".*\\*/\\s*")) {
                        comment = false;
                    }
                } else if (lineData.matches("\\s*//.*")) {
                    commentLineNum++;
                } else {
                    codeLineNum++;//代码行加1 
                    String[] s = lineData.split("[^$_0-9a-zA-Z]");
                    for (int i = 0; i < keyword.length; i++) {
                        for (int j = 0; j < s.length; j++) {
                            if (keyword[i].equals(s[j])) {
                                wordNumber[i]++;
                            }
                        }
                    }
                }
            }
        }
        System.out.println("注释行:" + commentLineNum);
        System.out.println("空行 :" + spaceLineNum);
        System.out.println("代码行 :" + codeLineNum);
        System.out.println("全部行 :" + allLine);
    }

    public void writeFile() throws FileNotFoundException {
        double temp = 0;
        int j = 0, n = 0;
        java.io.File file1 = new java.io.File("result.txt");
        if (file1.exists()) {
            file1.delete();
        }
        java.io.PrintWriter put = new java.io.PrintWriter(file1);
        put.println("分析" + file.getName() + "源程序的结果:");
        temp = 100 * codeLineNum / allLine;
        put.println("代码行数:" + codeLineNum + ",占" + temp + "%");
        temp = 100 * commentLineNum / allLine;
        put.println("注释行数:" + commentLineNum + ",占" + temp + "%");

        temp = 100 * spaceLineNum / allLine;
        put.println("空白行数:" + spaceLineNum + ",占" + temp + "%");
        put.println("源程序总行数:" + allLine);
        put.println("出现最多的5个关键字:");
        for (int m = 0; m < 5; m++) {
            for (n = 0; n <= keyword.length; n++) {
                if (wordNumber[j] <= wordNumber[n]) {
                    j = n;
                }
            }
            if (wordNumber[j] == 0) {
                put.println("其他关键字数都为0个!");
                break;
            }
            put.println("关键字" + keyword[j] + " : " + wordNumber[j] + "次");
            wordNumber[j] = -1;
            j = 0;
        }
        put.print("分析时间:" + date.get(Calendar.YEAR) + "-" + date.get(Calendar.MONTH) + "-" + date.get(Calendar.DATE));
        put.println("," + date.get(Calendar.HOUR) + "-" + date.get(Calendar.MINUTE) + "-" + date.get(Calendar.SECOND));
        put.close();
        
    }
}

选择文件

 

如果文件类型不正确