首页 > 代码库 > 字符(字母、数字、中文字符)统计示例

字符(字母、数字、中文字符)统计示例

本文给出一个字符统计的例子。给定一串字符,统计其中字母、数字、中文字符、空格以及其它字符的个数。

在编写程序之前,需要考虑一下,怎样判断一个字符是一个中文字符呢?

基本的 CJK 汉字的 Unicode 码范围是 U4E00~U9FBF, 虽然是还有扩展,但是一般使用这个范围去判断一个字符是否为中文字符已经足够了。所以判断一个字符是否为中文的方法如下:

public static boolean isChineseCharacter(char c) {    return c >= ‘\u4E00‘ && c <= ‘\u9FBF‘;}

至于判断一个字符是否为字母或者数字,我们只需调用Character类中的isLetterisDigit方法即可。

public class CharacterStatictics {     public static void main(String[] args) {         int chineseCharCount = 0;        int spaceCount = 0;        int digitCount = 0;        int lettersCount = 0;        int otherChars = 0;         String value = "Hello world! Welcome to Java world! 1234567890 Java 字符统计个数小程序!";        char[] chars = value.toCharArray();        for (char c : chars) {            if (isChineseCharacter(c)) {                chineseCharCount++;            } else if (Character.isLetter(c)) {                lettersCount++;            } else if (Character.isDigit(c)) {                digitCount++;            } else if (‘ ‘ == c) {                spaceCount++;            } else {                otherChars++;            }        }         System.out.println("中文字符:" + chineseCharCount);        System.out.println("数字:" + digitCount);        System.out.println("字母:" + lettersCount);        System.out.println("空格:" + spaceCount);        System.out.println("其它字符:" + otherChars);     }     private static boolean isChineseCharacter(char c) {        return c >= ‘\u4E00‘ && c <= ‘\u9FBF‘;    } }运行结果:中文字符:9数字:10字母:32空格:8其它字符:3

 

字符(字母、数字、中文字符)统计示例