首页 > 代码库 > 笔记:I/O流-字符集

笔记:I/O流-字符集

Java 库的 java.nio 包用 Charset 类统一了对字符集的转换,支付姐建立了两个字节Unicode码元序列与使用本地字符编码方式的字节序列之间的映射,Charset类使用的时由IANA字符集注册中心标准化的字符集名称,为了兼容其他的命名惯例,每个字符集都可以拥有许多别名,可以调用 aliases 方法返回由别名构成的 Set 对象,示例代码如下:

Charset charset = Charset.forName("utf-8");

????????????????System.out.println("utf-8 charset");

????????????????Set<String> aliases = charset.aliases();

????????????????for (String a : aliases) {

????????????????????????System.out.println("aliase is " + a);

????????????????}

为了确定在某个特定实现中哪些字符集是可用的,可以调用静态方法 avaliableCharsets 方法,示例代码如下:

Map<String, Charset> charsetMap = Charset.availableCharsets();

?????????for (String c : charsetMap.keySet()) {

????????????? System.out.println(c);

??????? }

如果某个字符不能被字符集表示,他将被转换为?,一旦有了字符集就可以使用他在包含Unicode码元的Java 字符串和编码而成的字节序列之间进行转换,下面是如何编码Java 字符串的代码:

????????String str = "受到法律框架dsfjkl23";

????????// 编码字符串到Byte数组

????????ByteBuffer buffer = charset.encode(str);

??????? byte[] bytes = buffer.array();

????????for (byte b : bytes) {

???????????????System.out.print(Integer.toHexString(b & 0xff) + " ");

????????}

??????? System.out.println();

????????// 将Byte数组解码为字符串

????????ByteBuffer decodeBuffer = ByteBuffer.wrap(bytes);

????????CharBuffer charBuffer = charset.decode(decodeBuffer);

????????System.out.println(charBuffer.toString());

??

笔记:I/O流-字符集