首页 > 代码库 > java中的URLEncoder和URLDecoder类的联系与区别
java中的URLEncoder和URLDecoder类的联系与区别
今天碰到了这个问题,就查找了些资料总结下:java中的URLEncoder和URLDecoder类的联系与区别。
首先说这两者的联系与区别:
URLEncoder是编码,URLDecoder是解码。两者的转换过程刚好是相反的。URLEncoder该类包含了将 String 转换为 application/x-www-form-urlencoded
MIME 格式的静态方法;URLDecoder该类包含了将 String 从 application/x-www-form-urlencoded
MIME 格式解码的静态方法。主要是解决乱码的问题,乱码的出现很大的可能性是编码和解码出现了问题。
java.net 类 URLEncoder
java.lang.Object java.net.URLEncoder
HTML 格式编码的实用工具类。该类包含了将 String 转换为 application/x-www-form-urlencoded
MIME 格式的静态方法。
对 String 编码时,使用以下规则:
字母数字字符 "
a
" 到 "z
"、"A
" 到 "Z
" 和 "0
" 到 "9
" 保持不变。特殊字符 "
.
"、"-
"、"*
" 和 "_
" 保持不变。空格字符 "
+
"。所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "
%xy
" 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。
例如,使用 UTF-8 编码机制,字符串 "The string ü@foo-bar" 将转换为 "The+string+%C3%BC%40foo-bar",因为在 UTF-8 中,字符 ü 编码为两个字节,C3 (十六进制)和 BC (十六进制),字符 @ 编码为一个字节 40 (十六进制)。
从以下版本开始:
JDK1.0
URLEncoder类中的encode方法——编码
public static String encode(String s, String enc) throws UnsupportedEncodingException
使用指定的编码机制将字符串转换为
application/x-www-form-urlencoded
格式。该方法使用提供的编码机制获取不安全字符的字节。注:World Wide Web Consortium Recommendation 声明应使用 UTF-8。如果不使用该编码,可能造成不兼容性。
参数:
s
- 要转换的String
。enc
- 所支持的字符编码名称。返回:
已转换的
String
。抛出:
UnsupportedEncodingException
- 如果不支持指定的编码从以下版本开始:
1.4
java.net 类 URLDecoder
java.lang.Object java.net.URLDecoder
HTML 格式解码的实用工具类。该类包含了将 String 从
application/x-www-form-urlencoded
MIME 格式解码的静态方法。
该转换过程正好与 URLEncoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一:"a
" 到
"z
"、"A
" 到 "Z
"、"0
" 到
"9
" 和 "-
"、"_
"、".
" 以及
"*
"。允许有 "%
" 字符,但是将它解释为特殊转义序列的开始。
转换中使用以下规则:
字母数字字符 "
a
" 到 "z
"、"A
" 到 "Z
" 和 "0
" 到 "9
" 保持不变。特殊字符 "
.
"、"-
"、"*
" 和 "_
" 保持不变。加号 "
+
" 转换为空格字符 "将把 "
%xy
" 格式序列视为一个字节,其中 xy 为 8 位的两位十六进制表示形式。然后,所有连续包含一个或多个这些字节序列的子字符串,将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制,或者如果未指定的话,则使用平台的默认编码机制。
该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符,另一种方法是抛出 IllegalArgumentException
异常。解码器具体采用哪种方法取决于实现。
从以下版本开始:
1.2
URLDecoder中的decode方法——解码
public static String decode(String s, String enc) throws UnsupportedEncodingException
使用指定的编码机制对
application/x-www-form-urlencoded
字符串解码。给定的编码用于确定任何 "%xy
" 格式的连续序列表示的字符。注:World Wide Web Consortium Recommendation 声明应使用 UTF-8。如果不使用该编码,可能造成不兼容性。
参数:
s
- 要解码的String
enc
- 所支持的字符编码的名称。返回:
新解码的
String
抛出:
UnsupportedEncodingException
- 如果需要参考字符编码,而指定的字符编码不被支持从以下版本开始:
1.4
以上是学习笔记,不足之处请各位大神指点。
本文出自 “忘忧草” 博客,请务必保留此出处http://qinglongleijun.blog.51cto.com/9625764/1582112
java中的URLEncoder和URLDecoder类的联系与区别