java中的URLEncoder和URLDecoder类的联系与区别

首页 > 代码库 > java中的URLEncoder和URLDecoder类的联系与区别

java中的URLEncoder和URLDecoder类的联系与区别

2024-08-04 04:54:24 219人阅读

今天碰到了这个问题，就查找了些资料总结下：java中的URLEncoder和URLDecoder类的联系与区别。

首先说这两者的联系与区别：

URLEncoder是编码，URLDecoder是解码。两者的转换过程刚好是相反的。URLEncoder该类包含了将 String 转换为 application/x-www-form-urlencoded MIME 格式的静态方法；URLDecoder该类包含了将 String 从 application/x-www-form-urlencoded MIME 格式解码的静态方法。主要是解决乱码的问题，乱码的出现很大的可能性是编码和解码出现了问题。

java.net 类 URLEncoder

java.lang.Object
  java.net.URLEncoder

HTML 格式编码的实用工具类。该类包含了将 String 转换为 application/x-www-form-urlencoded MIME 格式的静态方法。

对 String 编码时，使用以下规则：

字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
空格字符 " " 转换为一个加号 "+"。
所有其他字符都是不安全的，因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示，其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是，出于兼容性考虑，如果未指定一种编码，则使用相应平台的默认编码。

例如，使用 UTF-8 编码机制，字符串 "The string ü@foo-bar" 将转换为 "The+string+%C3%BC%40foo-bar"，因为在 UTF-8 中，字符 ü 编码为两个字节，C3 （十六进制）和 BC （十六进制），字符 @ 编码为一个字节 40 （十六进制）。

从以下版本开始：
JDK1.0

URLEncoder类中的encode方法——编码

public static String encode(String s, String enc)
                     throws UnsupportedEncodingException

使用指定的编码机制将字符串转换为 application/x-www-form-urlencoded 格式。该方法使用提供的编码机制获取不安全字符的字节。
注：World Wide Web Consortium Recommendation 声明应使用 UTF-8。如果不使用该编码，可能造成不兼容性。
- 参数：
- s - 要转换的 String。
- enc - 所支持的字符编码名称。
- 返回：
- 已转换的 String。
- 抛出：
- UnsupportedEncodingException - 如果不支持指定的编码
- 从以下版本开始：
- 1.4

java.net 类 URLDecoder

java.lang.Object
  java.net.URLDecoder

HTML 格式解码的实用工具类。该类包含了将 String 从 application/x-www-form-urlencoded MIME 格式解码的静态方法。

该转换过程正好与 URLEncoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一："a" 到 "z"、"A" 到 "Z"、"0" 到 "9" 和 "-"、"_"、"." 以及 "*"。允许有 "%" 字符，但是将它解释为特殊转义序列的开始。

转换中使用以下规则：

字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
加号 "+" 转换为空格字符 " "。
将把 "%xy" 格式序列视为一个字节，其中 xy 为 8 位的两位十六进制表示形式。然后，所有连续包含一个或多个这些字节序列的子字符串，将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制，或者如果未指定的话，则使用平台的默认编码机制。

该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符，另一种方法是抛出 IllegalArgumentException 异常。解码器具体采用哪种方法取决于实现。

从以下版本开始：
1.2

URLDecoder中的decode方法——解码

public static String decode(String s,                            String enc)
                     throws UnsupportedEncodingException

使用指定的编码机制对 application/x-www-form-urlencoded 字符串解码。给定的编码用于确定任何 "%xy" 格式的连续序列表示的字符。
注：World Wide Web Consortium Recommendation 声明应使用 UTF-8。如果不使用该编码，可能造成不兼容性。
- 参数：
- s - 要解码的 String
- enc - 所支持的字符编码的名称。
- 返回：
- 新解码的 String
- 抛出：
- UnsupportedEncodingException - 如果需要参考字符编码，而指定的字符编码不被支持
- 从以下版本开始：
- 1.4

以上是学习笔记，不足之处请各位大神指点。

本文出自 “忘忧草” 博客，请务必保留此出处http://qinglongleijun.blog.51cto.com/9625764/1582112

java中的URLEncoder和URLDecoder类的联系与区别

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > java中的URLEncoder和URLDecoder类的联系与区别