首页 > 代码库 > URL query string中文字符问题

URL query string中文字符问题

如果URL的query string中包含中文字符,在不做特殊处理的情况下通过 request.getParameter 方法是获取不到正确的信息的,这是由于下面的两个机制造成的

  • 浏览器会自动对URL中的特殊字符进行编码,比如请求 localhost:8080/TestJSp/loginMiddle.jsp?name=测试,真正请求的URL是localhost:8080/TestJSp/loginMiddle.jsp?name=%E6%B5%8B%E8%AF%95,即浏览器自动对中文进行了基于UTF-8(基于页面的编码设置)的URL编码
  • 当web server(tomcat)接收到该链接时,将会进行URL解码,即去掉"%",同时默认按照ISO8859-1编码进行解码

得到正确信息的方式有两种

  1. 更改tomcat配置,使其默认按照UTF-8对URL的特殊字符进行解码
    <Connector port="8080" protocol="HTTP/1.1"  
               connectionTimeout="20000"  
               redirectPort="8443"  
               URIEncoding="UTF-8"/> 

     

  2. 在获取信息时进行如下操作
    String text = new String(request.getParameter("name").getBytes("ISO8859-1"),"UTF-8");

URL query string中文字符问题