首页 > 代码库 > JSP页面编码问题

JSP页面编码问题

 1 <%@ page language="java" contentType="text/html; charset=gb2312" 2     pageEncoding="utf-8"%> 3 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 4 <html> 5 <head> 6 <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"> 7 <title>Insert title here</title> 8 </head> 9 <body>10     <b>hello world , 你好,世界!</b>11 </body>12 </html>

如上面这段简单的JSP代码,里面有三个地方对编码进行了设置:

 1. contentType 中的 charset 

 2. pageEncoding 

 3. html meta标记中的charset 

那么这三个都在什么地方起到什么作用,

   在说编码之前首先简单叙述一下JSP页面执行的原理,当一个JSP页面编写完成后需要将该页面发布到相应的服务器例如tomcat上,整个发布过程由包括两个小的步骤,一、将JSP翻译成Servlet(一个Java文件)。二、JSP引擎(tomcat)调用Java编译器将Servlet编译成.class文件并保存到规定的目录中。三、当用户在地址栏输入相应JSP页面的地址时,JSP引擎调用Java虚拟机来解释执行.class文件,并生成向客户端的回应信息。

下面进入正题,编码

  首先讲pageEncoding,我们知道每一个文档或者页面都有相应的编码,如果不提供编码格式,程序是无法将一连串的二进制翻译出来的。JSP也一样,那么这个pageEncodinig就是指定这个JSP文件中内容的编码格式,这个编码格式告诉JSP引擎,我这个JSP是用什么编码的,你可以使用什么解码格式来读取我这个文档,并翻译成相应的Servlet。这个Servlet的格式是JSP引擎的规定的utf-8。同样Servlet编译成的.class文件也是JSP引擎规定的utf-8格式。至此pageEncoding的使命完成。如果想看看这个pageEncoding是否设置正确可以查看JSP相应的Servlet中代码是否有乱码,如果有表示pageEncoding没有设置正确。常用的编码有iso-8859-1(英文字符)、utf-8(全世界通用)、gb2312(国标,中文编码,同样支持英文)、gbk(gb2312的增强版,支持的字符更多,与gb2312相对于utf-8占用空间较大)。

   在JSP页面指令中的charset是当客户端请求JSP页面时,.class文件返回页面的编码格式,假如页面中含有中文,而且pageEncoding设置正确,那么在Servlet中文会正常显示,但是如果charset设置的是英文编码例如iso-8859-1,Servlet中的中文输入到客户端浏览器就会出现乱码。

   最后一个是html meta标签中的,这个标签功能与JSP页面指令charset是相同的,该标签在JSP页面中不起作用,至少我测试的是不起作用的,如果有相应页面指令则按照页面指令编码,如果没有默认utf-8,该标签不起作用,但是在普通的html中是起作用的。

我知道的就这么多了

 

JSP页面编码问题