首页 > 代码库 > http协议

http协议

http://www.cnblogs.com/li0803/archive/2008/11/03/1324746.html

HTTP协议: Hypertext transfer protocol  ,是一个基于请求与响应模式的、无状态的、应用层的协议,常基于TCP的连接方式,HTTP1.1版本中给出一种持续连接的机制,绝大多数的Web开发,都是构建在HTTP协议之上的Web应用。

 http请求由三部分组成:请求行、消息报头、请求正文

格式如下:Method Request-URI HTTP-Version CRLF  
其中 Method表示请求方法;Request-URI是一个统一资源标识符;HTTP-Version表示请求的HTTP协议版本;CRLF表示回车和换行(除了作为结尾的CRLF外,不允许出现单独的CR或LF字符)。

请求方法(所有方法全为大写)有多种,各个方法的解释如下:
GET     请求获取Request-URI所标识的资源,
POST    在Request-URI所标识的资源后附加新的数据

GET和POST区别:

get方式请求参数会附加在url后,而post是看不到的,post相对安全;get方式对提交的数据大小有限制(1k),post方式对数据大小没有限制.


HEAD    请求获取由Request-URI所标识的资源的响应消息报头
PUT     请求服务器存储一个资源,并用Request-URI作为其标识
DELETE  请求服务器删除Request-URI所标识的资源
TRACE   请求服务器回送收到的请求信息,主要用于测试或诊断
CONNECT 保留将来使用
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求
应用举例:
GET方法:在浏览器的地址栏中输入网址的方式访问网页时,浏览器采用GET方法向服务器获取资源,eg:GET /form.html HTTP/1.1 (CRLF)

POST方法要求被请求服务器接受附在请求后面的数据,常用于提交表单。
eg:POST /reg.jsp HTTP/ (CRLF)
Accept:image/gif,image/x-xbit,... (CRLF)
...
HOST:www.guet.edu.cn (CRLF)
Content-Length:22 (CRLF)
Connection:Keep-Alive (CRLF)
Cache-Control:no-cache (CRLF)
(CRLF)         //该CRLF表示消息报头已经结束,在此之前为消息报头
user=jeffrey&pwd=1234  //此行以下为提交的数据

HEAD方法与GET方法几乎是一样的,对于HEAD请求的回应部分来说,它的HTTP头部中包含的信息与通过GET请求所得到的信息是相同的。利用这个方法,不必传输整个资源内容,就可以得到Request-URI所标识的资源的信息。该方法常用于测试超链接的有效性,是否可以访问,以及最近是否更新。

 

HTTP响应也是由三个部分组成,分别是:状态行、消息报头、响应正文
1、状态行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服务器HTTP协议的版本;Status-Code表示服务器发回的响应状态代码;Reason-Phrase表示状态代码的文本描述。
状态代码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
常见状态代码、状态描述、说明:
200 OK      //客户端请求成功

304 未修改 无需到服务端再次请求
400 Bad Request  //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用 
403 Forbidden  //服务器收到请求,但是拒绝提供服务
404 Not Found  //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable  //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
eg:HTTP/1.1 200 OK (CRLF)

浏览器强制刷新方式 :CTRL + F5

 

请求头信息:

                      * Accept: 浏览器告诉服务端, 浏览器可接受的MIME类型

                                   MIME类型: 相当于操作系统下的文件类型。

是由大类型和小类型组成: text/html;

对应的关系在conf/web.xml中查询

              Accept-Charset: 浏览器告诉服务端, 浏览器支持哪种字符集

                        Accept-Encoding: 浏览器告诉服务端, 浏览器能够进行解码的数据编码方式,比如gzip

                        Accept-Language: 浏览器告诉服务端,浏览器支持的语言种类

   Host: 浏览器告诉服务端,浏览器所在的主机

                      * Referer: 浏览器告诉服务端,当前页面从哪里来的。

                                   用处: 1. 用来记录广告的信息   2. 防盗链

Content-Type: 浏览器告诉服务端 ,内容类型   If-Modified-Since: 浏览器告诉服务端修改的时间

   Content-Length: 浏览器告诉服务端 请求正文内容长度

   Connection: 浏览器告诉服务端,连接的状态

   *****Cookie: 浏览器告诉服务端 ,浏览器携带的Cookie

   Date: 浏览器告诉服务端,发送请求的时间

 

,

 响应头信息

                      * Location : 服务端用来告诉浏览器,请求需要重定向.(必须结合状态吗302使用)

             Server : 服务端用来告诉浏览器,服务器的类型

                      * Content-Encoding: 服务端用来告诉浏览器,服务器对数据采用的编码

                       Content-Length:  服务端用来告诉浏览器,响应正文的长度

                    Content-Language: 服务端用来告诉浏览器,zh-cn服务发送的文本的语言

                      *Content-Type: 服务端用来告诉浏览器,你要用哪个码表来解析二进制数据

                      * Last-Modified : 服务端用来告诉浏览器,访问资源的最后修改时间

                      *Refresh:服务端用来告诉浏览器,多长时间刷新一次

                      *Content-Disposition: 服务端用来告诉浏览器,以下载文件的方式打开文件

 * Expires: -1 : 服务端用来告诉浏览器,不要缓存 Cache-Control: no-cache (1.1)   Pragma: no-cache   (1.0)

 ***** Set-Cookie: 服务端用来告诉浏览器,要存储的内容

http协议