首页 > 代码库 > HTTP 协议详解

HTTP 协议详解

前言:

  之前买过一本《图解 HTTP》这本书,作者好像是个小日本,也继承了小日本在动漫方面的天赋,30% 的内容都是 Q 版画图。
  之后没有引起我的重视,书一借出去,然后,之后 .. 之后,就没有了之后了。
 
  先简单了解一下 Web 相关的知识,现在市面上所有的浏览器以及服务器都是采用的 HTTP 1.1 版本,HTTP 2.0 很快也要普及了。
  其实很多浏览器已经支持到 2.0 了。https://www.zhihu.com/question/34074946
 
一、HTTP 协议基础
     Web 使用一种超文本传输(无状态?)协议作为规范,完成客户端等一系列的运作流程。而协议是指流程的规定。可以说,Web 是建立在 HTTP 协议上通信的。
     在计算机通信中,HTTP 协议属于应用层,传输层还是采用的 TCP/IP 来实现,在这个基础上,还需要了解一下知识就是 DNS。
     粗暴了模拟一个在浏览器中输入一个 www.baidu.com 所有经过的事情:
     1、浏览器获取到用户在地址栏输入的域名后,浏览器将本机基本信息、浏览器基本信息等组成 HTTP 请求包;
     2、浏览器将 HTTP 请求包,请求到目标域名,操作系统网络通信模块将域名转换为 IP 地址;(Windows、DNS)
     3、Web 服务器获取到客户端请求的信息后(与服务器的网络层通讯跳过),做出相应的操作后返回客户端一组数据(HTTP 标准数据)
     4、浏览器开始解析 Web 服务器响应的 HTTP 响应内容包,将内容部分(符合 W3C 规范)解析并渲染成用户看到的效果;
     
 HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:
  (1)建立TCP连接
    在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,
    该协议与IP协议共同构建Internet,即著名的 TCP/IP 协议族,因此Internet又被称作是TCP/IP网络。
    HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,
    因此,首先要建立TCP连接,一般TCP连接的端口号是 80
  (2)Web浏览器向Web服务器发送请求命令
    一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令
    例如:GET/sample/hello.jsp HTTP/1.1
  (3)Web浏览器发送请求头信息
    浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,
    之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。
  (4)Web服务器应答
    客户机向服务器发出请求后,服务器会客户机回送应答,
    HTTP/1.1 200 OK
    应答的第一部分是协议的版本号和应答状态码
  (5)Web服务器发送应答头信息
    正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。
  (6)Web服务器向浏览器发送数据
    Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,
    接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据
  (7)Web服务器关闭TCP连接
    一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码
    Connection:keep-alive
    TCP 连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。
    保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
 
二、HTTP Request
          
  HTTP请求格式
  当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:
  l   请求方法URI协议/版本
  l   请求头(Request Header)
  l   请求正文
  下面是一个HTTP请求的例子:
  [ 请求方法URI协议/版本 ]
       GET/sample.jspHTTP/1.1
  [ 请求头 ]
       Accept:image/gif.image/jpeg,*/*
       Accept-Language:zh-cn
       Connection:Keep-Alive
       Host:localhost
       User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
       Accept-Encoding:gzip,deflate
  [ 请求正文 ]
    username=jinqiao&password=1234
 
三、HTTP Reponse
 
  HTTP应答与HTTP请求相似,HTTP响应也由3个部分构成,分别是:
  l 协议状态版本代码描述
  l 响应头(Response Header)
  l 响应正文
  下面是一个HTTP响应的例子:
  [ 协议状态版本代码描述 ]
    HTTP/1.1 200 OK
  [ 响应头 ]
    Server:Apache Tomcat/5.0.12
    Date:Mon,6Oct2003 13:23:42 GMT
    Content-Length:112
  [ 响应正文 ]
  <html>
    <head>
      <title>HTTP响应示例<title>
    </head>
    <body>
      Hello HTTP!
    </body>
  </html>
 
  常见 HTTP 状态码:
  HTTP Reponse Code:
    301     永久重定向,一般作用于 baidu.com -> www.baidu.com
    302    临时重定向,跳转了新的 URI 地址,SEO 友好度差
    400   响应内容错误,浏览器无法解析响应体的内容
    403   请求的内容被服务拒绝,可能存在权限问题
    404   服务器上未找到改链接指向的地址
    500   服务器执行请求时发生了错误
    503   服务器超负债或,简称挂了
 

HTTP Request Header 请求头

Header解释示例
Accept指定客户端能够接收的内容类型Accept: text/plain, text/html
Accept-Charset浏览器可以接受的字符编码集。Accept-Charset: iso-8859-5
Accept-Encoding指定浏览器可以支持的web服务器返回内容压缩编码类型。Accept-Encoding: compress, gzip
Accept-Language浏览器可接受的语言Accept-Language: en,zh
Accept-Ranges可以请求网页实体的一个或者多个子范围字段Accept-Ranges: bytes
AuthorizationHTTP授权的授权证书Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Cache-Control指定请求和响应遵循的缓存机制Cache-Control: no-cache
Connection表示是否需要持久连接。(HTTP 1.1默认进行持久连接)Connection: close
CookieHTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。Cookie: $Version=1; Skin=new;
Content-Length请求的内容长度Content-Length: 348
Content-Type请求的与实体对应的MIME信息Content-Type: application/x-www-form-urlencoded
Date请求发送的日期和时间Date: Tue, 15 Nov 2010 08:12:31 GMT
Expect请求的特定的服务器行为Expect: 100-continue
From发出请求的用户的EmailFrom: user@email.com
Host指定请求的服务器的域名和端口号Host: www.zcmhi.com
If-Match只有请求内容与实体相匹配才有效If-Match: “737060cd8c284d8af7ad3082f209582d”
If-Modified-Since如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码If-Modified-Since: Sat, 29 Oct 2010 19:43:31 GMT
If-None-Match如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变If-None-Match: “737060cd8c284d8af7ad3082f209582d”
If-Range如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为EtagIf-Range: “737060cd8c284d8af7ad3082f209582d”
If-Unmodified-Since只在实体在指定时间之后未被修改才请求成功If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
Max-Forwards限制信息通过代理和网关传送的时间Max-Forwards: 10
Pragma用来包含实现特定的指令Pragma: no-cache
Proxy-Authorization连接到代理的授权证书Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Range只请求实体的一部分,指定范围Range: bytes=500-999
Referer先前网页的地址,当前请求网页紧随其后,即来路Referer: http://www.zcmhi.com/archives/71.html
TE客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息TE: trailers,deflate;q=0.5
Upgrade向服务器指定某种传输协议以便服务器进行转换(如果支持)Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
User-AgentUser-Agent的内容包含发出请求的用户信息User-Agent: Mozilla/5.0 (Linux; X11)
Via通知中间网关或代理服务器地址,通信协议Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning关于消息实体的警告信息Warn: 199 Miscellaneous warning
 

HTTP Responses Header 响应头

Header解释示例
Accept-Ranges表明服务器是否支持指定范围请求及哪种类型的分段请求Accept-Ranges: bytes
Age从原始服务器到代理缓存形成的估算时间(以秒计,非负)Age: 12
Allow对某网络资源的有效的请求行为,不允许则返回405Allow: GET, HEAD
Cache-Control告诉所有的缓存机制是否可以缓存及哪种类型Cache-Control: no-cache
Content-Encodingweb服务器支持的返回内容压缩编码类型。Content-Encoding: gzip
Content-Language响应体的语言Content-Language: en,zh
Content-Length响应体的长度Content-Length: 348
Content-Location请求资源可替代的备用的另一地址Content-Location: /index.htm
Content-MD5返回资源的MD5校验值Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
Content-Range在整个返回体中本部分的字节位置Content-Range: bytes 21010-47021/47022
Content-Type返回内容的MIME类型Content-Type: text/html; charset=utf-8
Date原始服务器消息发出的时间Date: Tue, 15 Nov 2010 08:12:31 GMT
ETag请求变量的实体标签的当前值ETag: “737060cd8c284d8af7ad3082f209582d”
Expires响应过期的日期和时间Expires: Thu, 01 Dec 2010 16:00:00 GMT
Last-Modified请求资源的最后修改时间Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT
Location用来重定向接收方到非请求URL的位置来完成请求或标识新的资源Location: http://www.zcmhi.com/archives/94.html
Pragma包括实现特定的指令,它可应用到响应链上的任何接收方Pragma: no-cache
Proxy-Authenticate它指出认证方案和可应用到代理的该URL上的参数Proxy-Authenticate: Basic
refresh应用于重定向或一个新的资源被创造,在5秒之后重定向(由网景提出,被大部分浏览器支持)
 

 

Refresh: 5; url=
http://www.zcmhi.com/archives/94.html
Retry-After如果实体暂时不可取,通知客户端在指定时间之后再次尝试Retry-After: 120
Serverweb服务器软件名称Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
Set-Cookie设置Http CookieSet-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
Trailer指出头域在分块传输编码的尾部存在Trailer: Max-Forwards
Transfer-Encoding文件传输编码Transfer-Encoding:chunked
Vary告诉下游代理是使用缓存响应还是从原始服务器请求Vary: *
Via告知代理客户端响应是通过哪里发送的Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning警告实体可能存在的问题Warning: 199 Miscellaneous warning
WWW-Authenticate表明客户端请求实体应该使用的授权方案WWW-Authenticate: Basic
 
 
部分内容转载自:
http://tools.jb51.net/table/http_header
http://www.cnblogs.com/yin-jingyu/archive/2011/08/01/2123548.html
 

HTTP 协议详解