首页 > 代码库 > 初入网络系列笔记(4)HTTP请求和响应
初入网络系列笔记(4)HTTP请求和响应
一、借鉴说明,本博文借鉴以下博文
1.starok,HTTP必知必会,http://www.cnblogs.com/starstone/p/4890409.html
2.CareySon,HTTP协议漫谈,http://www.cnblogs.com/CareySon/archive/2012/04/27/HTTP-Protocol.html
3.逖靖寒,浅析HTTP协议,http://www.cnblogs.com/gpcuster/archive/2009/05/25/1488749.html
4.Chance_yin,HTTP深入浅出http请求,http://www.cnblogs.com/yin-jingyu/archive/2011/08/01/2123548.html
二、HTTP请求
- 请求消息的格式
HTTP请求消息也分为三个部分:
1.请求行
2.请求头部
3.请求正文
其中请求头部的格式我们已经见过。请求行的基本格式为:
方法 路径 版本
例如下面的例子:
GET /simple.html HTTP/1.1
就有对应关系:
- 方法:GET
- 路径:/simple.html
- 版本:HTTP/1.1
请求行是HTTP请求消息的最基本要素。版本是用来声明HTTP消息的解析规则,不同的版本在某些地方的表现是不同的,这里不作过多拆解了。现在实际应用中最新的HTTP协议版本就是HTTP/1.1。路径可以理解成该请求消息发往服务器的入口,一般来讲,同一个路径应该代表同一个资源实体。方法表示对该资源实体进行的操作,例如上述的GET方法,其含义就是请求获取该资源的内容。这些都是通常的解释,但不是必然的要求。实际上,服务器会解析到方法和路径,根据方法和路径做出自己相应的响应。这种响应的规则,可以遵循某些规范,也可以完全不考虑这些规范,是任意的。市面上已经存在一些约定俗成的规范了,比如Restful。Restful是非常优秀的基于HTTP协议的WEB API设计理念,很值得讲,但在这里就不讲了。
- 方法
首先列出最常用的HTTP方法:
1.GET
2.POST
3.PUT
4.PATCH
5.DELETE
6.HEAD
7.OPTIONS
之前说过,服务器对于方法的处理,是没有强制的规范的。这句话说得并不全对。其实每个HTTP方法,都是有一些HTTP协议要求的。比如说GET方法请求的资源,浏览器端一般都会有缓存,下次请求的时候可能从缓存中去取就够了,服务器不用再重复发送相同的资源了;但是服务器如果将获取资源的接口的方法定义为POST,那么浏览器端就不会再对资源进行缓存了,即使每次取到的都是同样地内容,都会请求服务器重新发送一遍。所以说,将请求资源的接口的方法定义为POST而不是GET,就是一种不合理的设计。
再比如,GET方法的请求消息是不能定义消息体的,HEAD方法的请求其响应消息是不包含消息体的,这些都是HTTP协议对于HTTP方法的约束。
- 路径
方法和路径的组合构成WEB API的入口,路径也是很关键的。路径的基本格式一般是:
basic-path[?query-string]
其中[]中的内容表示可选的。在上例中,basic-path就是/simple.html,但不包含query-string的内容。basic-path形式很像UNIX中绝对路径的样式,要以/打头。单独的/表示一种路径,/a、/a/b、/a/b/c都是合理的路径表示。不推荐使用/a/、/a/b/、/a/b/c/这样/后面不跟任何其他内容的形式(/除外)。优秀的API设计者会利用不同的路径层级来合理地组织资源。
问号后面的部分就是query-string。它的格式是任意的,只要客户端和服务器约定好一定的形式即可。这个部分一般是请求参数的附加。之前说过,GET方法是不包含请求体的,所以GET方法的HTTP请求想要附加参数只能使用这种方式。当然其他方法也是可以使用这种方式附加参数,只要服务器同意就可以了。query-string的格式任意,但在客户端和服务器之间也有预先定好的约定,即键值对的形式。query-string可以表示成一系列键值对的集合,用以下方式表示:
k1=v1&k2=v2&k3=&k4
在这里,&分隔不同的键值对,=表示键和值得关系。可以看到一共有四个键值对关系,它们是:
- k1: v1
- k2: v2
- k3: 空字符串
- k4: 起码该键被定义了
一般来说,键值对要写成k=v的形式,但是k=和仅仅一个k都是允许的,前者表示键k的值是空字符串,后者表示键k被定义了,但是其值是什么并不关心。
从上面的例子中发现,在query-string中&和=被用于特殊的用途了,我们不能再在其中从容地使用这两个符号了。如果我们要在值中包含这两个符号,那咋办呢?方法就是,编码。
在实际的HTTP请求中,对于如下的键值关系
k1: &
k2: =
具体的query-string要写成:
k1=%26&k2=%3D
这是因为在ASCII编码中,&的16进制表示是26,=的16进制表示是3D。对于需要的编码,就要表示成其实际编码的16进制表示,每个字节都用一个%XX三个字符进行表示。这样,%本身也就要进行编码了,它的编码是%25。除了这些控制字符的编码,还可以进行中文等非英语语言的编码。
对于编码部分,我推荐阮一峰的一篇博文
关于URL编码
虽然看了也未必懂了,但是最起码知道编码不是一件简单的事情。
- 请求头
HTTP请求头格式与之前所说的消息头格式没什么两样,就是以冒号分隔的键值对。HTTP请求头中,既包含预定义的头(如Content-Type、Content-Length等),也支持自定义头。原本打算多列出几个常见的请求头的,但限于精力,不打算这样做了。我只说说我最常用的Content-Type头吧。
Content-Type头,既可用于请求消息,也可用于响应消息,是规定请求正文内容格式的头部。例如利用这个头部,我们可以规定正文的格式为纯文本格式、表单格式、XML格式、JSON格式、图像格式等。例如Content-Type: application/json就表示JSON文本格式。
在小节的末尾,我良心地给出一个关于HTTP预定义头的参考网址:
HTTP消息头大全
三、HTTP响应
HTTP响应消息的基本格式也是一样的,包含三个部分:
1.响应行
2.响应头部
3.响应正文
响应头部和响应正文我觉得不需要再多说了。响应行的基本格式是:
版本号 状态码 状态文本
例如下面的响应行:
HTTP/1.1 200 OK
其对应关系为:
- 版本号:HTTP/1.1
- 状态码:200
- 状态文本:OK
HTTP状态码主要表示应答的状态。状态码是由3个数字表示,其中第一个数字表示一个大状态,后面两个数字表示该大状态的一个子状态。200就表示操作成功,还有其他常见的如404表示对象未找到,500表示服务器错误,403表示不能浏览目录等等。
状态码一共分为五个大状态,它们是:
- 1xx
- 2xx:请求成功处理
- 3xx
- 4xx:客户端出错
- 5xx:服务器出错
HTTP状态码大全
初入网络系列笔记(4)HTTP请求和响应