Web服务基础

首页 > 代码库 > Web服务基础

2024-09-19 09:10:42 216人阅读

一、HTTP概述

HTTP是HyperText Transfer Protocol的缩写，即超文本传输协议。HTTP是应用层协议，同其他应用层协议一样，是为了实现某一类具体应用的协议，并由某一运行在用户空间的应用程序来实现其功能。HTTP是一种协议规范，这种规范是记录在文档上的，为真正通过HTTP协议进行通信的HTTP的实现程序。我们知道，HTTP协议是基于C/S架构的进行通信的，而HTTP协议的服务器端实现程序有httpd、nginx等，其客户端的实现程序主要是Web浏览器，例如Firefox、Internet Explorer、Google chrome、Safari、Opera等，此外，客户端的命令行工具还有elink、crul等。Web服务是基于TCP的，因此为了能够随时响应客户端的请求，Web服务器需要监听在80/TCP端口。这客户端浏览器和Web服务器之间就可以通过HTTP协议进行通信了。

二、IANA定义的端口

我们知道，Web服务器为了让所有客户浏览器程序能够与之通信，通常都需要监听在80端口。用户在浏览器上键入URL时，例如：www.baidu.com，默认端口就是80。这一端口是由IANA（Internet Assigned Numbers Authority ）分配指定的。另外，IANA是由ICANN管理的，其定义的端口如下：

①0-1023：众所周知的端口，永久地分配给固定的应用使用，这些端口的使用需要特定的应用去注册，属于特权端口，例如Web服务的80/tcp，FTP的21/tcp等。该类端口只有系统管理员才有权限启用，并让进程监听，而普通用户则没有权限。

②1024-41951：亦为注册端口，但要求不是特别严格，这些端口分配给程序，并注册为某个应用使用，但这些应用并不是很常见，例如mysql服务的3306/tcp，memcache的11211/tcp等。

③41952+：客户端程序随机使用的端口，为动态端口，或私有端口。在Linux上该类端口范围定义在/proc/sys/net/ipv4/ip_local_port_range中。

三、BSD Socket

BSD Socket最早是BSD Unix系统的进程通信机制。Socket即为套接字，作为IPC（Inter-Process Communication，进程间通信）的一种实现，允许位于不同主机上（也可以是同一主机上）的进程间通信机制。Socket可理解为“插座”，只要电线插上了这个“插座”，就可以进行通信了。Socket本质上应该是Socket API，它封装了内核中socket通信相关的通信细节，也就是封装了通信子网（传输层、网络层、数据链路层、物理层）要实现的具体的通信细节，而程序员通过调用Socket API就可以编写能够实现网络通信的程序了。

Socket描述的是IP地址和端口。不同的服务所对应的端口号不同，每种服务需要绑定并监听在一个端口上，打开一个Socket，而客户端可以通过一个Socket跟服务器上的Socket建立连接，这样二者就能实现通信了，我们把正处于通信状态的一对套接字称为已连接套接字。总的来说，Socket是应用层与传输层之间的桥梁，如图。

技术分享

前面提到，Socket是对IP地址和端口号的描述，一个IP地址+一个端口就是一个套接字(socket)。根据Socket在传输层使用的协议可分为以下三类：

(1)SOCK_STREAM：tcp套接字

(2)SOCK_DGRAM：udp套接字

(3)SOCK_RAW：raw套接字

这里的raw套接字指的是在不使用任何传输层协议（例如tcp, udp等）的情况下直接通过发送或接收IP数据包实现通信的一种方式，也就是应用层直接绕过像tcp/udp这样的协议直接基于IP数据包通信。

根据Socket监听的地址格式，Socket Domain可分为：

(1)AF_INET：Address Family，IPv4地址格式

(2)AF_INET6：Address Family，IPv6地址格式

(3)AF_UNIX：Address Family，同一主机上不同进程间基于Socket套接字通信所使用的一种地址格式，这种地址的表现形式就是一个套接字文件（Linux一切皆文件）；这种地址又称为Unix_SOCK.

接下来介绍TCP客户端和服务器是如何通过TCP套接字接口进行通信的。如图。

技术分享

对于TCP服务器端来说，首先需要调用socket()函数，向内核注册申请创建TCP套接字(IP地址+端口)；一旦申请成功了，就要通过bind()函数绑定程序到这个套接字上；绑定之后，需要调用listen()函数，使服务器进程监听在这个套接字上，允许套接字进行连接，但此时还不能接收用户请求；只有再调用accept()函数之后才开始负责接收客户端请求，并在客户端请求到达之前一直处于阻塞状态，此时TCP服务器进程的状态为LISTEN。

对于TCP客户端来说，同样需要调用socket()函数创建套接字，但不需要监听；当客户端向服务器发起连接请求时，即调用connect()函数，其中在括号中的参数包括对方服务器的IP地址和端口；如果服务器接收连接请求，则双方进行了tcp三次握手，建立双向的虚链路，此时客户端和服务器之间的套接字处于已连接状态(ESTABLISHED)，之后的http请求/响应报文都是基于此前建立的虚链路进行发送。

在Linux上，当连接建立之后，客户端就可以在与服务器建立连接的socket文件上填写需要请求的数据，写入数据就相当于向服务器发送数据了，此过程通过调用write()函数完成；而服务器端则可以在与客户端建立连接的socket文件上读取数据，即调用read()函数，这一过程相当于接收客户端请求的数据，二者之间具体的通信细节由底层的通信子网完成。服务器读取到客户端发送过来的请求报文后，接着进行解析请求、处理请求并构建响应报文，再通过调用write()函数把响应报文写入socket文件，通过通信子网传送到客户端的socket文件上，客户端就可以通过这个socket文件得到服务器的响应报文了。如此往复循环多次，直到客户端请求断开连接（一般是由客户端主动请求断开连接，在使用keep-alive连接方式时则有可能是服务器主动请求断开连接）。

一旦客户端请求断开连接，TCP服务器通过调用read()函数读取socket文件内的断开请求数据，同意断开连接。

本文出自 “Tab” 博客，请务必保留此出处http://xuweitao.blog.51cto.com/11761672/1921842

Web服务基础

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Web服务基础

Web服务基础

看完仍有疑问？有类似问题直接问程序猿