首页 > 代码库 > (转)从浏览器访问一个地址的过程
(转)从浏览器访问一个地址的过程
1.若DNS缓存中没有相关数据,则IE浏览器先向DNS服务器发出DNS请求:
这一过程的目的是获取www.sina.com这个域名所对应的IP地址;
IE浏览器向本机DNS模块发出DNS请求,DNS模块生成相关的DNS报文;
DNS模块将生成的DNS报文传递给传输层的UDP协议单元;
UDP协议单元将该数据封装成UDP数据报,传递给网络层的IP协议单元;
IP协议单元将该数据封装成IP数据包,其中目的IP地址为DNS服务器的IP地址;
封装好的IP数据包将传递给数据链路层的协议单元进行发送;
发送时如果ARP缓存中没有相关数据,则发送ARP广播请求,等待ARP回应;
得到ARP回应后,将IP地址与路由下一跳MAC地址对应的信息写入ARP缓存表;
写入缓存后,以路由下一跳地址填充目的MAC地址,并以数据帧形式转发;
这个转发过程可能会进行多次,这取决于DNS服务器在校园网中的位置;
DNS请求被发送到DNS服务器的数据链路层协议单元;
DNS服务器的数据链路层协议单元解析收到的数据帧,将其内部所含有的IP数据包传递给网络层IP协议单元;
DNS服务器的IP协议单元解析收到的IP数据包,将其内部所含有的UDP数据报传递给传输层的UDP协议单元;
DNS服务器的UDP协议单元解析收到的UDP数据包,将其内部所含有的DNS报文传递给该服务器上的DNS服务单元;
DNS服务单元收到DNS请求,将域名解析为对应的IP地址,产生DNS回应报文;
(所有应用层报文必须通过传输层、网络层和数据链路层,因此在下面的叙述中,我将简化这一过程的叙述,简化形式如下面的样子,其中单箭头为本机内部传递,双箭头为网络上的发送)
DNS回应报文→UDP→IP→MAC→→请求域名解析的主机;
请求域名解析的主机收到数据帧,该数据帧→IP→UDP→DNS→IE浏览器;
将域名解析的结果以域名和IP地址对应的形式写入DNS缓存表。
2.IE浏览器与www.sina.com.cn建立TCP连接:
IE浏览器向www.sina.com.cn发出TCP连接请求报文;
该请求TCP报文中的SYN标志位被设置为1,表示连接请求;
该TCP请求报文→IP(DNS)→MAC(ARP)→→校园网关→→www.sina.com.cn主机;
该TCP请求报文经过IP层时,填入的目的IP地址就是上面DNS过程获得的IP地址;
经过数据链路层时,若MAC地址不明,还要进行上面所叙述的ARP过程;
www.sina.com.cn收到的数据帧→IP→TCP,TCP协议单元会回应请求应答报文;
该请求应答TCP报文中的SYN和ACK标志位均被设置为1,表示连接请求应答;
该TCP请求应答报文→IP→MAC(ARP)→→校园网关→→请求主机;
请求主机收到数据帧→IP→TCP,TCP协议单元会回应请求确认报文;
该请求应答TCP报文中的ACK标志位被设置为1,表示连接请求确认;
该TCP请求确认报文→IP→MAC(ARP)→→校园网关→→www.sina.com.cn主机;
www.sina.com.cn收到的数据帧→IP→TCP,连接建立完成;
在这个过程中,任何一个报文出错或超时,都要进行重传;
这个过程被称为TCP建立连接的三次握手。
3.IE浏览器开始HTTP访问过程
IE浏览器向www.sina.com.cn发出HTTP-GET方法报文;
该HTTP-GET方法报文→TCP→IP→MAC→→校园网关→→www.sina.com.cn主机;
www.sina.com.cn收到的数据帧→IP→TCP→HTTP,HTTP协议单元会回应HTTP协议格式封装好的HTML超文本形式数据;
HTTP-HTML数据→TCP→IP→MAC(ARP)→→校园网关→→请求主机;
请求主机收到的数据帧→IP→TCP→HTTP→IE浏览器,浏览器会以网页形式显示HTML超文本,就是我们所看到的网页。
4.断开TCP连接
IE浏览器向www.sina.com.cn发出TCP连接结束请求报文;
该请求TCP报文中的FIN标志位被设置为1,表示结束请求;
该TCP结束请求报文→IP→MAC(ARP)→→校园网关→→www.sina.com.cn主机;
www.sina.com.cn收到的数据帧→IP→TCP,TCP协议单元会回应结束应答报文;
该结束应答TCP报文中的FIN和ACK标志位均被设置为1,表示结束应答;
该TCP结束应答报文→IP→MAC(ARP)→→校园网关→→请求主机;
这个过程需要双向进行,因此www.sina.com.cn主机也会按上述流程再做一次;
整个过程被称为TCP断开连接的四次握手。
呵呵,好麻烦的一个过程对不对?我也写了好长时间诶,希望对你有所帮助!
-------------------------------------------------------------
这个人很耐心,已经解释得很详细了。不过我是个吹毛求疵的人,非得把每个细节都弄得很清楚。其中最让我纠结的是ip地址转换到mac地址的过程。或许你说那不就是arp协议吗?那你就想的简单了点。
首先ip地址是网络层(layer 3)的概念,mac地址是数据链路层(layer 2)的概念。
网络层主要任务是路由,而数据链路层是提供相邻两个网络实体间端到端的数据传输,可以理解成为局域网内两台机器间的数据传输。
数据链路层的作用范围是局域网,那么其mac地址肯定是局域网内某台机器的mac地址。并且arp协议的作用范围也是局域网。但是ip数据包的目的地址未必都是局域网内的,如果不是,在局域网内进行arp广播查询该ip地址对应的mac地址,肯定没有人回应,因为大家谁都不拥有这个ip地址。
于是先要知道ip地址是不是同一个局域网里的,这个不难,使用子网掩码就可以确定。如果是同一个局域网,那么就可以arp了。那如果不是呢??
这就要靠网络层了。到这时候我才惊讶地发现,路由表不是只在路由器上才有的(以前我可都是这么以为的),本机上照样有,而且也有路由过程。在 windows下CMD下输入命令“route print”,就可以看到本机上的路由表(linux下是"route")。部分路由表项如下(我机器的ip是10.77.100.113,子网掩码是 255.255.255.0 ):
----------------------
Network Destination Netmask Gateway Interface Metric
0.0.0.0 0.0.0.0 10.77.100.1 10.77.100.113 10
10.77.100.0 255.255.255.0 10.77.100.113 10.77.100.113 10
----------------------
最后一条其实意思就是,如果ip地址是同一个局域网中的地址,则直接发送到该ip地址就可以了(表中看起来是路由给自己,我估计是这个意思,linux下就是一个星号表示的,更能理解)。
中间那条其实就是默认路由路径(因为任何一个ip地址 AND 0.0.0.0 后肯定都是 0.0.0.0 的),其意思就是,如果其他路由项都不符合,则发送到默认网关。
扯远一点。默认情况下,windows机器不会充当路由器的功能,它不会转发(forward)自己接受到的但是目的地址不是自己的包。但是这是可以设置的,通过开启路由转发功能,就能充当一个路由器了。这样,局域网中另一台机器就可以把默认网关设置为你的ip,然后他的所有到外网的包都先交给你,然后你再路由转发出去。貌似多次一举,但是这样你的机器可以控制别人的上网功能。譬如一个家里,老爸把他儿子的机器的默认网关设置为自己的机器的,当这个狡猾的老爸不想让儿子上网的时候,就关闭自己机器的路由转发功能,可怜的儿子就上不了网了,而且不知道为什么。-_-!!
譬如XP下可以修改注册表项:HKEY_LOCAL_MACHINE \SYSTEM\CurrentControlSet\Services\Tcpip \Parameters 中的 IPEnableRouter=1。
顺便说说命令“route -f”,它可以删除路由表中涉及默认网关的项。我曾经使用该命令删除掉中间那条,结果访问外网就不行了,实际错误就是找不到路由项。
和同宿舍一个哥们讨论该问题,当他发现“route -f”可以让机器不能上外网时,立马说可以用这个搞恶作剧啊,让人上不了网,估计没几个人能找出问题来,只有重启机器。我汗-_-!!
所以ip地址转换到mac地址的过程就更清晰了:
------------------------
1、首先得到ip包需要送达的目的地址 ip-des ;
2、查路由表,根据匹配 ip-des 的路由表项得到下一跳(next hop)的中间目的地址 ip-next (可以保证 ip-next 是局域网中的地址);
3、在arp缓存中查找 ip-next 对应的mac地址,如果缓存中没有,再到局域网中使用arp协议进行询问;
4、得到了mac地址,一切就好办了----将mac地址放到帧头,发送数据。
------------------------
由此看出绝不是仅仅arp那么简单。
几个有用的命令(注意linux下需要root权限):
------------------------
查看本地路由表:
windows: route print
linux: route
查看本地arp缓存:
windows: arp -a
linux: arp
(转)从浏览器访问一个地址的过程