首页 > 代码库 > 《TCP/IP详解卷2:实现》笔记--IP:网际协议

《TCP/IP详解卷2:实现》笔记--IP:网际协议

本章介绍IP分组的结构和基本的IP处理过程,包括输入,转发和输出。下图显示了IP层常见的组织形式。


在之前的文章中,我们看到了网络接口如何把到达的IP分组放到IP输入队列ipintrq中去,并如何调用一个软件中断,如下图所示:


因为硬件中断的优先级比软件中断的要高,所以在发生一次软件中断之前,有的分组可能会被放到队列中。在软件中断中,ipintr

函数不断从ipintrq中移走和处理分组,直到对垒为空。在最终的目的地,IP把分组重装为数据包,并通过函数调用把该数据包直接

传给适当的运输层协议。如果分组没有到达最后的目的地,并且如果主机被配置成一个路由器,则IP把分组传给ip_forward。传输

协议和ip_forward把要输出的分组传给ip_output,由ip_output完成ip首部,选择输出接口以及在必要时对分组分片。最终的分组

被传给合适的网络接口输出函数。

当产生差错时,IP丢弃该分组,并在某些条件下向分组的源站发出一个差错报文,这些报文是ICMP的一部分。


1.IP分组

我们把传输层协议交给IP的数据称为报文。典型的报文包含一个传输层首部和应用程序数据。下图所示的传输协议时UDP。IP在报

文的首部前加上它自己的首部形成一个数据包。如果在选定的网络中,数据报长度太大,IP就把数据包分裂成几个分片,每个分片

包含它自己的IP首部和一段原来的数据报的数据。


下图显示了IP首部的结构。


下图包含了IP结构中的各成员的名字



标准的IP首部长度是20个字节,所以ip_hl必须大于等于5.大于5表示IP选项紧跟在标准首部后,如ip_hl的最大值为15,允许最多

40各字节的选项。ip_hl是以4字节为单位计算的。


2.输入处理:ipintr函数

当接口把分组放到ipintrq上排队后,通过schednetisr调用一个软中断。当该软中断发生时,如果IP处理过程已经由schednetisr

调度,则内核调用ipintr。在调用ipintr之前,cpu的优先级被改成splnet。

ipintr是一个大函数,主要分4部分讨论:

1.对到达分组验证

2.选项处理及转发

3.分组重装

4.分用

其中选项处理和分用重装比较复杂,会在以后作为单独的章节进行说明。

2.1.验证

把分组从ipintrq中取出,验证他们的内容,损坏和有差错的分组被自动丢弃。
IP版本:
如果网络接口没有指派IP地址,则必须丢掉所有的IP分组。
在ipintr访问任何IP首部字段之前,它必须证实ip_v是4.
IP首部检验和:
ipintr把由in_cksum计算出来的检验和保存首部的ip_sum字段中。一个未被破坏的首部应该具有0检验和。如果为非0,则该
分组被自动丢弃。下面的章节具体介绍in_cksum。
3.字节顺序
NTOHS宏将IP首部中的所有16bit的值从网络字节序转换成主机字节序:分组长度(ip_len)、数据报标识符(ip_id)和分片
偏移(ip_off)。
4.分组长度
如果分组的逻辑长度(ip_len)比存储在mbuf中的数据量(m_pkthdr.len)大,并且有些字节被丢失了,就必须丢弃该分组,
如果mbuf比分组大,则去掉多余的字节。
丢失字节的一个常见原因是因为数据到达某个没有或只有很少缓存的串口设备,设备丢弃到达的字节。
多余字节可能产生,如在某个以太网设备上,当一个IP分组的大小比以太网要求的最小长度还要小时。发送该帧是加上的多余
字节就在这里被丢弃。

2.2.选项处理和转发

接下来调用ip_dooptions来处理IP选项,然后决定分组是否到达它最后的目的地。如果分组没有到达最后目的地,则Net/3会

尝试转发该分组;如果分组到达最后目的地,就被交付给合适的传输层协议。

1.选项处理

ip_dooptions处理选项,如果ip_dooptions返回0,ipintr将继续处理该分组;否则ip_dooptions通过转发或丢弃分组完成对该

分组的处理,ipintr可以处理输入队列中的下一个分组。

处理完选项后,ipintr通过把ip首部内的ip_dst与配置的所有本地接口的ip地址比较,以决定分组是否已经到达最终目的地。ipintr

必须考虑与接口相关的几个广播地址、一个或多个单播地址以及任意多个多播地址。

2.转发

如果ip_dst与所有地址都不匹配,分组还没有达到最终目的地。如果不准备转发,则丢弃分组,否则,ip_forward尝试把分组路由

到它的最终目的地。

2.3.分组重装和分用

ipintr函数最后进行分组的重组和分组,在后面的章节会详细进行介绍。

最后ipintr调用选定protosw结构中的pr_input函数来处理数据报包含的运输报文,当pr_input返回时,ipintr继续处理ipintrq中的

下一个分组。

3.IP头部检验:in_cksum函数

IP首部校验和的计算方法:
  1.把校验和字段清零。
  2.然后对每16位(2字节)进行二进制反码求和,反码求和的意思是先对每16位求和,再将得到的和转为反码。
  接下来详细描述反码求和的步骤:看下面的代码
  基本算法:

SHORT checksum(USHORT* buffer, int size)
{
    unsigned long cksum = 0;
    while(size>1)
    {
        cksum += *buffer++;
        size -= sizeof(USHORT);
    }
    if(size)
    {
        cksum += *(UCHAR*)buffer;
    }
    cksum = (cksum>>16) + (cksum&0xffff); 
    cksum += (cksum>>16); 
    return (USHORT)(~cksum);
}

  参数buffer是指向16位整数的指针,刚开始指向的是IP首部的起始地址,参数size是IP首部的大小。while循环是将IP首部的内容
以16位为单元加在一起,如果没有整除(即size还有余下的不足16位的部分),则加上余下的部分,此时的cksum就是相加后的结
果,这个结果往往超出了16位,因为校验和是16位的,所以要将高16位和计算得到的cksum再加工。
  再加工第一步:cksum = (cksum>>16) + (cksum&0xffff); sum>>16是将高16位移位到低16位,sum&0xffff是取出低16位,相加得到新的cksum。
  再加工第二步:cksum += (cksum>>16); 第一步相加时很可能会产生进位,因此要再次把进位移到低16位进行相加。  
  这样就加工好了,接下来就是取反,并强制转换为16位,这样就得到了最终的校验和。
  校验和计算出来了,接下来就是该如何校验:
  接收方进行校验时,也是对每16位进行二进制反码求和。接收方计算校验和时的首部与发送方计算校验和时的首部相比,多了一
个发送方计算出来的校验和。因此,如果首部在传输过程中没有发生差错,那么接收方计算的结果应该为全一,因为接收方计算除
校验和以外的部分得到值是校验和的反码,再加多出来的校验和当然是全一了。
  最后对上述过程举个例子:
  IP头:
  45 00    00 31
  89 F5    00 00
  6E 06    00 00(校验字段)
  DE B7   45 5D       ->    222.183.69.93
  C0 A8   00 DC     ->    192.168.0.220
  计算:  
  4500 + 0031 +89F5 + 0000 + 6e06+ 0000 + DEB7 + 455D + C0A8 + 00DC =3 22C4
  0003 + 22C4 = 22C7
  ~22C7 = DD38      ->即为应填充的校验和
  当接受到IP数据包时,要检查IP头是否正确,则对IP头进行检验,方法同上:
  计算:
  4500 + 0031 +89F5 + 0000 + 6E06+ DD38 + DEB7 + 455D + C0A8 + 00DC =3 FFFC
  0003 + FFFC = FFFF
  得到的结果是全一,正确。