首页 > 代码库 > 虚拟存储器和高速缓存总结

虚拟存储器和高速缓存总结

http://blog.csdn.net/chen98765432101/article/details/54881652

概述

为了更加有效的管理存储器并且少出错,现代操作系统提供了一种对主存的抽象,叫做虚拟存储器。虚拟存储器是被应用程序所意识和使用的。也就是说,它是被抽象出来的,虚拟出来的主存。所以,从应用程序的层面,程序看到的和使用的虚拟地址都是属于虚拟存储器的。虚拟存储器充当一种中间转换的角色,把虚拟地址对应的主存转换到真实的主存上面。

如图:

技术分享

下图便是一个虚拟存储器的表示。

技术分享

虚拟存储器是不存在的,是虚拟出来的,如程序文件段,它是对应在磁盘上程序文件所在位置的代码段的,主存中可能存在着一部分或全部的缓存。运行时堆段对应着磁盘上的swap区,主存中可能存在着一部分或全部的缓存。所以,虚拟存储器也可以说对程序段的组织,当需要访问时,再到主存或者虚拟存储器指向的真正位置去取。

虚拟存储器的作用:
  • 它将主存看成是磁盘的一个高速缓存,在主存中只保留活动的区域,并根据需要在磁盘和主存之间传送数据,进而高效的利用有限的主存。
  • 它为每个程序提供了一致的地址空间(虚拟地址空间),简化了存储器管理。例如,加载、链接和共享因虚拟存储器而变的简单。
  • 它保护每个进程的地址空间不被其他进程破坏。每个进程的地址空间是私有的,即使所有进程的地址空间范围是一样的,访问的地址也可能相同,但虚拟存储器管理着进程能访问到的真实内存,假如程序访问不存在或使用错误权限访问都将返回错误。

虚拟寻址和物理寻址

程序使用虚拟寻址,物理内存使用物理寻址。

程序执行是产生一条虚拟地址,通过MMU(内存管理单元),转换为物理地址,使用该物理地址访问物理内存,取得数据。

地址空间

地址空间包括虚拟地址空间和物理地址空间。假如一个存储器的容量是N=2n字节,那么他有N个地址,n位的地址空间。

CPU产生的地址是虚拟地址,属于虚拟地址空间。现代系统有32位和64位地址空间,这个地址空间就是虚拟地址空间。

物理地址空间是用来寻址物理内存的。

地址空间的概念很重要,它清楚的区分了数据对象(字节)和它们的属性(地址)。那么可以将其推广,允许每个数据对象有多个独立的地址,其中每个地址都选自一个不同的地址空间。这也是虚拟存储器的基本思想。

虚拟存储器架构

如图:
技术分享

缩写解释:

VA:虚拟地址

VPN:虚拟页号

PTE:页表项

PTEA:页表项地址

PA:物理地址

DATA:数据

MMU:内存管理单元

TLB:地址翻译缓冲器

设置存储器层次结构主要是为了缓存低速的存储器。主存是对磁盘等设备的缓存,cache是对主存的缓存,tlb是对主存页表的缓存。

寻址方式:

  • tlb是虚拟地址寻址的。
  • cache、主存是物理地址寻址的。
  • 磁盘是磁盘的方式地址寻址的。
图解:
  • CPU产生一个虚拟地址,虚拟地址传送到MMU中,MMU首先根据虚拟地址在tlb中找对应的项,对应的项中包含虚拟地址对应的物理地址,如果找到,就用得到的物理地址在cache中找物理地址对应的数据,如果找到,就把数据从cache中返回给CPU。上述的情况是最理想的情况,即tlb命中,cache也命中。
  • 如果tlb未命中,则MMU根据VA,应用一定的逻辑计算出PTE的物理地址(PTEA)。用PTEA在cache中找对应的数据(PTE),如果cache命中,把PTE返回给MMU,并填充到TLB中,下次再查找TLB时,TLB就会命中了。
  • 如果CACHE未命中,则用PA从主存中取数据,返回数据并填充CACHE对应部分,下次就可以从CACHE中命中。
  • 还有一种情况是,如果请求的数据未在主存中缓存,而是在磁盘中,例如页表项(PTE)中对应的地址是磁盘的地址,主存未命中,称为缺页,则缺页处理程序(操作系统)从主存中找到合适的位置,把磁盘中的内容填充到相应位置。

存储器的相联方式

存储器的相联方式有全相联、组相联、直接相联。关于相联方式,现在暂不更新,网上有很多讨论了。有一点,我觉得可以提下,理解相联方式,最后最好从2进制的位变化形式去理解,这样对理解虚拟地址到物理地址的转换很有好处。

主存对磁盘的缓存

主存和磁盘之间缓存的单位是页。页的大小默认是4k,也有大页2M,甚至1G的,关于大页的讨论,以后再写文章讨论。也就是说,主存缓存磁盘内容是页大小的整数倍,那么页的基地址的最后12位必然是全0的。

cache的访问速度是主存的10倍,主存的访问速度是磁盘(机械)的100000倍。所以,缺页的代价是严重的,所以主存对磁盘的相联方式采用全相联的方式,即磁盘上的一页可以放到主存的任意一页中。并且因为访问磁盘的时间很长,主存总是采用写回的方式,而不是直写。
因为主存的容量相对于磁盘的容量是很小的,所以当运行的程序多的时候,很可能发生没有闲置的主存了,这时候会发生主存页面换出(swap),页面替换处理会找到一个最近最不可能用到的物理页面换出到磁盘,然后把请求的页面放到该物理页面处。所以,系统中可分配的内存总量 = 物理内存的大小 + 交换设备的大小。交换设备可能是swap区和文件。

cache对主存的缓存

cache和主存之间缓存的单元是cache行,每个cache行是64字节。和主存对磁盘缓存不同的是,因为cache和主存的速度相差只有10倍,所以当cache miss时的开销并没有那么大。于是cache与主存之间采用简单、快速的组相联方式。采用的寻址方式是物理地址寻址。

虚拟地址和物理地址的转换

虚拟地址是属于虚拟地址空间的,物理地址是属于物理地址空间,但两者都对应着同一个数据对象。除了这个两个地址空间,其实还有一个磁盘地址空间。CPU为了取得数据,最终必须以物理地址的形式获取。

页表

页表是虚拟地址和物理地址对应的表。在内存中的表现形式是数组。操作系统负责创建和维护,每个进程都有各自的页表,都存放在主存中。页表是常驻主存的,不被换出。一个虚拟地址对应的物理地址或者磁盘地址和标记(64位字节)叫做页表项。页表项相对页表基地址(数组基地址)的偏移,是MMU根据虚拟地址和相联方式计算出来的。一般页表也按多级页表存放的,例如intel i7的页表是四级页表,但2M大页的页表就是3级页表了。多级页表可以减小页表占用的空间。
技术分享

MMU

虚拟地址转换到物理地址是通过MMU完成的。MMU负责把虚拟地址和页表基地址组合成页表项的地址,然后再根据页表项中的有效位等标记检查页表项是否有效、是否在主存中。如果有效且缓存在主存中就向主存获取数据(会先尝试从cache中获取)。如果未被缓存在主存中,而是在磁盘中,则触发缺页处理程序,从磁盘换入主存中和相应的cache中。

TLB对页表的缓存

CPU每产生一个虚拟地址,访问主存,都涉及到从虚拟地址到物理地址的转换,都会访问页表,因此,如果访问的页表项被缓存在cache中,将大大提高获取数据的速度。现在的系统采用专门的cache结构——TLB,来缓存页表项。采用专门的TLB,原因有,因为有了页表基地址之后,页表项是虚拟地址寻址的,所以TLB采用虚拟地址更加方便,但cache结构是采用物理地址寻址的,所以设置了专门的TLB结构缓存页表。

TLB种类:

虚拟存储器和高速缓存总结