首页 > 代码库 > RAID详解

RAID详解

RAID的由来

    磁盘阵列简称RAID(Redundant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。

    磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将故障硬盘内的数据,经计算后重新置入新硬盘中。

    磁盘阵列的由来:由美国柏克莱大学(University of California-Berkeley)在1987年,发表的文章:“A Case for Redundant Arrays of Inexpensive Disks”。文章中,谈到了RAID这个字汇,而且定义了RAID的5层级。柏克莱大学研究其研究目的为,反应当时CPU快速的性能。CPU效能每年大约成长30~50%,而硬磁机只能成长约7%。研究小组希望能找出一种新的技术,在短期内,立即提升效能来平衡计算机的运算能力。在当时,柏克莱研究小组的主要研究目的是效能与成本。另外,研究小组也设计出容错(fault-tolerance),逻辑数据备份(logical data redundancy),而产生了RAID理论。研究初期,便宜(Inexpensive)的磁盘也是主要的重点,但后来发现,大量便宜磁盘组合并不能适用于现实的生产环境,后来Inexpensive被改为independence



RAID的实现形式

磁盘阵列(RAID)其样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件来仿真

外接式磁盘阵列柜

    磁盘阵列柜就是装配了众多硬盘的外置的RAID,它有一块名为RAID的卡来组织并管理各个磁盘设备。

    RAID卡是用来实现RAID功能的板卡,通常是由I/O处理器SCSI控制器SCSI连接器缓存等一系列零组件构成的。不同的RAID卡支持的 RAID功能不同。支持RADI0、RAID1、RAID3、RAID4、RAID5、RAID10不等。RAID卡可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是RAID卡最初想要解决的问题。可以提供容错功能,这是RAID卡的第二个重要功能。

下图为HP的一款RAID卡

技术分享


磁盘阵列柜有小的跟个人PC主机箱一样大的,有大的如小型集装箱。下图为HP的小型磁盘阵列柜。

技术分享


内接式磁盘阵列卡

内接式磁盘阵列卡,通常指内嵌入主板上的RAID芯片

RAID控制芯片的出现

    1993年,HighPoint公司推出了第一款IDE-RAID控制芯片,能够利用相对廉价的IDE硬盘来组建RAID系统,从而大大降低了RAID的“门槛”。从此,个人用户也开始关注这项技术,因为硬盘是现代个人计算机中发展最为“缓慢”和最缺少安全性的设备,而用户存储在其中的数据却常常远超计算机的本身价格。在花费相对较少的情况下,RAID技术可以使个人用户也享受到成倍的磁盘速度提升和更高的数据安全性,现在个人电脑市场上的IDE-RAID控制芯片主要出自HighPoint和Promise公司,此外还有一部分来自AMI公司。   

    面向个人用户的IDE-RAID芯片一般只提供了RAID 0、RAID 1和RAID 0+1(RAID 10)等RAID规范的支持,虽然它们在技术上无法与商用系统相提并论,但是对普通用户来说其提供的速度提升和安全保证已经足够了。随着硬盘接口传输率的不断提高,IDE-RAID芯片也不断地更新换代,芯片市场上的主流芯片已经全部支持ATA 100标准,而HighPoint公司新推出的HPT 372芯片和Promise最新的PDC20276芯片,甚至已经可以支持ATA 133标准的IDE硬盘。在主板厂商竞争加剧、个人电脑用户要求逐渐提高的今天,在主板上板载RAID芯片的厂商已经不在少数,用户完全可以不用购置RAID卡,直接组建自己的磁盘阵列,感受磁盘狂飙的速度。

    Raid控制芯片则是指控制执行Raid功能的辅助芯片,常见为Intel ICH5RVIA VT8237SIS 964nVidia nForce3

RAID控制芯片是内嵌在主板上的,在BIOS中可以启用或关闭RAID功能。

下图为内嵌在主板上的RAID控制芯片。

技术分享

下图为BIOS中的配置RAID的过程

以nForce为例

    nForce系列芯片组的BIOS里有关SATA和RAID的设置选项有两处,都在Integrated Peripherals(整合周边)菜单内。

    SATA的设置项:Serial-ATA,设定值有[Enabled], [Disabled]。这项的用途是开启或关闭板载Serial-ATA控制器。使用SATA硬盘必须把此项设置为[Enabled]。如果不使用SATA硬盘可以将此项设置为[Disabled],可以减少占用的中断资源。

    RAID的设置项在Integrated Peripherals/Onboard Device(板载设备)菜单内,光标移到Onboard Device,按<Enter>进入如子菜单:

技术分享

    其中RAID Config就是RAID配置选项,光标移到RAID Config,按<Enter>就进入如RAID配置菜单:

技术分享

    菜单的第一项IDE RAID是确定是否设置RAID,设定值有[Enabled], [Disabled]。如果不做RAID,就保持缺省值[Disabled],此时下面的选项是不可设置的灰色。如果做RAID就选择[Enabled],这时下面的选项才变成可以设置的黄色。IDE RAID下面是4个IDE(PATA)通道,再下面是SATA通道。nForce2芯片组是2个SATA通道,nForce3/4芯片组是4个SATA通道。可以根据你自己的意图设置,准备用哪个通道的硬盘做RAID,就把那个通道设置为[Enabled]


    设置完成就可退出保存BIOS设置,重新启动。这里要说明的是,当你设置RAID后,该通道就由RAID控制器管理,BIOS的Standard CMOS Features里看不到做RAID的硬盘了


    BIOS设置后,仅仅是指定那些通道的硬盘作RAID,并没有完成RAID的组建,前面说过做RAID的磁盘由RAID控制器管理,因此要由RAID控制器的RAID BIOS检测硬盘,以及设置RAID模式。BIOS启动自检后,RAID BIOS启动检测做RAID的硬盘,检测过程在显示器上显示,检测到硬盘后留给用户几秒钟时间,以便用户按F10 进入RAID BIOS Setup

    这个过程就参考各个厂商的RAID BIOS Setup的设置文档了。这个过程很简单,因为也是跟BIOS相同的图形界面,因此设置过程按相关提示即可顺利完成RAID设置。


软RAID

    软件RAID很多情况下已经包含在系统之中,并成为其中一个功能,如Windows、Netware及Linux。软件RAID中的所有操作皆由中央处理器负责,所以系统资源的利用率会很高,从而使系统性能降低。软件RAID是不需要另外添加任何硬件设备,因为它是靠你的系统——主要是中央处理器的功能——提供所有现成的资源

    软RAID一般不做实际生产使用,通常用于熟悉RAID的功能。

下面展示Windows中软RAID的实现

技术分享

  在Windows中的磁盘管理中可以实现软RAID功能,它支持RAID 0 、RAID 1、RAID 5三种。

其具体实现方法可以自行查看,这里不再过多介绍。

  Linux中通过命令mdadm实现。




RAID级别


    简单来说,RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。根据磁盘陈列的不同组合方式,可以将RAID分为不同的级别。

    磁盘阵列中针对不同的应用使用的不同技术,称为RAID level,而每一level都代表着不同技术,目前业界公认的标准是RAID 0-RAID 6。这个level并不代表技术的高低,level 5并不高于level 1,至于要选择那一种RAID level的产品,纯视用户的操作环境(operating environment)及应用(application)而定与level的高低没有必然的关系。



RAID 0又称为Stripe或Striping,它代表了所有RAID级别中最高的存储性能。RAID 0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能

技术分享

技术分享

RAID 0的局限性

RAID 0 连续地分割数据并并行地读/写于多个磁盘上。 因此具有很高的数据传输率。 但RAID 0在提高性能的同时,并没有提供数据可靠性,如果一个磁盘失效, 将影响整个数据.因此RAID 0 不可应用于需要数据高可用性的关键应用。


RAID 1又称为Mirror或Mirroring,它的宗旨是最大限度的保证用户数据的可用性可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份,在所有RAID级别中,RAID 1提供最高的数据安全保障。同样,由于数据的百分之百备份,备份数据占了总存储空间的一半,因而,Mirror的磁盘空间利用率低,存储成本高

技术分享

技术分享

Mirror虽不能提高存储性能,但由于其具有的高数据安全性,使其尤其适用于存放重要数据,如服务器和数据库存储等领域。


RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案。RAID 5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。

技术分享

技术分享

RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低。


RAID 6:RAID 6 与RAID 5相比,增加了第二个独立的奇偶校验信息块。 两个独立的奇偶系统使用不同的算法, 数据的可靠性非常高. 即使两块磁盘同时失效,也不会影响数据的使用。 但需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”。RAID 6 的写性能非常差, 较差的性能和复杂的实施使得RAID 6很少使用。


RAID 7:简单来说,RAID 7并不仅仅是一种技术,而是一种存储计算机(Storage Computer )。RAID 7通过使用存储计算机操作系统(Storage Computer Operating System )来初始化和安排磁盘阵列的所有数据传输。它实际上是一套实时事件驱动操作系统,可以把数据转换成磁盘阵列需要的模式,传输到相应的物理存储驱动器上。


RAID0+1:正如其名字一样RAID 0+1是RAID 0和RAID 1的组合形式,也称为RAID 10。


RAID 0+1是存储性能和数据安全兼顾的方案。它在提供与RAID 1一样的数据安全保障的同时,也提供了与RAID 0近似的存储性能。

由于RAID 0+1也通过数据的100%备份提供数据安全保障,因此RAID 0+1的磁盘空间利用率与RAID 1相同,存储成本高。

RAID 0+1的特点使其特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。



RAID 0+1与RAID 1+0的对比

    大家都知道RAID 0+1是先条带化,再镜像,RAID 1+0是先镜像再条带化。下面为大家详细介绍一下它们的优劣

这两种RAID配置哪种更好呢?

我们举个例子,总共6块硬盘。

RAID 0+1的配置图如下:

技术分享

RAID 1+0的配置图如下:

技术分享


    针对RAID 0+1,一个Set中的硬盘损坏都会导致该Set损坏。这样的话,如果A,B两个Set中都各坏一个硬盘的话,则整个RAID都将损坏。

    而RAID 1+0,只有一个Set中的硬盘都损坏时,才会导致整个RAID损坏。也就是说当1中的两块硬盘都坏掉时,整个RAID都会损坏。只要不是同一个Set中的两块硬盘损坏,则整个RAID就不会损坏。

    按概率的角度来讲,RAID 0+1损坏第二块盘导致整个RAID损坏的机率为(n/2)/(n-1)RAID 1+0 损坏第二块盘导致整个RAID损坏的机率为1/(n-1).

    显然RAID 0+1的稳定性不如RAID 1+0.

    在有硬盘损坏但整个RAID没有损坏的情况下,RAID 0+1其实就变成了RAID 0,只有一 个Set工作(4块盘),这样读的速度显然变慢了。

    而RAID 1+0还有7块盘工作,性能影响较小。

    另外,RAID 0+1在以好盘替代坏盘时,recover的性能将比RAID 1+0慢很多。

    所以在做raid的时候最好做RAID1+0而不做RAID 0+1


本文出自 “张帆-IT的奇幻漂流” 博客,请务必保留此出处http://chawan.blog.51cto.com/9179874/1852793

RAID详解