磁盘阵列RAID种类及对比(转载)
本文最后更新于 2022年4月29日 凌晨
作者:钱魏Way
原文链接:https://www.biaodianfu.com/raid.html
转载时对个别标点,及中英混排格式有微小更改
单机时代,采用单块磁盘进行数据存储和读写的方式,由于寻址和读写的时间消耗,导致 I/O 性能非常低,且存储容量还会受到限制。另外,单块磁盘极其容易出现物理故障,经常导致数据的丢失。因此大家就在想,有没有一种办法将多块独立的磁盘结合在一起组成一个技术方案,来提高数据的可靠性和 I/O 性能呢。在这种情况下,RAID 技术就应运而生了。
什么是RAID?
RAID 是 “Redundant Array of Independent Disk" 的缩写,中文意思是独立冗余磁盘阵列。简单地解释,就是将 N 台硬盘通过RAID Controller(分 Hardware,Software)结合成虚拟单台大容量的硬盘使用。RAID 的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。
简单的说,RAID 是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。根据磁盘陈列的不同组合方式,可以将 RAID 分为不同的级别。
RAID的种类
磁盘阵列中针对不同的应用使用的不同技术,称为 RAID level,而每一 level 都代表着不同技术,目前业界公认的标准是 RAID 0 ~ RAID 5。这个 level 并不代表技术的高低,level 5并不高于 level 3,level 1 也不低过 level 4,至于要选择那一种 RAID level 的产品,纯视用户的操作环境(operating environment)及应用(application)而定与 level 的高低没有必然的关系。
在RAID有一基本概念称为 EDAP(Extended Data Availability and Protection),其强调扩充性及容错机制,也是各家厂商如:Mylex,IBM,HP,Compaq,Adaptec,Infortrend 等诉求的重点,包括在不须停机情况下可处理以下动作:
- RAID 磁盘阵列支持自动检测故障硬盘
- RAID 磁盘阵列支持重建硬盘坏轨的资料
- RAID 磁盘阵列支持不须停机的硬盘备援 Hot Spare
- RAID 磁盘阵列支援支持不须停机的硬盘替换 Hot Swap
- RAID 磁盘阵列支持扩充硬盘容量等
RAID 0:无差错控制的带区组
要实现 RAID 0 必须要有两个以上硬盘驱动器,RAID 0 实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。如果刚好所需要的数据在不同的驱动器上效率最好。它不需要计算校验码,实现容易。它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。不应该将它用于对数据稳定性要求高的场合。如果用户进行图象(包括动画)编辑和其它要求传输比较大的场合使用 RAID 0 比较合适。同时,RAID 可以提高数据传输速率,比如所需读取的文件分布在两个硬盘上,这两个硬盘可以同时读取。那么原来读取同样文件的时间被缩短为 1/2 。在所有的级别中,RAID 0 的速度是最快的。但是 RAID 0 没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。
如果两块硬盘:160G + 120G = 240G
RAID 1:镜象结构
对于使用这种 RAID 1 结构的设备来说,RAID 控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。通过下面的结构图您也可以看到必须有两个驱动器。因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。它比较容易设计和实现。每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。因为 RAID 1 的校验十分完备,因此对系统的处理能力有很大的影响,通常的 RAID 功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。当您的系统需要极高的可靠性时,如进行数据统计,那么使用 RAID 1 比较合适。而且 RAID 1 技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1 的数据安全性在所有的 RAID 级别上来说是最好的。但是其磁盘的利用率却只有50%,是所有 RAID 级别中最低的。
如果两块硬盘:160G + 120G = 120G
RAID 2:带海明码校验
从概念上讲,RAID 2 同RAID 3类似,两者都是将数据条块化分布于不同的硬盘上, 条块单位为位或字节。然而RAID 2 使用一定的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息,使得 RAID 2 技术实施更复杂。因此,在商业环境中很少使用。上图右边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码 ECC 码的硬盘,对于控制器的设计来说,它又比 RAID 3, 4或5 要简单。没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。输出数据的速率与驱动器组中速度最慢的相等。
RAID 3:带奇偶校验码的并行传送
RAID 3 这种校验码与 RAID 2 不同,只能查错不能纠错。它访问数据时一次处理一个带区,这样可以提高读取和写入速度,它像 RAID 0 一样以并行的方式来存放数据,但速度没有 RAID 0 快。校验码在写入数据时产生并保存在另一个磁盘上。需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。用软件实现 RAID 控制将是十分困难的,控制器的实现也不是很容易。它主要用于图形(包括动画)等要求吞吐率比较高的场合。不同于 RAID 2 、RAID 3 使用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。如果奇偶盘失效,则不影响数据使用。RAID 3 对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为 (n-1) / n 。
RAID 4:带奇偶校验码的独立磁盘结构
RAID 4 和 RAID 3 很像,不同的是,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。在图上可以这么看,RAID 3 是一次一横条,而 RAID 4 一次一竖条。它的特点和 RAID 3 也挺像,不过在失败恢复时,它的难度可要比 RAID 3 大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID 5:分布式奇偶校验的独立磁盘结构
从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的 p0 代表第 0 带区的奇偶校验值,其它的意思也相同。RAID5 的读出效率很高,写入效率一般,块式的集体访问效率不错。因为奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。RAID 5 也是以数据的校验位来保证数据的安全,但它不是以单独硬盘来存放数据的校验位,而是将数据段的校验位交互存放于各个硬盘上。这样,任何一个硬盘损坏,都可以根据其它硬盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。RAID 3 与RAID 5 相比,重要的区别在于 RAID 3 每进行一次数据传输,需涉及到所有的阵列盘。而对于 RAID 5 来说,大部分数据传输只对一块磁盘操作,可进行并行操作。在 RAID 5 中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。RAID 5 的话,优点是提供了冗余性(支持一块盘掉线后仍然正常运行),磁盘空间利用率较高 (N-1/N) ,读写速度较快(N-1倍)。RAID 5 最大的好处是在一块盘掉线的情况下,RAID 照常工作,相对于 RAID 0 必须每一块盘都正常才可以正常工作的状况容错性能好多了。因此 RAID5 是 RAID 级别中最常见的一个类型。RAID 5 校验位即P位是通过其它条带数据做异或 (xor) 求得的。计算公式为 P = D0 xor D1 xor D2 … xor Dn,其中 p 代表校验块,Dn 代表相应的数据块,xor 是数学运算符号异或。
RAID6:两种存储的奇偶校验码的磁盘结构
名字很长,但是如果看到图,大家立刻会明白是为什么,请注意 p0 代表第 0 带区的奇偶校验值,而 pA 代表数据块A的奇偶校验值。它是对 RAID 5 的扩展,主要是用于要求数据绝对不能出错的场合。当然了,由于引入了第二种奇偶校验值,所以需要 N+2 个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。我想除了军队没有人用得起这种东西。
RAID 7:优化的高速数据传送磁盘结构
RAID 7 所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,提高系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。允许使用 SNMP 协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。可以连接多台主机,因为加入高速缓冲存储器,当多用户访问系统时,访问时间几乎接近于0。由于采用并行结构,因此数据访问效率大大提高。需要注意的是它引入了一个高速缓冲存储器,这有利有弊,因为一旦系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和 UPS 一起工作。当然了,这么快的东西,价格也非常昂贵。
RAID 10/01:高可靠性与高效磁盘结构
这种结构无非是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速还可以互为镜像的目的。大家可以结合两种结构的优点和缺点来理解这种新结构。这种新结构的价格高,可扩充性不好。主要用于容量不大,但要求速度和差错控制的数据库中。
其中可分为两种组合:RAID 10 和 RAID 01
RAID 10 是先镜射再分区数据。是将所有硬盘分为两组,视为是 RAID 0 的最低组合,然后将这两组各自视为 RAID 1 运作。RAID 10 有着不错的读取速度,而且拥有比 RAID 0 更高的数据保护性。
RAID 01 则是跟 RAID 10 的程序相反,是先分区再将数据镜射到两组硬盘。它将所有的硬盘分为两组,变成 RAID 1 的最低组合,而将两组硬盘各自视为 RAID 0 运作。RAID 01 比起 RAID 10 有着更快的读写速度,不过也多了一些会让整个硬盘组停止运转的机率;因为只要同一组的硬盘全部损毁,RAID 01 就会停止运作,而 RAID 10 则可以在牺牲 RAID 0 的优势下正常运作。
RAID 10 巧妙的利用了 RAID 0 的速度以及 RAID 1 的保护两种特性,不过它的缺点是需要的硬盘数较多,因为至少必须拥有四个以上的偶数硬盘才能使用。
RAID 50:被称为分布奇偶位阵列条带
同 RAID 10 相仿的,它具有 RAID 5 和 RAID 0 的共同特性。它由两组 RAID 5 磁盘组成(每组最少3个),每一组都使用了分布式奇偶位,而两组硬盘再组建成 RAID 0 ,实验跨磁盘抽取数据。RAID 50 提供可靠的数据存储和优秀的整体性能,并支持更大的卷尺寸。即使两个物理磁盘发生故障(每个阵列中一个),数据也可以顺利恢复过来。
RAID 50 最少需要6个驱动器,它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序。
RAID 53:称为高效数据传送磁盘结构
结构的实施同 Level 0 数据条阵列,其中,每一段都是一个 RAID 3 阵列。它的冗余与容错能力同 RAID 3。这对需要具有高数据传输率的 RAID 3 配置的系统有益,但是它价格昂贵、效率偏低。
RAID 1.5:一个新生的磁盘阵列方式
它具有 RAID 0+1 的特性,而不同的是,它的实现只需要2个硬盘。从表面上来看,组建 RAID 1.5 后的磁盘,两个都具有相同的数据。当然,RAID 1.5 也是一种不能完全利用磁盘空间的磁盘阵列模式,因此,两个 80GB 的硬盘在组建RAID 1.5后,和 RAID 1 是一样的,即只有 80GB 的实际使用空间,另外 80GB 是它的备份数据。如果把两个硬盘分开,分别把他们运行在原系统,也是畅通无阻的。但通过实际应用,我们发现如果两个硬盘在分开运行后,其数据的轻微改变都会引起再次重组后的磁盘阵列,没法实现完全的数据恢复,而是以数据较少的磁盘为准。
JBOD
严格的说,JBOD 并不属于 RAID 的范畴,只是将多个磁盘空间合并成一个大的逻辑磁盘,不具有错误冗余机制。资料的存放机制是由第一颗磁盘开始依序往后存放,即操作系统看到的是一个大磁盘(由许多小磁盘组成)。但如果磁盘损毁,则该颗硬盘上的所有资料将无法救回。若第一颗硬盘损坏,通常无法作救援(因大部分档案系统将档案表存在磁盘前端,即第一颗),失去档案表即失去一切资料。
如果两块硬盘:160G + 120G = 280G
在实际的应用中,RAID2~4 并不存在,因为 RAID5 已经涵盖了所需的功能。因此 RAID2~4 目前只有在研究领域有实作,而在实际应用上则以 RAID 0、1、0+1、5或 RAID6 为主。但是对于我们普通用户来说,用的最多的也就是 RAID 0、1、0+1 和 RAID 5。
硬 RAID 全软 RAID 半软 RAID
根据事先方式不同,RAID 分为软件磁盘阵列(软 RAID)和硬件磁盘阵列(硬 RAID) 以及硬件辅助磁盘阵列(半软、半硬)三种类型。
硬件磁盘阵列(Hardware RAID)
简单来说就是全部通过用硬件来实现 RAID 功能的就是硬 RAID ,比如:各种 RAID 卡,还有主板集成能够做的 RAID 都是硬 RAID。
所以硬 RAID 就是用专门的 RAID 控制器(RAID 卡)将硬盘和电脑连接起来,RAID 控制器负责将所有的RAID成员磁盘配置成一个虚拟的 RAID 磁盘卷。对于操作系统而言,他只能识别到由 RAID 控制器配置后的虚拟磁盘,而无法识别到组成 RAID 的各个成员盘。
硬 RAID 全面具备了自己的 RAID 控制/处理与 I/O 处理芯片,甚至还有阵列缓冲(Array Buffer),对 CPU 的占用率以及整体性能中最有优势。
优点:
- 对 CPU 的占用率以及整体性能是这三种类型中最优势的
- 有硬盘丢失时可以实现重建,如果 RAID 卡损坏时也可以更换 RAID 卡
缺点:
- 设备成本是三种类型中最高的
- 需要有一定技术知识
软件磁盘阵列(Software RAID)
反而言之,通过用操作系统来完成 RAID 功能的就是软 RAID ,比如:在 Linux 操作系统下,用3块硬盘做 RAID5 。也就是不使用 RAID 控制器(业界称其为 RAID 协处理器―RAID Co-Processor )与 I/O 芯片,直接通过软件层实现的 RAID,所有功能都是操作系统(OS)与CPU来完成,可想而知这是效率最低的一种 RAID。
与硬 RAID 不同的是,软 RAID 的各个成员盘对于操作系统来说是可见的,但操作系统并不把各个成员盘呈现给用户,而只是把通过软件层配置好的虚拟 RAID 卷呈现给用户,使用户可以像使用一个普通磁盘一样使用 RAID 卷。
优点:
- 成本低,只需要主板支持即可,不需要任何磁盘阵列卡
- 实现简单
缺点:
- 为耗损较多 CPU 资源运算 RAID ,导致发热等问题,也就不够稳定
- 依赖操作系统,而操作系统。。。。
- 若主板损坏,可能难以购买同款主板重建 RAID
硬件辅助磁盘阵列(Hardware-Assisted RAID)
与硬 RAID 和全软 RAID 相比,半软 RAID 需要一张 RAID 卡,以及厂商所提供的驱动程序。但是半软半硬 RAID 缺乏自己的 I/O 处理芯片,所以这方面的工作仍要由 CPU 与驱动程序来完成。而且,半软半硬 RAID 所采用的 RAID 控制/处理芯片的能力一般都比较弱,不能支持高的 RAID 等级。这款 RAID 较易迁移到其他电脑。
优点:
- 性能以及稳定性较软 RAID 有不少提升
- 较易迁移到其他电脑
缺点:
- 比上不足比下有余
备注:使用硬盘组 RAID 时,最好购买不同品牌或相同品牌不同批次的硬盘,因为相同品牌相同批次的硬盘有非常大的概率同时损坏。