1. 程式人生 > >RAID磁盤陣列是什麽(一看就懂)

RAID磁盤陣列是什麽(一看就懂)

概念 性能 使用率 tdi web uic raid6 兩個 形式

原文:RAID磁盤陣列是什麽(一看就懂)

技術分享圖片

在單機時代,采用單塊磁盤進行數據存儲和讀寫的方式,由於尋址和讀寫的時間消耗,導致I/O性能非常低,且存儲容量還會受到限制。另外,單塊磁盤極其容易出現物理故障,經常導致數據的丟失。因此大家就在想,有沒有一種辦法將多塊獨立的磁盤結合在一起組成一個技術方案,來提高數據的可靠性和I/O性能呢。

在這種情況下,RAID技術就應運而生了。

一、RAID 是什麽?

RAID ( Redundant Array of Independent Disks )即獨立磁盤冗余陣列,簡稱為「磁盤陣列」,其實就是用多個獨立的磁盤組成在一起形成一個大的磁盤系統,從而實現比單塊磁盤更好的存儲性能和更高的可靠性。

二、RAID 有哪些?

RAID方案常見的可以分為:

  • RAID0

  • RAID1

  • RAID5

  • RAID6

  • RAID10

下面來分別介紹一下。

  1. RAID0

RAID0 是一種非常簡單的的方式,它將多塊磁盤組合在一起形成一個大容量的存儲。當我們要寫數據的時候,會將數據分為N份,以獨立的方式實現N塊磁盤的讀寫,那麽這N份數據會同時並發的寫到磁盤中,因此執行性能非常的高。

技術分享圖片

RAID0 的讀寫性能理論上是單塊磁盤的N倍(僅限理論,因為實際中磁盤的尋址時間也是性能占用的大頭)

但RAID0的問題是,它並不提供數據校驗或冗余備份,因此一旦某塊磁盤損壞了,數據就直接丟失,無法恢復了。因此RAID0就不可能用於高要求的業務中,但可以用在對可靠性要求不高,對讀寫性能要求高的場景中。

那有沒有可以讓存儲可靠性變高的方案呢?
有的,下面的RAID1就是。

  1. RAID1

技術分享圖片
如圖,
RAID1 是磁盤陣列中單位成本最高的一種方式。因為它的原理是在往磁盤寫數據的時候,將同一份數據無差別的寫兩份到磁盤,分別寫到工作磁盤和鏡像磁盤,那麽它的實際空間使用率只有50%了,兩塊磁盤當做一塊用,這是一種比較昂貴的方案。

RAID1其實與RAID0效果剛好相反。RAID1 這種寫雙份的做法,就給數據做了一個冗余備份。這樣的話,任何一塊磁盤損壞了,都可以再基於另外一塊磁盤去恢復數據,數據的可靠性非常強,但性能就沒那麽好了。

了解了RAID0和RAID1之後,我們發現這兩個方案都不完美啊。


這時候就該 性能又好、可靠性也高 的方案 RAID5 登場了。

  1. RAID5

這是目前用的最多的一種方式。
因為 RAID5 是一種將 存儲性能、數據安全、存儲成本 兼顧的一種方案。

在了解RAID5之前,我們可以先簡單看一下RAID3,雖然RAID3用的很少,但弄清楚了RAID3就很容易明白RAID5的思路。

RAID3的方式是:將數據按照RAID0的形式,分成多份同時寫入多塊磁盤,但是還會另外再留出一塊磁盤用於寫「奇偶校驗碼」。例如總共有N塊磁盤,那麽就會讓其中額度N-1塊用來並發的寫數據,第N塊磁盤用記錄校驗碼數據。一旦某一塊磁盤壞掉了,就可以利用其它的N-1塊磁盤去恢復數據。

但是由於第N塊磁盤是校驗碼磁盤,因此有任何數據的寫入都會要去更新這塊磁盤,導致這塊磁盤的讀寫是最頻繁的,也就非常的容易損壞。

RAID5的方式可以說是對RAID3進行了改進。

RAID5模式中,不再需要用單獨的磁盤寫校驗碼了。它把校驗碼信息分布到各個磁盤上。例如,總共有N塊磁盤,那麽會將要寫入的數據分成N份,並發的寫入到N塊磁盤中,同時還將數據的校驗碼信息也寫入到這N塊磁盤中(數據與對應的校驗碼信息必須得分開存儲在不同的磁盤上)。一旦某一塊磁盤損壞了,就可以用剩下的數據和對應的奇偶校驗碼信息去恢復損壞的數據。

技術分享圖片

RAID5校驗位算法原理:P = D1 xor D2 xor D3 … xor Dn (D1,D2,D3 … Dn為數據塊,P為校驗,xor為異或運算)

RAID5的方式,最少需要三塊磁盤來組建磁盤陣列,允許最多同時壞一塊磁盤。如果有兩塊磁盤同時損壞了,那數據就無法恢復了。

  1. RAID6

為了進一步提高存儲的高可用,聰明的人們又提出了RAID6方案,可以在有兩塊磁盤同時損壞的情況下,也能保障數據可恢復。

為什麽RAID6這麽牛呢,因為RAID6在RAID5的基礎上再次改進,引入了雙重校驗的概念。

RAID6除了每塊磁盤上都有同級數據XOR校驗區以外,還有針對每個數據塊的XOR校驗區,這樣的話,相當於每個數據塊有兩個校驗保護措施,因此數據的冗余性更高了。

但是RAID6的這種設計也帶來了很高的復雜度,雖然數據冗余性好,讀取的效率也比較高,但是寫數據的性能就很差。因此RAID6在實際環境中應用的比較少。

  1. RAID10

RAID10其實就是RAID1與RAID0的一個合體。

我們看圖就明白了:

技術分享圖片

RAID10兼備了RAID1和RAID0的有優點。首先基於RAID1模式將磁盤分為2份,當要寫入數據的時候,將所有的數據在兩份磁盤上同時寫入,相當於寫了雙份數據,起到了數據保障的作用。且在每一份磁盤上又會基於RAID0技術講數據分為N份並發的讀寫,這樣也保障了數據的效率。

但也可以看出RAID10模式是有一半的磁盤空間用於存儲冗余數據的,浪費的很嚴重,因此用的也不是很多。

整體對比一下 RAID0、RAID1、RAID5、RAID6、RAID10 的幾個特征:

技術分享圖片

本文發布於微信公眾號「 不止思考 」,歡迎關註,交流 互聯網認知、工作管理、大數據、Web、區塊鏈技術。

技術分享圖片

RAID磁盤陣列是什麽(一看就懂)