1. 程式人生 > >GIS+=地理資訊+雲端計算技術——私有云架構設計(3)儲存資源規劃

GIS+=地理資訊+雲端計算技術——私有云架構設計(3)儲存資源規劃

--------------------------------------------------------------------------------------

宗旨:專注於"GIS+"前沿技術的研究與交流,將雲端計算技術、大資料技術、容器技術、物聯網與GIS進行深度融合,探討"GIS+"技術和行業解決方案

轉載說明:文章允許轉載,但必須以連結方式註明源地址,否則追究法律責任!

--------------------------------------------------------------------------------------


題記

儲存是指根據不同的應用環境,通過採取合理、安全、有效

的方式將資料儲存到某些介質上並能保證有效的訪問。

儲存包含兩個方面的含義:

  • 資料臨時或長期駐留的物理媒介。

  • 保證資料完整安全存放的方式或行為。

儲存技術

資料備份越來越受到人們的重視,併成為網路建設過程中必考慮的內容。網路儲存裝置根據儲存技術的不同,主要分為三類:DAS(Direct Attached Storage)、NAS(Network Attached Storage)和SAN(Storage Area Network)。

DAS(DirectAttached Storage)直接附加儲存。通過儲存裝置匯流排介面連線伺服器。
•優點:DAS購置成本低,配置簡單 •缺點:伺服器本身成為瓶頸、多個伺服器來說,裝置分散,無法管理,備份操作複雜。

NAS(NetworkAttached Storage)網路附加儲存。通過網路介面與網路直接相連,由使用者通過網路訪問。NAS就是瘦客戶端的儲存裝置。
•優點:通過網路將檔案分發多臺客戶端,易於部署,應用於高效的檔案共享任務。 •缺點:小檔案傳輸效率低。
SAN(StorageAreaNetwork)儲存區域網路,是一種高速的、專門用於儲存操作的獨立網路。SAN能夠為其上的任意主機和任意儲存提供專用的通訊通道。SAN將儲存裝置從伺服器中獨立出來,實現了伺服器層次上的儲存資源共享。
•優點:專有的網路可以滿足吞吐率、可用性、可靠性、可擴充套件性和可管理性等方面的要求。
•缺點:較前兩種的成本增加。

SAN主要有如下兩種儲存方案:

  • FC SAN

早期的SAN採用的是FC技術,稱為FC SAN。FC SAN在20世紀末得到大規模應用。FC SAN技術較為成熟,且效能較為優異,但存在相容性差,成本高昂,擴充套件能力差和異構化嚴重等問題,在一定程度上限制了其的繼續發展。


  • IP SAN

IP SAN遵循IETF的iSCSI標準,通過高速乙太網絡連線伺服器和後端儲存系統,將SCSI指令和資料塊經過高速乙太網傳輸。

IP SAN具有高可靠性、高可擴充套件性、低成本的特性,在千兆乙太網環境下IP SAN的資料交換流量效能遜色於FC SAN。但IP SAN發展迅速,其競爭力日益加強。

主流的儲存陣列由於同時提供光纖通道介面和普通網線介面,因此能夠利用FC SAN和IP SAN結構與伺服器連線。


儲存方式

檔案儲存和塊儲存是比較傳統的儲存方式。隨著資料可擴充套件性和安全性的要求不斷提高,這兩種儲存方式逐漸不能滿足需要。物件儲存被提出,受到廣泛關注,逐漸成為主流的儲存方式。

=======================物件儲存=======================

  • 概念

物件儲存OBS(Object Based Storage)是以物件(Object)為基本單元的儲存方式,如圖下圖所示。物件儲存基於檔案系統,通過檔案系統來儲存訪問資料。


  • 組成

物件儲存系統由以下幾個部分組成:

  • 物件

每個物件都是資料和資料屬性集的綜合體。資料屬性可以根據應用的需求進行設定,包括資料分佈、服務質量等。物件維護自己的屬性,簡化了儲存系統的管理任務,增加了靈活性。物件的大小可以不同,可以包含整個資料結構,如檔案、資料庫表項等。

  • 基於物件的儲存裝置OSD

每個OSD(Object-based Storage Device)都是一個智慧裝置,具有自己的儲存介質、處理器、記憶體以及網路系統等,負責管理本地的物件,是物件儲存系統的核心。OSD的主要功能為資料儲存和安全訪問。OSD同塊裝置的不同不在於儲存介質,而在於兩者提供的訪問介面。

  • 元資料伺服器MDS

MDS(Metadata Server)為客戶端提供元資料,主要是檔案的邏輯檢視,包括檔案與目錄的組織關係、每個檔案所對應的OSD等。同時為客戶端提供高速緩衝儲存器Cache一致性保證及客戶端認證服務。

  • 檔案系統

檔案系統對使用者的檔案操作進行解釋,並在元資料伺服器和OSD間通訊,完成所請求的操作。

  • 網路連線

網路連線是物件儲存系統的重要組成部分。它將客戶端、MDS和OSD連線起來,構成一個完整的系統。

在OpenStack私有云元件中,通常使用Swift來實現物件儲存,我們可以通過廉價的伺服器而且在不適用RAID的方式(無需花費RAID卡)也可以實現資料的冗餘和可靠,實現類似於百度雲盤或者360雲盤的功能,我們可以將相關資料進行上傳或下載等操作。

===========================塊儲存================================
  • 概念

塊儲存是以塊為基本單元的儲存方式,如下圖所示。塊泛指底層磁碟上的扇區組合,某個檔案可以對應一個或者多個這樣的塊。塊裝置需要記錄每個儲存資料塊在裝置上的位置,增加了儲存系統的管理任務。


塊儲存裝置也稱為裸裝置,通過SCSI、SAS或FC SAN與伺服器連線。伺服器直接通過SCSI、SAS或FC SAN協議控制和訪問資料。

塊傳輸方式不存在資料打包/解包的過程,可提供更高的傳輸效能。絕大多數資料庫使用塊儲存裝置,如FC磁碟儲存系統。

對OpenStack來說,通過Cinder來實現塊儲存的功能,我們可以將整個儲存池劃分為小塊儲存單元,然後將某個儲存單元掛載到相應的虛擬機器,類似與我們的筆記本儲存不夠,掛載一個行動硬碟。

當然,對於快儲存的使用,我們可以參考後面介紹不同的硬碟材質來實現不同的業務需求,裡面我們可以將SATA盤、SAS盤、SSD盤這種不同效能的儲存進行混搭,然後為使用者不同的需求。

例如SATA盤可以儲存大容量的但是無需高IOPS效能的資料

SAS盤就是普通的伺服器硬碟,我們的一般資料就可以採用這個材質

SSD就是一個高效能盤,價格較高,但是我們可以儲存熱資料來提高IOPS

==============================檔案儲存==============================
  • 概念

檔案儲存是以檔案為基本單元的儲存方式,如圖所示。


檔案儲存裝置通過乙太網與伺服器連線。伺服器通過NFS、CIFS、HTTP、FTP等協議進行資料訪問。資料通過乙太網傳輸,資料有打包/解包的過程。檔案儲存裝置以NAS為主,主要用於使用者檔案共享。

檔案儲存主要應用於以下場景:

  • 針對虛擬伺服器的儲存

  • 檔案服務

  • 資料保護

  • 歸檔和內容目錄

  • 高效能運算


儲存介面

常見的儲存介面包括SCSI、iSCSI、SAS、SATA、FC、FCoE等。

可靠性技術

儲存的可靠性技術主要有RAID、備份、快照、映象、群集併發存取等。

關於RAID,一般情況下有RAID0,RAID1,RAID5,RAID01,RAID10,不過以RAID5,RAID01,RAID10最為常見。


RAID0可將同一檔案系統的多個小部分,以條帶的單元儲存在多個物理磁碟中。

•優點:提高效能。 •缺點:有磁碟離線,整個陣列將不可用。

RAID1可將寫入一個磁碟的內容以複本儲存在另一個磁碟中。

•優點:資料安全 •缺點:浪費一半儲存空間 那麼RAID01和RAID10是解決單個RAID無法解決的問題,從上圖可以非常容易看出。

儲存容量

關於儲存容量,使用者無需一步到位,本身雲環境的所有角色都可以實現橫向擴充套件,所以我們對於容量夠用即可,最好能夠考慮多材質混合使用,提供效率,而且如果需要 保證儲存資料的高可靠性,我們一般需要採用1:3的儲存需求,例如1GB的儲存,需要3GB的容量保證可靠性。

還需要了解裸容量和可用容量的區別:

裸容量
裸容量是指所有硬碟物理容量之和,如:5塊300G硬碟的裸容量為5×300G=1.5T

可用容量
可用容量是指硬碟在經過raid技術處理之後,實際能夠使用的容量,如:5塊300G硬碟做raid,無熱備盤,可用容量為(5-1)×300G=1.2T

儲存效能

當考慮OpenStack塊裝置的效能時,硬體和架構的選擇就顯得非常重要。塊儲存可以使用企業級後端系統如NetApp或EMC的產品,也可以使用橫向擴充套件儲存如GlusterFS和Ceph,更可以是簡單的在節點上直接附加的儲存。塊儲存或許是雲所關注的貫穿主機網路的部署,又或許是前端應用程式介面所關注的流量效能。無論怎麼,都得在控制器和計算主機上考慮使用專用的資料儲存網路和專用的介面。


當考慮OpenStack物件儲存的效能時,有幾樣設計選擇會影響到效能。使用者訪問物件儲存是通過代理服務,它通常是在硬體負載均衡之後。由於高彈性是此儲存系統的天生特性,所以複製資料將會影響到整個系統的效能。在此例中,儲存網路使用10 GbE(或更高)網路是我們所建議的。

儲存關鍵因素

通用型OpenStack雲有很多屬性,影響儲存硬體的選擇的關鍵因素有以下:

  • 容量:對於資源節點的硬體選擇來說,須為雲服務提供足夠的儲存。定義初始的需求和確保設計是支援增加的能力是很重要的。為物件儲存選擇硬體節點須支援大量的廉價磁碟,無須冗餘,無須RAID控制卡。為塊儲存選擇硬體節點須具備支援高速儲存解決方案,擁有RAID控制卡保證效能,以及在硬體層的冗餘能力。選擇硬體RAID控制器,是其可以自動修復損壞的陣列,以幫助人工的介入,替代及修復已經降級或損壞的儲存裝置。
  • 效能:對於物件儲存的磁碟選擇來說,不需要速度太快的磁碟。我們建議物件儲存節點利用最佳的每TB開銷比即可。與此相反,為塊儲存服務選擇磁碟,則須利用提高效能的特性來選擇,比如使用SSD或flash磁碟來提供高效能的塊儲存池。即使是為例項執行的臨時的磁碟也得考慮效能。如果計算池希望大量採用臨時儲存,或者是要求非常高的效能,就需要部署上述塊儲存硬體的解決方案。
  • 容錯:物件儲存資源節點對於硬體容錯或RAID控制器沒有任何的要求。沒必要為物件儲存硬體規劃容錯是因為物件儲存服務本身就提供了在zone之間的複製。塊儲存節點、計算節點以及雲控制器節點都須在硬體層有容錯機制,使用硬體RAID控制器的話請確認RAID配置的級別。RAID級別的選擇對於雲的需求來說須效能和可用性兼顧。

參考文獻:@華為雲端計算 @OpenStack架構設計指南