網路儲存技術有哪些?
在以資料為中心的資訊時代,儲存已成為IT基礎設施的核心之一。資料儲存已經成為繼網際網路熱潮之後的又一次技術浪潮,它將網路帶入了以資料為中心的時代。
由於近年來C/S計算模型的廣泛採用,伺服器都帶有自己的儲存系統,資訊分散到各個伺服器上,形成了所謂的“資訊孤島”,不利於資訊整合與資料共享。而網路儲存就是一種利於資訊整合與資料共享,且易於管理的、安全的新型儲存結構和技術。目前,網路儲存已經成為一種新的儲存技術,本文將從體系結構的角度簡述目前的儲存系統。

直接連線儲存DAS
直接連線儲存DAS(Direct Attached Storage)是對SCSI匯流排的進一步發展。它對外利用SCSI匯流排通道和多個主機連線,解決了SCSI卡只能連線到一個主機上的缺陷。對內利用SCSI匯流排通道或FC通道、IDE介面連線多個磁碟,並實現RAID技術,形成一個磁碟陣列,從而解決了資料容錯、大儲存空間的問題。
DAS是以伺服器為中心的儲存體系結構,難以滿足現代儲存應用大容量、高可靠、高可用、高效能、動態可擴充套件、易維護和開放性等多方面的需求。解決這一問題的關鍵是將訪問模式從以伺服器為中心轉化為以資料和網路為中心,實現擴充套件容量、增加效能和延伸距離,尤其是實現多個主機資料的共享,這推動了儲存與計算的分離,即網路儲存的發展。
網路附屬儲存NAS
NAS(附網儲存系統)系統是用一個裝有優化的檔案系統和瘦作業系統的專用資料儲存伺服器,提供跨平臺的檔案共享功能。NAS產品與客戶之間的通訊採用NFS(Network File System)協議、CIFS(Common Internet File System)協議,這些協議執行在IP之上。。
儘管NAS集成了系統、儲存和網路技術,具有擴充套件性強、使用與管理簡單、跨平臺檔案共享、效能優化等特點。然而,NAS系統也有其潛在的侷限性。首先是它受限的資料庫支援,NAS檔案伺服器不支援需大量依賴於資料庫處理結果的應用(塊級應用)。其次是缺乏靈活性,它是一種專用裝置。最後,NAS備份與恢復的實現相當困難。
儲存區域網SAN
SAN(儲存區域網)是通過專用高速網將一個或多個網路儲存裝置(如磁碟陣列RAID)和伺服器連線起來的專用儲存系統。
SAN以資料儲存為中心,採用可伸縮的網路拓撲結構,提供SAN內部任意節點之間的多路可選擇的資料交換,並且將資料儲存管理集中在相對獨立的儲存區域網內,實現最大限度的資料共享和資料優化管理,以及系統的無縫擴充。正是由於光纖通道技術的發展,使得SAN得以支援遠距離通訊、易於擴充套件、能夠解決網路資料的儲存備份、高可用性、災難恢復等有關問題,它可以提供高效能資料管道和共享的集中管理的儲存裝置。因此採用網路和通道技術相互融合的光纖通道介面的SAN將LAN上的儲存轉換到主要由儲存裝置組成的專用網路上,使得資料的訪問、備份和恢復不影響LAN的效能,在大量資料訪問時,不會大幅度降低網路效能。
SAN主要用於儲存量大的工作環境,並且SAN的適用性和通用性較差,在系統的安裝和升級方面效率不高,且由於SAN使用專用網路(一般為光纖網路),相應的裝置價格昂貴,總體實現費用較高,侷限於大中型應用。
NAS和SAN技術都體現了資料儲存從傳統的伺服器中獨立出來的思想,它們是網路儲存領域中的兩個發展方向。隨著NAS和SAN之間的界限越來越模糊,其中更重要的區別可能就是在NAS/SAN混合系統中所採用的協議了:IP、光纖通道,或者iSCSI等。
IP儲存
傳統的SAN一般採用光纖通道技術,其成本高,距離受限制,因此基於IP的儲存正成為一個新的熱點,主要有FCIP(Fibre Channel over IP)、iFCP(Internet Fibre Channel Protocol)、mFCP(Metro Fibre Channel Protocol)、iSCSI(Internet SCSI)等技術。
上述協議有一個非常重要的共同點:都能充當SCSI命令集的傳輸機制。通過IP儲存介質與儲存裝置通訊的主機仍能表達SCSI的含意。而iSCSI則是從主機到儲存裝置的整個傳輸鏈路就是一條IP鏈路,沒有采用光纖通道,基於主機的應用通過IP與網路儲存裝置通訊。iSCSI保持了SCSI命令集的原狀,同時用IP取代了傳輸協議。但由於iSCSI通過對映至IP來保留SCSI命令集,存在延時問題,已有專門的iSCSI晶片組把轉換程式碼部署在硬體當中。IP-SAN的優勢在於:容易擴充套件成超大規模的儲存網路;不必受光纖通道SAN的距離限制,連線在IP網路上的伺服器都能享用網路儲存服務;連線靈活多樣,廉價成熟的網路架構成本,使得高階也能達到Gbps速率,有較高的效能價格比。
叢集儲存
由於目前一些儲存應用受容量可擴充套件性、效能可擴充套件性、可用性、可管理性的挑戰,“催生”了許多儲存集群系統的產生。叢集儲存是將每個儲存裝置作為一個儲存節點,通過高速網際網路絡連線起來,將資料分散開儲存在多臺獨立的裝置上,這些裝置可以獨立運作,相互之間又可以合作。每個I/O節點不僅可以訪問本節點的儲存空間,還可以訪問其他節點的儲存空間。所有儲存節點的空間以一個虛擬磁碟的方式提供給客戶端使用者。組成叢集儲存可以是塊級別的SAN叢集、檔案級別的NAS叢集和並行檔案系統的叢集,它們的訪問、特徵與適用環境參見表1。
叢集儲存有效地提升了儲存裝置的容量可擴充套件性、效能穩定性及系統可管理性。叢集儲存非常適合那些持續增長的所有規模的不同環境,實現即時供應(Just-in-time)儲存,避免破壞性升級和增加管理的複雜性。在大型資料中心或高效能運算中心的叢集儲存解決方案,具有高性價比,簡單、易於維護,高可靠性/可用性,具有非常高的整合頻寬等優點。叢集儲存最典型系統是Google體系結構,它是大量機器內硬碟的組合,含899個機架(每架80臺PC,每臺PC有2個硬碟),共79,112臺PC機,有158,224個硬碟, 總容量為6180 TB。
對等(P2P)儲存
對等結構(P2P)從使用者的使用方式來看,系統中每個使用者既向其他使用者提供資源,也從其他使用者那裡獲取資源。從體系結構來看,無中心結構,結點之間對等,通過互相合作來完成使用者任務。P2P結構的優點表現在:沒有中心結點,不易形成系統瓶頸、不易受攻擊,可擴充套件性好,自組織性好。
用P2P的方式在廣域網中構建大規模分散式儲存系統,將很多機器用對等的方式組織起來共同為使用者提供超大容量的資料儲存服務,儲存結點來自於儲存服務方,使用者使用儲存空間並付費,使用者還通過該平臺自主尋找其他結點進行資料備份和儲存空間交換。
P2P儲存與SAN的應用特點不同。前者主要強調可用性,而SAN主要面向的是高效能;P2P儲存易於維護、可擴充套件好、自配置功能強,特別是P2P儲存可以大量加盟的PC機和伺服器中的儲存器來組合成儲存系統,提供高頻寬的視訊服務和其他共享服務。
叢集儲存與P2P儲存都是分散式儲存。前者多在大型資料中心或高效能運算中心使用,後者是構建更大規模的分散式儲存系統,可以跨多個大型資料中心或高效能運算中心使用。
網格儲存
所有的儲存、伺服器和網路資源都被虛擬為一個資源池,並將其視作共享資源,這個資源池就是儲存網格。儲存網格的關鍵是虛擬化與統一性管理問題。
儲存網格既可應用於SAN環境,又可應用於NAS環境,它提供快速簡單的對於容量、效能、服務質量和/或連線協議的可升級性,可對公司所有資料進行統一檢視和管理,遠遠超出當前有限的虛擬化實現途徑,還可優化分散式企業遠端資料訪問的效能。儲存網格架構可實現資料庫和企業之間更緊密的應用整合,提供更高的資料保護,並可基於有關規定更簡單地管理資料資源。這些優勢極大降低了使用者在購買、擴容和管理時的費用。
面向物件的儲存
物件儲存模型綜合了NAS和SAN結構的特點,儲存物件具有檔案和塊二者的優點:像資料塊一樣在儲存裝置上被直接訪問,通過一個物件介面,像檔案一樣,在不同作業系統平臺上實現資料共享。在SAN中,定位邏輯和檔案系統都位於主機中。而在面向物件的儲存中,儲存空間不再需要執行在主機上的檔案系統管理,而由儲存系統自己管理和分配。
一個儲存物件是關於一個儲存裝置的邏輯位元組集合,它有儲存方法、資料屬性和儲存安全策略等。因此,物件儲存系統在基於檔案級的資料佈局、服務質量的靈活性和可管理等方面有很大改善。另外,基於物件儲存的最直接效果是將空間管理從儲存應用中剝離,如圖2所示,儲存裝置具有自管理特性,包括重新組織資料來提高效能、呼叫規則的備份和失敗恢復等。
未來儲存裝置的特性可能包括自配置、自保護、自優化、自恢復和自管理。將塊介面用物件來代替是一個發展方向。目前,面向物件的儲存仍然處在標準制定之中,還沒有得到廣泛的接受。
內容定址儲存CAS
內容定址儲存(Content Addressed Storage,CAS)是針對固定內容儲存需求的網路儲存技術。CAS具有面向物件儲存特徵,基於磁記錄技術,它按照所儲存資料內容的數字指紋定址,具有良好的可搜尋性、安全性、可靠性和擴充套件性。CAS、SAN和NAS的區別參見表2。CAS儲存技術的代表性產品是EMC公司的Centera 系統,目前還具有非常多的侷限性。
資料庫只針對的是結構化資料,而大量非結構化的資料管理有更大的儲存需求,而內容管理的物件是以各類非結構化資料為主的數字內容。CAS技術的出現使非結構化資料管理(包括企業的各種文件、報表、賬單、網頁、圖片、傳真、掃描影像,以及大量的多媒體音訊、視訊資訊等等的歸檔和查詢)成為儲存業新的熱點。未來需要一種新的基於內容管理的儲存系統平臺,它擴充套件了最新的物件儲存體系結構,支援物件倉儲和聯邦資料庫技術,支援關係和 XML作為主要資料模型,並緊密地集成了內容管理服務、工作流、訊息傳遞、分析和其他企業應用程式服務。
基於IB的儲存
InfiniBand(IB)是針對處理器和智慧I/O裝置之間資料流而提出的一種新體系結構,用於在伺服器中取代PCI匯流排。採用IB技術支援多處理器叢集,將允許伺服器提供更高的頻寬和可擴充套件能力,並增強了儲存裝置擴充的靈活性,並用於支援遠端I/O和遠端儲存器,如圖3所示。IB作為一種能夠為系統與儲存之間提供低延遲和高頻寬的連線解決方案,已經為一些使用者所接受,預期基於IB的儲存將在儲存領域會佔有一席之地。