主流超融合廠商技術對比
超融合基礎架構(HCI)是繼伺服器虛擬化技術之後的一次重大IT技術革新,其特點是通過分散式儲存技術將各個計算節點(Hypervisor)的儲存資源整合為一個統一的儲存資源池,給虛擬化平臺提供儲存服務,實現計算、儲存、網路、虛擬化的統一管理和資源的橫向擴充套件,保障使用者業務的高可用。
在超融合基礎架構中,虛擬化是基礎,而分散式儲存則是超融合的技術核心。從架構而言,HCI的分散式儲存通常有兩種方式來支援虛擬化,一種是以Nutanix NGFS為代表的採用控制虛擬機器方式支援Hypervisor,如圖一;另一種是直接在Hypervisor中整合分散式儲存功能,如VSAN。業界除了VSAN外,其它HCI全部採用控制虛擬機器方案支援VMware虛擬化,而對於KVM虛擬化,各廠家採用在物理主機中實現分散式儲存功能。
圖一
主流的超融合廠商有Nutanix(NGFS),VMware(VSAN),以及國內新興代表力量如華為(FusionCube),H3C(OneStor),SMARTX(ZBS),深信服(aSAN),和道熵(Titlis)。其中Nutanix的NGFS和SMARTX 的ZBS 脫胎於Google的GFS分散式檔案系統;華為的FusionCube和H3C的OneStor是基於Ceph的定製化開發;而深信服的aSAN則是基於GlusterFS;VSAN在很大程度上和Ceph架構類似;而道熵的Titlis分散式儲存在介面層相容了標準Ceph介面,底層採用了磁碟陣列中常見的儲存虛擬化技術。
根據對超融合產品的重要程度,我們選擇了幾方面的技術功能進行了相關考察:
1、抗靜默錯誤
2副本或3副本機制可以保證在硬碟損壞甚至節點宕機的惡劣環境下,仍然保持高可用。但是面對“靜默錯誤”的情況,分散式塊儲存的副本機制則無能為力,騰訊雲在不久前的“靜默錯誤”風波證明了這一點,後果也是相當嚴重,使用者的所有資料全部丟失,無法修復。
靜默錯誤譯自英文:Silent Data Corruption。磁碟在使用過程中,除了會發生硬體錯誤、韌體BUG或者軟體BUG、供電問題、介質損壞等可以正常補貨和告警的常規故障之外,還會發生一些無法預警的錯誤,使用者直到使用的時候才發現數據是錯誤的、損壞的,這就是靜默錯誤。簡而言之,就是使用者在使用的時候發現寫入資料和讀取出來的不一致。
“靜默錯誤”的概率不低。硬碟的誤位元速率是“靜默錯誤”產生的原因之一,根據官方資料,企業級硬碟每120Tb就會有一位靜默錯誤的概率;另一方面,磁碟次記錄磨損、磁碟幻象寫、磁碟指向錯誤、DMA校驗錯誤等等,都有可能引發靜默錯誤,主機板老化、記憶體條鬆動、連線線和卡的鬆動等都會導致讀出的資料不是當初寫入的資料。
線上資料完整性校驗技術被認為是唯一能夠有效應對靜默錯誤的關鍵技術。 線上資料完整性校驗技術確保每個資料塊都有相對應的資料校驗碼,資料在讀出時,必須與校驗碼匹配後才交付前端應用,否則,啟動資料自修復機制。目前,在所有的超融合廠商中,只有Nutanix的NDFS和道熵的Titlis支援線上資料完整性校驗和資料自修復技術。 VSAN只在全快閃記憶體環境中具備線上資料完整性校驗功能。
2、應對大延遲問題
分散式儲存常產生大延遲現象,隨著節點數增多,資料量增大而頻次提升。此現象的根源在於分散式儲存共有的資料在磁碟間隨機分佈的特徵造成的:小資料塊隨機落盤在不同節點磁碟上,由概率論可知,這就造成了每塊磁碟上的工作流呈現“正態分佈”,儘管多數磁碟的工作負載呈平均狀態,而正態分佈的“尾部效應”可知,有極少部分磁碟的工作負載遠遠超過平均值,成為系統中的“熱點磁碟”而構成效能瓶頸,而帶來大延遲問題。
市場上的分散式儲存技術(除道熵Titlis外)有一個共同點,就是均採用2副本或3副本的方式實現資料在不同節點的磁碟上隨機均勻分佈,從而實現高可用和磁碟故障保護。在應對大延遲問題方面,道熵Titlis採用儲存虛擬化技術將節點記憶體儲資源池化管理,不僅實現節點內RAID保護,同時實現了節點內負載自動均衡功能,有效避免由“熱點磁碟”導致的大延遲問題。
3、Flash加速
Flash快取加速技術是分散式儲存提升IOPS效能的重要手段。基於Ceph或GlusterFS的超融合廠商在該項技術面臨挑戰,因為原生的Ceph並沒有一個成熟的Flash快取技術手段,需要各個廠家自行研發解決方案。目前大都在Flashcache、bcache、lvmcache基礎上進行二次開發,總體而言,其穩定性和效能差強人意。
VSAN 採用基於LRU策略的Cache策略,其SSD和HDD的配比關係最大1:1,最小1:7。Nutanix採用基於LRU的Flash 分層策略,其SSD容量至少為虛擬機器佔用容量的10%。道熵的Titlis,則採用自適應的LRU和LFU 快取替換策略,能夠在保持較高命中率的前提下自動適應業務工作流的變化,且無需要求較高的SSD與HDD配比關係。
4、其他特徵
?Nutanix NDFS為了優化讀寫速度,儘可能會將虛擬機器的資料保存於其所在的物理主機中;並支援LZ4資料壓縮以及資料去重。
?VSAN的突出亮點在於它是唯一在Hypervisor層面支援VMware虛擬化的超融合。
?華為的FusionCube與H3C的OneStor具有Ceph的享譽的穩定性,而其在效能上的表現更多依賴於硬體能力。
?SMARTX的技術路線與Nutanix NDFS非常相似。
?深信服的aSAN是唯一支援2節點的超融合,但伴隨著腦裂的風險;其超融合最大的特點在於體現了深信服特長的安全虛擬化。
?道熵的Titlis在優化寫效能方面採用了隨機寫轉化為順序寫技術,支援保護LZ4和GZIP1-9等資料壓縮,提供Site-to-Site遠端複製和內建的資料備份功能。
總結:Nutanix,VSAN和華為在品牌中佔據優勢;以效能和架構先進性而論,道熵的Titlis處於明顯優勢;在安全虛擬化方面深信服佔據領先地位;而對已經使用VMware虛擬化的使用者而言,VSAN是一個合情合理的選擇。對使用者來說最重要的一點,超融合承載使用者業務關鍵資料,資料安全至關重要,按抵禦靜默錯誤的能力而言,Nutanix和道熵Titlis是最讓人放心的選擇。
圖二、超融合技術對比
【本文版權歸儲存線上所有,未經許可不得轉載。文章僅代表作者看法,如有不同觀點,歡迎新增儲存線上微信公眾號(微訊號:doitmedia)進行交流。】