1. 程式人生 > >史上最強超融合入門乾貨:超融合與傳統架構特性及收益詳細對比

史上最強超融合入門乾貨:超融合與傳統架構特性及收益詳細對比

在IT基礎架構領域工作有十年了,親眼目睹和參與了上一代網路儲存架構在中國的興起和衰敗。的確,新IT浪潮已經到來,超融合就是諸多風口之一,成為了近幾年IT業界備受關注的話題。雖然超融合這個概念已經被廠商熱炒了至少兩年,但看到市場上依舊存在著很多模糊的定義和理解,所以想整理一些學習筆記和個人見解,希望這些乾貨內容能對想入門的朋友有所幫助 。

一.超融合的核心特徵是什麼?

首先大家需要有一個概念,我們看到的這些名詞,事實上都是最早推行這些架構的廠商建立起來的,比如Nutanix最早推廣的超融合這個概念(HCI :Hyper Converge Infrastructure),目的無非是建立一個產品的品類,這是營銷慣常的手法,但老外玩兒的真的很溜很成功。

Nutanix起步的核心技術是分散式儲存,只是在部署架構上有了進一步創新,採用了這種融合的方式。其實這種創新在技術本身上並沒有大的難度,但很大程度上推進了分散式儲存的市場落地。

所以這就是超融合1.0的核心,但市場上很多人,被“融合”二字迷惑,甚至一些廠商,也就順水推舟,弱化儲存部分(弱化的原因是儲存真的很難做好),單純去強調融合,把一堆無關痛癢的東西整合起來。個人覺得這不是正途。

我認為真正撬動傳統IT市場的超融合1.0的特徵主要是兩點:

一是,基於X86伺服器架構的分散式儲存(這裡先不提SDS了,會增加新的混淆);

二是,分散式儲存和計算虛擬化部署在同一伺服器硬體內。

下面對比中能看到,給使用者帶來價值的重要特性中,大概70%是來自於分散式儲存,30%是超融合架構帶來的好處(比如管理簡化,使用成本的降低),但恰恰是這30%,讓使用者更願意從傳統架構切換到分散式架構上來。

二.超融合是革命性架構麼?革誰的命?

任何稱之為革命性的架構都應具備至少以下三個特徵:

一是,對使用者的使用習慣會有巨大的改變;

二是,為使用者帶來巨大的價值;

三是,新的廠商可以撬動傳統老牌廠商的市場。

以上三點,超融合產品都具備,前兩點在後面分別介紹,第三個可以通過國外的Nutanix、VMware(vSAN),中國的SmartX等廠商的案例描述中看到,他們所替代的產品大量的是老牌儲存廠商EMC、HDS等公司的儲存產品。有人會說Nutanix不也自己出伺服器虛擬化產品嗎?這是不是在替換VMware?但這已經是後來的故事,最初的Nutanix產品核心就是超融合架構的分散式儲存。使用者採購Nutanix並不需要替換原有的伺服器品牌(比如Dell)或者虛擬化品牌(比如VMware),只有儲存(比如EMC)是一定被替換掉的。這是重要的起點和切入點。如果最初Nutanix就是想以超融合的理念替換儲存、虛擬化甚至伺服器硬體,我想那會樹敵太多,幾乎沒有勝算。

三.為什麼超融合的架構會在近幾年才出現?

一個革命性的技術架構出現、成熟需要至少兩個核心因素:

一是,客戶的強烈需求;

二是,相關技術的成熟。

超融合架構的客戶需求來自於商業數字化和網際網路化對IT資源的使用速度和使用要求有了大幅提升。而以下相關技術對架構的市場落地有很大關係。

1. 分散式儲存架構

這個其實在網際網路公司用了很多年,分散式儲存可以很好地基於X86伺服器構建一個易擴充套件、高可靠的儲存資源池,是超融合的基礎。

2.SSD

毫無疑問,SSD對儲存架構的影響是巨大的,傳統機械硬碟的4K隨機效能只有300左右,而類似intel 3710這樣的SSD則可以達到超過7萬IOPS,直接高出兩個數量級。但同時雙控制器架構就會成為瓶頸,比如EMC的Unity 650 可以支援一千塊硬碟或SSD,但31塊SSD的時候就到達瓶頸,此時8:2讀寫混合最大隻能達到27萬IOPS。

同樣,SSD大大減少了事務型儲存系統的機架空間,使儲存和計算節點的數量比較匹配,這是超融合架構成立的一個重要條件。

3.虛擬化

超融合架構成立的另一個重要條件就是虛擬化已經被廣泛接受,否則分散式儲存不可能和應用共存在一個物理節點上,除非是一個廠商的一體機產品。

4. CPU

最後就是大家常說的CPU更強大更廉價,可以同時解決計算和儲存的要求。

四.超融合就是分散式儲存和計算虛擬化簡單地安裝在一起嗎?

答案當然是NO。

因為要以超融合的形態去做虛擬化的儲存,還應該具備以下特徵:

一是,對系統資源消耗應該少,並且可控,合理的方案不應該超過10%;

二是,支援VM資料訪問本地化,這個是超融合架構另一大優勢;

三是,既然是重點支援虛擬化平臺儲存,就應該對不同的虛擬化平臺有比較好的支援,類似VMware、KVM等。

所以,現在中國市場真正算得上超融合架構的也就是Nutanix、VMware、SmartX。國內很多廠商拿一個Ceph就包裝超融合產品,以上三點沒有一點能做好。主要的問題包括:

1.雜湊演算法不能實現資料存放的精準控制,所以I/O本地化無法實現。

2.軟體I/O路徑比較長, CPU資源消耗比較多,進一步增加了延遲。

五.超融合架構和傳統架構有哪些區別?

這裡我挑了SmartX的架構圖用來做對比說明,更清晰一些(以下若干圖都取自SmartX產品膠片)。對於真正的超融合產品,以下特性都是一致的的。如果有少量的特性差異,會專門描述。



六.為什麼超融合架構的可靠效能比傳統雙控架構更好?

用伺服器構建儲存,客戶顧慮最多的首先是可靠性,如果需要衡量可靠性:

系統的冗餘度?通俗的說就是允許硬體壞多少?

出現故障後是否完全自動恢復?

恢復速度和時間?因為系統處於降級狀態下是比較危險的狀態,故障視窗越小,出現整體故障的可能性就越小。

以下給出詳細的系統冗餘與恢復機制對比。



上表需要進一步說明的是:

三副本可以帶來比雙控更好的冗餘度,代價當然就是損耗更多的容量。

管理的粒度部分,各家實現不同,有的是基於資源池設定兩副本或三副本,有的廠商,比如SmartX,是以卷為單位,這樣的好處就是可以在一個資源池上分配不同副本策略的卷,用於不同安全級別的VM。

熱備盤的處理方面,其實大部分分散式儲存都沒有了,而是利用已有空間進行恢復。但需要強調的是現在GlusterFS還是使用熱備盤機制,包括深信服等還是基於這樣的產品構建超融合,個人很不看好。

可以看出可靠性方面,超融合架構的優勢非常大,但其實這裡的優勢都是分散式儲存本身應該具備的。

七.為什麼超融合架構的隨機效能比傳統架構更高?

可以看出,超融合在效能方面的架構優勢也非常明顯,當然代價就是消耗計算資源,所以計算資源的消耗是檢驗超融合專業性的一個重要因素。

以下給出詳細的效能機制對比。



效能相關的特性中,多節點併發和效能擴充套件依舊是分散式儲存帶來的。而資料本地化是超融合架構獨有的,分離式的架構無法實現,當然代價就是計算資源的佔用。SSD是即使傳統架構儲存都會使用的,但雙控無法發揮SSD的效能。

比如EMC Unity 650F,8:2 8K混合隨機讀寫效能最大27萬IOPS,而對於類似Nutanix、SmartX等效能比較好的超融合產品,一個節點8:2 8K混合隨機讀寫很容易達到3萬以上IOPS,通過線性擴充套件,10個左右節點就可以達到EMC Unity 650F的最大效能。而10個節點只是非常小的使用者規模。

八.為什麼超融合架構的可擴充套件性比傳統架構更好?

可擴充套件性是分散式架構的最大優勢之一,當然擴容後的資料自動負載均衡效果並不是必然的,要看廠家的產品化程度。

以下給出詳細的系統可擴充套件性對比。擴充套件性方面的優勢,依舊是分散式儲存架構帶來的。



九.為什麼超融合架構的部署運維更簡單?

超融合架構運維的簡化效果是非常顯著的,以下從幾個角度進行部署與運維對比。其中部分優勢是分散式架構帶來的,比如只維護標準商用服務硬體,而使用超融合後,可以進一步減少硬體的需求量。



十.超融合到底如何為使用者省錢?

說法在網上很多了,但以下這個例項可能更精準和量化一些,大家可以對比使用成本。這裡沒有包括人員維護成本,續保等費用的成本等。人力成本方面,去掉專業儲存運維就可以節省很大一部分人員開銷。根據實際經驗值,採用超融合在人員投入至少減少50%。採購成本,超融合產品一般可以做到傳統架構70%。

以下給出使用成本與收益對比例項。




 

十一.超融合不適合什麼場景?

傳統意義上的超融合是適合於各種虛擬化的場景,對於裸金屬伺服器就不適合了。所以有一些重負載的應用,在虛擬化都不用的情況下,自然不會考慮超融合。另外,超融合的架構模式決定了計算和儲存資源應該均衡增長,否則就不是非常適合,比如海量的非結構化資料。

不過,近期的一個趨勢是,超融合廠商開始對外提供儲存介面,可以以類似Server SAN或者NAS的方式訪問,所以裸金屬的場景也可以適用了。