1. 程式人生 > >Gartner資料庫報告解讀及資料庫技術發展方向預測

Gartner資料庫報告解讀及資料庫技術發展方向預測


Gartner報告解讀

近期,國際知名行業分析機構Gartner釋出了“2017年資料庫廠商推薦報告”(Other Vendors to Consider for Operational DBMSs 2017)。自Gartner釋出資料庫行業報告以來,第一次收錄了來自中國的資料庫廠商,分別是阿里雲Alibaba Cloud、SequoiaDB巨杉資料庫以及南大通用Gbase,標誌著中國資料庫產業發展已經邁出了一大步。


據瞭解,Gartner對於技術廠商和產品的選拔要求十分嚴格,除了會考察產品在整個業界維度的技術先進性,產品成熟度,還需要考察企業的市場規模、營收狀況,以及考察成熟的大型企業案例和全球化客戶的佈局。


其中,金融行業等頭部行業使用者的認可是重要的評價條件之一。 金融行業在企業級技術和應用中一直保持領先,金融行業的技術系統也一 直在政府和監管部門的嚴格監管下不斷的發展。金融行業正在轉變為“技術驅動 業務”,但是其 IT 和資料管理系統的迭代演進卻十分謹慎,既要滿足嚴格的監管 法律和,同時還要在保證穩定情況下與複雜傳統系統相容。


資料庫技術發展

Gartner今年的多分報告中認為資料庫未來需要在幾個方面進行創新:

· 分散式架構

· Multimodel多模資料管理

· 資料安全

· 混合訪問HTAP

· 雲架構整合

特別是Multimodel多模資料管理,是近年來資料庫發展的重要新要求。


1)分散式架構

分散式架構是資料庫發展的大勢所趨。分散式架構顯著提升大容量資料儲存和管理能力,既保障面對大量使用者的高併發需求,又保障了面對業務變化的彈性增長能力。分散式資料庫的使用成本,也遠低於傳統資料庫。


分散式資料庫則可以用於複製傳統的事務資料,以便通過增加移動訪問和工作人員的分佈來實現更高容量,只讀需求,從而快速方便地訪問傳統的事務資料。例如,商業銀行使用分散式資料庫向網上銀行使用者提供交易資訊訪問查詢。這從傳統的資料庫環境中消除了一些負載,從而降低了處理需求,從而降低了成本。傳統關係型資料庫產品,僅僅考慮在單個伺服器上執行,然後通過ACID的特性來維護資料完整性,但是他們的設計和技術卻沒有考慮海量資料下的容量擴充套件。


對於資料庫來說,分散式架構的優勢十分明顯:

· 彈性擴容提升效能:需要彈性地擴容以應對PB級別以上的資料管理,這種彈性容量調整可以實現讓所有資料保持線上。同時滿足高併發業務操作需求,實現海量資料高效能讀寫以及實時訪問查詢。

· 高可用與資料安全:分散式架構資料高可用保障。除了經典的主-從架構,資料庫和儲存方面還有類似Ceph的糾刪碼google spanner的原子鐘分散式演算法等等方式。

· 簡化開發運維節約成本。隨著應用的增多,更需要分散式架構支援,進行資料分割槽管理,實現業務有效隔離。同時,保持系統的彈性、相容性,大大簡化運維開發。


2)Multi-Model 多模資料與非結構化資料

隨著應用和業務的多樣化,系統對於多型別資料的管理能力提出了新的要求。Multi-Model多模是指在單個數據庫平臺中支援非結構化結構化資料在內的多種資料型別。


一直以來,傳統關係型資料庫僅支援表單型別的結構化資料儲存和訪問能力,而對於層次型物件、圖片影像等半結構化與非結構化資料管理無能為力。如今,隨著應用型別的多樣化和儲存成本的降低,單一資料型別已經無法滿足許多綜合性業務平臺的需求,例如,許多企業應用需要處理圖表以及關係資料,這些平臺需要能支撐Multi-Model多模資料管理的產品。一些傳統的資料庫產品能夠處理XML和麵向物件資料型別,Oracle這樣的產品現在也漸漸開始支援JSON,甚至圖形和鍵值K-V資料。


特別對於非結構化資料,當前企業管理的結構化資料只佔資訊總量的15%,而剩下85%的資訊是非結構化資料,對於非結構化資料,企業需要實現資料的統一管理,並實現資料共享和資料流轉;需要應對資料總量的飛速增長;同時還需要應對資料激增帶來了管理成本和使用成本的快速增長。如金融企業在網際網路金融等等新需求下,隨著銀行遠端開戶、櫃面無紙化、面部識別等系統的建立和升級正在面臨大量不同型別的非結構化資料(如圖片,視訊和檔案)帶來的挑戰。


資料庫層面的Multi-Model和非結構化資料管理,將能實現結構化、半結構化和非結構化資料的統一管理,實現非結構化資料的實時訪問,大大降低了運維和應用的成本。


3)容災與雙活與資料安全

伴隨著在企業內部價值的不斷提升,資料已經成為了金融企業的生命線與核心資產。作為承載著企業關鍵資料的資料庫,其安全性、可靠性、穩定性一直是金融級資料庫的核心價值。


但是,在分散式架構中完美實現高可用與容災面臨著諸多技術挑戰。一般來說,以統計分析為目標的分散式資料庫相對弱化了該部分的功能,而面向線上與交易業務的分散式資料庫則對資料安全保持了高標準的嚴格要求。


高可用性是所有現在新的資料架構必備特性之一。高可用對於銀行這樣的企業級使用者更是重要,中國銀行業監督管理委員會要求所有銀行資料中心必須進行高可用備份,包括資料中心的“兩地三中心”能力,也就是銀行資料儲存管理整體架構的分散式架構轉型成為了標準要求。這其中,資料庫的分散式轉型就將成為資料管理現代化的首要任務。


大多數銀行資料中心還需要“雙活”容災的能力,即在兩個資料中心實時進行備份,一旦失去一箇中心,所有業務可以及時切換中心繼續執行。同時,通過資料中心“雙活”,在保證資料安全下,也將資料儲存,資料處理的高可用性和災難恢復相結合,這樣資料管理可以以更低的成本實現連續的可用性,並以最少的努力最大限度地利用“雙活”的資料中心。


4)HTAP混合事務/分析處理模式

新的業務需求下,資料庫除了應對操作型業務,還會在業務實時資料監控,資料報告和決策輔助方面有許多資料實時應用的場景。傳統架構中OLTP和OLAP兩類業務是完全分離的。兩者的隔離導致整個系統在資料一致性,資料平臺管理上帶來了巨大的阻礙。此前, RDBMS和大資料(Hadoop)分別成為資料處理的兩個方面,一旦一種架構選擇了一種場景,就不得不放棄另一種場景。


因此,HTAP混合事務/分析處理模式成為資料庫發展的一個新要求。


根據Gartner的最新定義,混合負載(HTAP Hybrid Transactional/Analytical Processing)在保留原有線上交易功能同時,也強調了資料庫原生計算分析的能力。支援混合負載的資料庫能夠避免在傳統架構中,線上與離線資料庫之間大量的資料互動,同時也能夠針對最新的業務資料進行實時統計分析。


為了避免線上實時讀寫與批處理作業之間的資源干擾,混合負載型資料庫通常使用讀寫分離或記憶體處理技術實現。一般來說,分散式資料庫的多副本架構天然支援讀寫分離技術,而基於傳統架構的資料庫往往採用記憶體處理技術進行實現。


5)雲架構整合能力 

雲架構整合對於資料庫未來發展也是一個比較重要的特性,雖然分散式架構下是原生支援雲架構的,但是對於資料庫雲DBaaS來說,仍有許多新的要求。


對於資料庫雲服務的定義,是具有一定程度自助服務的可伸縮的,彈性的多租戶訂閱服務。它由雲服務提供商(CSP)本身或是基於了CSP的基礎架構的第三方軟體供應商提供的產品或是服務。同時資料庫雲服務,是不允許直接訪問後臺底層的系統服務如作業系統和儲存軟體的。這一領域上,Gartner也有意將DBaaS劃分在 PaaS的層面,與IaaS或者IaaS+區分開。


對於DBaaS,除了基礎的資料庫功能,雲架構下需要具備的能力還包括基礎設施的管理,自主管理監控,多租戶管理,快速擴容,線上升級等等。


小結

資料庫技術發展至今,在資料量和資料型別的壓力下,資料庫技術本身也面臨新的挑戰,因此分散式技術是資料庫發展的大勢所趨。面對雨後春筍般湧現的新型分散式資料庫產品,在經過了爆發階段後,新一代資料庫市場也將迎來穩定期,能夠滿足企業使用者需求的產品才回最終走到最後。