1. 程式人生 > >資料庫 分散式儲存

資料庫 分散式儲存

分散式儲存:

分散式儲存是一種資料儲存技術,通過網路使用企業中的每臺機器上的磁碟空間,並將這些分散的儲存資源構成一個虛擬的儲存裝置,資料分散的儲存在企業的各個角落。

 

分散式儲存系統,是將資料分散儲存在多臺獨立的裝置上。傳統的網路儲存系統採用集中的儲存伺服器存放所有資料,儲存伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模儲存應用的需要。分散式網路儲存系統採用可擴充套件的系統結構,利用多臺儲存伺服器分擔儲存負荷,利用位置伺服器定位儲存資訊,它不但提高了系統的可靠性、可用性和存取效率,還易於擴充套件。

 

分散式儲存系統的挑戰主要在於資料和狀態資訊的持久化,要求在自動遷移、自動容錯和併發讀寫的過程中,保證資料的一致性。分散式儲存所涉及到的技術主要來自於兩個領域:分散式系統以及資料庫,如下所示:

1.資料分佈:如何將資料均勻的分佈到整個分散式儲存叢集中的各臺伺服器?如何從分散式儲存叢集中讀取資料?

2.一致性:如何將資料的多個副本複製到多臺伺服器,即使在異常情況下,也能保證不同副本之間的資料一致性。

3.容錯:如何可以快速檢測到伺服器故障,並自動的將在故障伺服器上的資料進行遷移

4.負載均衡:新增的伺服器如何在叢集中保障負載均衡?資料遷移過程中如何保障不影響現有的服務。

5.事務與併發控制:如何實現分散式事務。

6.易用性:如何設計對外介面,使得設計的系統易於使用

7.壓縮/加壓縮:如何根據資料的特點設計合理的壓縮/解壓縮演算法?如何平衡壓縮/解壓縮演算法帶來的空間和CPU計算資源?