Zookeeper詳解-概述(一)
ZooKeeper是一種分布式協調服務,用於管理大型主機。在分布式環境中協調和管理服務是一個復雜的過程。ZooKeeper通過其簡單的架構和API解決了這個問題。ZooKeeper允許開發人員專註於核心應用程序邏輯,而不必擔心應用程序的分布式特性。
ZooKeeper框架最初是在“Yahoo!"上構建的,用於以簡單而穩健的方式訪問他們的應用程序。 後來,Apache ZooKeeper成為Hadoop,HBase和其他分布式框架使用的有組織服務的標準。 例如,Apache HBase使用ZooKeeper跟蹤分布式數據的狀態。
先來介紹一下分布式:
分布式應用
分布式應用可以在給定時間(同時)在網絡中的多個系統上運行,通過協調它們以快速有效的方式完成特定任務。通常來說,對於復雜而耗時的任務,非分布式應用(運行在單個系統中)需要幾個小時才能完成,而分布式應用通過使用所有系統涉及的計算能力可以在幾分鐘內完成。
通過將分布式應用配置為在更多系統上運行,可以進一步減少完成任務的時間。分布式應用正在運行的一組系統稱為集群,而在集群中運行的每臺機器被稱為節點。
分布式應用有兩部分, Server(服務器) 和 Client(客戶端) 應用程序。服務器應用程序實際上是分布式的,並具有通用接口,以便客戶端可以連接到集群中的任何服務器並獲得相同的結果。 客戶端應用程序是與分布式應用進行交互的工具。
分布式應用的優點
-
可靠性 - 單個或幾個系統的故障不會使整個系統出現故障。
-
可擴展性 - 可以在需要時增加性能,通過添加更多機器,在應用程序配置中進行微小的更改,而不會有停機時間。
-
透明性 - 隱藏系統的復雜性,並將其顯示為單個實體/應用程序。
分布式應用的挑戰
-
競爭條件 - 兩個或多個機器嘗試執行特定任務,實際上只需在任意給定時間由單個機器完成。例如,共享資源只能在任意給定時間由單個機器修改。
-
死鎖 - 兩個或多個操作等待彼此無限期完成。
-
不一致 - 數據的部分失敗。
什麽是Apache ZooKeeper?
Apache ZooKeeper是由集群(節點組)使用的一種服務,用於在自身之間協調,並通過穩健的同步技術維護共享數據。ZooKeeper本身是一個分布式應用程序,為寫入分布式應用程序提供服務。
分布式應用程序的協同服務
ZooKeeper提供的常見服務如下 :
-
命名服務 - 按名稱標識集群中的節點。它類似於DNS,但僅對於節點。
-
配置管理 - 加入節點的最近的和最新的系統配置信息。
-
集群管理 - 實時地在集群和節點狀態中加入/離開節點。
-
選舉算法 - 選舉一個節點作為協調目的的leader。
-
鎖定和同步服務 - 在修改數據的同時鎖定數據。此機制可幫助你在連接其他分布式應用程序(如Apache HBase)時進行自動故障恢復。
-
高度可靠的數據註冊表 - 即使在一個或幾個節點關閉時也可以獲得數據。
分布式應用程序提供了很多好處,但它們也拋出了一些復雜和難以解決的挑戰。ZooKeeper框架提供了一個完整的機制來克服所有的挑戰。競爭條件和死鎖使用故障安全同步方法進行處理。另一個主要缺點是數據的不一致性,ZooKeeper使用原子性解析。
ZooKeeper的好處
以下是使用ZooKeeper的好處:
-
簡單的分布式協調過程
-
同步 - 服務器進程之間的相互排斥和協作。此過程有助於Apache HBase進行配置管理。
-
有序的消息
-
序列化 - 根據特定規則對數據進行編碼。確保應用程序運行一致。這種方法可以在MapReduce中用來協調隊列以執行運行的線程。
-
可靠性
-
原子性 - 數據轉移完全成功或完全失敗,但沒有事務是部分的。
Zookeeper詳解-概述(一)