1. 程式人生 > >一篇文章帶你深入瞭解Dubbo

一篇文章帶你深入瞭解Dubbo

 

一、產生的背景

隨著網際網路的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分散式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。下面我們用一個圖來具體說明架構和開發框架的演進過程。

 

 

  • 單一應用架構

當網站流量很小時,只需一個應用,將所有功能都部署在一起,以減少部署節點和成本。此時,用於簡化增刪改查工作量的資料訪問框架(ORM)是關鍵。

  • 垂直應用架構

當訪問量逐漸增大,單一應用增加機器帶來的加速度越來越小,將應用拆成互不相干的幾個應用,以提升效率。此時,用於加速前端頁面開發的Web框架(MVC)是關鍵。

  • 分散式服務架構

當垂直應用越來越多,應用之間互動不可避免,將核心業務抽取出來,作為獨立的服務,逐漸形成穩定的服務中心,使前端應用能更快速的響應多變的市場需求。此時,用於提高業務複用及整合的分散式服務框架(RPC)是關鍵。

  • 流動計算架構

當服務越來越多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增加一個排程中心基於訪問壓力實時管理叢集容量,提高叢集利用率。此時,用於提高機器利用率的資源排程和治理中心(SOA)是關鍵。

 

二、服務治理的需求

微服務架構是網際網路很熱門的話題,是網際網路技術發展的必然結果。它提倡將單體應用程式劃分成一組若干小的服務,服務之間互相協調、互相配合,為使用者提供最終價值。

單體應用程式拆分成微服務後,服務治理是關鍵。那麼有沒有好的服務治理方案呢?答案是有的,而且很多人都在用這個框架,它就是Dubbo。Dubbo是一個帶有服務治理功能的RPC框架,提供了一套較為完整的服務治理方案,所以企業如果要實現服務化的話,Dubbo 是很好的一個選擇。這裡簡單介紹一下Dubbo服務治理的幾個基本需求。

 

 

在大規模服務化之前,應用可能只是通過 RMI 或 Hessian 等工具,簡單的暴露和引用遠端服務,通過配置服務的URL地址進行呼叫,通過 F5 等硬體進行負載均衡。

當服務越來越多時,服務 URL 配置管理變得非常困難,F5 硬體負載均衡器的單點壓力也越來越大。此時需要一個服務註冊中心,動態的註冊和發現服務,使服務的位置透明。並通過在消費方獲取服務提供方地址列表,實現軟負載均衡和 Failover,降低對 F5 硬體負載均衡器的依賴,也能減少部分成本。

當進一步發展,服務間依賴關係變得錯蹤複雜,甚至分不清哪個應用要在哪個應用之前啟動,架構師都不能完整的描述應用的架構關係。這時,需要自動畫出應用間的依賴關係圖,以幫助架構師理清關係。

接著,服務的呼叫量越來越大,服務的容量問題就暴露出來,這個服務需要多少機器支撐?什麼時候該加機器? 為了解決這些問題,第一步,要將服務現在每天的呼叫量,響應時間,都統計出來,作為容量規劃的參考指標。其次,要可以動態調整權重,在線上,將某臺機器的權重一直加大,並在加大的過程中記錄響應時間的變化,直到響應時間到達閾值,記錄此時的訪問量,再以此訪問量乘以機器數反推總容量。

以上是 Dubbo 最基本的幾個需求。簡單的說,Dubbo就是個服務呼叫的框架,如果沒有分散式的需求,其實是不需要用的,只有在分散式的時候,才有使用Dubbo這樣的分散式服務框架的需求,並且本質上是個服務呼叫的東東。其核心部分包含:

1. 遠端通訊:提供對多種基於長連線的NIO框架抽象封裝,包括多種執行緒模型、序列化以及“請求-響應”模式的資訊交換方式。

2. 叢集容錯:提供基於介面方法的透明遠端過程呼叫,包括多協議支援以及軟負載均衡,失敗容錯、地址路由、動態配置等叢集支援。

3. 自動發現:基於註冊中心目錄服務,使服務消費方能動態的查詢服務提供方,使地址透明,使服務提供方可以平滑增加或減少機器。

 

三、Dubbo的架構和特點

說完產生的背景和需求後,下面具體談下Dubbo的總體架構以及Dubbo的特點。

 

 

Dubbo總體架構設計一共劃分了10層,而最上面的Service層是留給實際想要使用Dubbo開發分散式服務的開發者實現業務邏輯的介面層。圖中左邊淡藍背景的為服務消費方使用的介面,右邊淡綠色背景的為服務提供方使用的介面,位於中軸線上的為雙方都用到的介面。

下面,結合Dubbo官方文件,理解一下總體架構分層中,各個層次的設計要點:

1. 服務介面層(Service):該層是與實際業務邏輯相關的,根據服務提供方和服務消費方的業務設計對應的介面和實現。

2. 配置層(Config):對外配置介面,以ServiceConfig和ReferenceConfig為中心,可以直接new配置類,也可以通過Spring解析配置生成配置類。

3. 服務代理層(Proxy):服務介面透明代理,生成服務的客戶端Stub和伺服器端Skeleton,以ServiceProxy為中心,擴充套件介面為ProxyFactory。

4. 服務註冊層(Registry):封裝服務地址的註冊與發現,以服務URL為中心,擴充套件介面為RegistryFactory、Registry和RegistryService。可能沒有服務註冊中心,此時服務提供方直接暴露服務。

5. 叢集層(Cluster):封裝多個提供者的路由及負載均衡,並橋接註冊中心,以Invoker為中心,擴充套件介面為Cluster、Directory、Router和LoadBalance。將多個服務提供方組合為一個服務提供方,實現對服務消費方透明,只需要與一個服務提供方進行互動。

6. 監控層(Monitor):RPC呼叫次數和呼叫時間監控,以Statistics為中心,擴充套件介面為MonitorFactory、Monitor和MonitorService。

7. 遠端呼叫層(Protocol):封將RPC呼叫,以Invocation和Result為中心,擴充套件介面為Protocol、Invoker和Exporter。Protocol是服務域,它是Invoker暴露和引用的主功能入口,它負責Invoker的生命週期管理。Invoker是實體域,它是Dubbo的核心模型,其他模型都向它靠擾,或轉換成它,它代表一個可執行體,可向它發起invoke呼叫。它有可能是一個本地的實現,也可能是一個遠端的實現,也可能是一個叢集實現。

8. 資訊交換層(Exchange):封裝請求響應模式,同步轉非同步,以Request和Response為中心,擴充套件介面為Exchanger、ExchangeChannel、ExchangeClient和ExchangeServer。

9. 網路傳輸層(Transport):抽象mina和netty為統一介面,以Message為中心,擴充套件介面為Channel、Transporter、Client、Server和Codec。

10. 資料序列化層(Serialize):可複用的一些工具,擴充套件介面為Serialization、 ObjectInput、ObjectOutput和ThreadPool。

從上圖可以看出,Dubbo對於服務提供方和服務消費方,從框架的10層中分別提供了各自需要關心和擴充套件的介面,構建整個服務生態系統(服務提供方和服務消費方本身就是一個以服務為中心的)。

下圖是從Dubbo官網直接拿來的,看一下基於RPC層,服務提供方和服務消費方之間的呼叫關係,如圖所示:

 

 

  • 節點角色說明

 

 

  • 呼叫關係說明

0:服務容器負責啟動,載入,執行服務提供者。

1:服務提供者在啟動時,向註冊中心註冊自己提供的服務。

2:服務消費者在啟動時,向註冊中心訂閱自己所需的服務。

3:註冊中心返回服務提供者地址列表給消費者,如果有變更,註冊中心將基於長連線推送變更資料給消費者。

4:服務消費者,從提供者地址列表中,基於軟負載均衡演算法,選一臺提供者進行呼叫,如果呼叫失敗,再選另一臺呼叫。

5:服務消費者和提供者,在記憶體中累計呼叫次數和呼叫時間,定時每分鐘傳送一次統計資料到監控中心。

Dubbo架構採用的是一種非常簡單的模型,要麼是提供方提供服務,要麼是消費方消費服務,所以基於這一點可以抽象出服務提供方(Provider)和服務消費方(Consumer)兩個角色。另外Dubbo架構還具有以下幾個特點,連通性、健壯性、伸縮性、升級性,有關注冊中心、協議支援、服務監控等內容,也在特點裡有詳細的描述。

  • 連通性(服務消費者和服務提供者的關聯)

1. 註冊中心負責服務地址的註冊與查詢,相當於目錄服務,服務提供者和消費者只在啟動時與註冊中心互動,註冊中心不轉發請求,壓力較小。

2. 監控中心負責統計各服務呼叫次數,呼叫時間等,統計先在記憶體彙總後每分鐘一次傳送到監控中心伺服器,並以報表展示。

3. 服務提供者向註冊中心註冊其提供的服務,並彙報呼叫時間到監控中心,此時間不包含網路開銷。

4. 服務消費者向註冊中心獲取服務提供者地址列表,並根據負載演算法直接呼叫提供者,同時彙報呼叫時間到監控中心,此時間包含網路開銷。

5. 註冊中心,服務提供者,服務消費者三者之間均為長連線,監控中心除外。

6. 註冊中心通過長連線感知服務提供者的存在,服務提供者宕機,註冊中心將立即推送事件通知消費者。

7. 註冊中心和監控中心全部宕機,不影響已執行的提供者和消費者,消費者在本地快取了提供者列表。

8. 註冊中心和監控中心都是可選的,服務消費者可以直連服務提供者。

  • 健壯性(任意節點宕掉後,服務仍然可用)

1. 監控中心宕掉不影響使用,只是丟失部分取樣資料。

2. 資料庫宕掉後,註冊中心仍能通過快取提供服務列表查詢,但不能註冊新服務。

3. 註冊中心對等叢集,任意一臺宕掉後,將自動切換到另一臺。

4. 註冊中心全部宕掉後,服務提供者和服務消費者仍能通過本地快取通訊。

5. 服務提供者無狀態,任意一臺宕掉後,不影響使用。

6. 服務提供者全部宕掉後,服務消費者應用將無法使用,並無限次重連等待服務提供者恢復。

  • 伸縮性(節點可以自動增加)

1. 註冊中心為對等叢集,可動態增加機器部署例項,所有客戶端將自動發現新的註冊中心。

2. 服務提供者無狀態,可動態增加機器部署例項,註冊中心將推送新的服務提供者資訊給消費者。

  • 升級性(可平滑升級)

當服務叢集規模進一步擴大,帶動IT治理結構進一步升級,需要實現動態部署,進行流動計算,不會給現有分散式服務架構帶來阻力。下圖是未來可能的一種呼叫架構:

 

 

節點角色說明:

 

 

 

四、總結

Dubbo是Alibaba開源的分散式服務框架,並被廣泛應用於各網際網路公司。Dubbo只需要通過Spring配置的方式即可完成服務化,對於應用無入侵,其框架本身的成熟度以及文件的完善程度,基本都能滿足各網際網路公司的業務需求。

如果你需要使用配置中心、分散式跟蹤這些內容則需要自己去整合,有一些定製化難度。另外一款開源分散式服務框架Spring Cloud 發展到現在,幾乎考慮了服務治理的方方面面,開發起來非常的便利和簡單。因此,企業需要根據自身的研發水平和所處階段選擇合適的架構來解決業務問題,不管是Dubbo還是Spring Cloud都是實現微服務有效的工具。