【分布式系統設計】基礎概念

阿新 • • 發佈：2017-12-31

由於數量 width 工作提供服務 height imp alt 應該

在設計分布式系統時，通常要考慮到 數據的一致性（consistency）、系統的可用性（availability）、以及分區容忍性（ partition tolerance）。即CAP定理。

概念

我們知道，分布式系統有多個節點。 數據一致性是指, 對每個節點，在同一時刻，讀寫的數據是相同的。舉例：用戶User1的賬戶余額是100，在節點Node1我們更改了User1的賬戶余額，改成了200，此時在節點Node1讀User1余額一定是200。如果保證了一致性，那麽在節點Node2、Node3等其他節點，讀到User1的余額都是200。 系統的可用性：即使分布式系統中的一個節點掛掉了，對於請求，依然能夠響應。 分區容忍性：

即使系統中出現了一個節點與其他節點無法通信的情況，系統依然能夠工作。舉例：分布式系統中兩節點間無法傳遞數據或數據丟失，此時這個分布式系統依然可以工作。通過了解以上概念，我們知道，分區容忍性是要保證的。當系統中的出現節點Node1和Node2無法同步數據的情況時，數據一致性和可用性是無法同時保證的，需要有取舍。保證數據的一致性以及分區容忍性（CP）:所有節點數據一致，當出現一個節點與其他節點失去聯系，此時系統服務不可用。保證系統的可用性以及分區容忍性（AP）:即便出現一個節點與其他節點無法通信的情況，該節點也提供服務，此時不保證改節點的數據與其他節點的數據一致；當該節點可以通信時，同步數據。

舉例

假設我們的服務是博客系統。 最初系統服務的訪問量並不大，單個服務節點足以支撐。隨著用戶數量的發展，單個節點支撐不住了，於是考慮做水平擴展。我們的服務節點由一個擴展到了兩個，並且，每個服務節點都保存一份數據。由於我們有兩個服務節點，所以在這兩個節點前，增加了Load Balancer用於做調度，如圖1 　　　　　　　　　　　　　　　　　　技術分享圖片

技術分享圖片

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　圖1 對於讀請求不做描述。對於寫請求，過程如下 1. 請求到達Load Balancer 2. Load Balancer做判斷，將請求分配給某一個節點，如Node1 3. Node1執行寫操作。如果此時返回處理結果給客戶端，那麽假如有相同的請求，但是落到了Node2時，數據時不一致的，所以我們要做數據同步。我們先做 一個假設，數據同步一定成功且耗時很短很短

。我們可以有兩種方式同步。第一種，直到Node2的數據同步了，Node1才返回。第二種，Node1執行同步數據操作，不等待同步完成，立即返回結果。現在假設Node1和Node2的通信斷開了，如圖2 　　　　　　　　　技術分享圖片

技術分享圖片

　　　　　　　　　　　　　　　　　　　　　　　　　　圖2 無論以上哪種同步方式都行不通，那麽我們要做出抉擇，是要保證數據的一致性好，還是保證可用性。因為我們的服務是博客服務，即便數據暫時性地不一致也是可以忍受的，並且，如果長時間用戶得不到內容會導致用戶流失，所以我們傾向保證可用性。即修改第三部處理，當Node1和Node2的通信斷開時，暫時不做數據同步，直接返回結果。這種處理方式，當通信斷開時，Node1和Node2的數據在處理寫請求後是不一致的。現在假設Node1和Node2的數據同步過程會耗時會很長。我們依舊傾向保證可用性。因為第一種同步方法會讓用戶等待較長的時間，我們采用第二種同步方法。第二種方法，會保證經過一段時間後，數據是一致的。這是所謂的最終一致性。下面，我們再考慮這樣的問題，依舊假設Node1和Node2的數據同步過程會耗時很長。來了一個寫請求，Load balancer將其分配給了Node1；很快又來了一個寫請求，Load Balancer將其分配給了Node2。此時數據該怎麽同步呢？假如修改的都是同一個文章ID所對應的內容呢？可以考慮將Node1 和 Node2 的同步請求加入到一個公共的隊列中。即節點在進行寫操作後，將同步操作加入到公共隊列中，然後節點返回結果給用戶。我們可以實時地消費這個隊列，也可以定時地消費這個隊列。消費這個隊列時，將數據寫到Node1和Node2中，如圖3 　　　　　　　　　　　　　　技術分享圖片

技術分享圖片

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　圖3 這個方案依舊不夠好，因為多寫了一次數據。 假如寫數據的操作很耗時，為了避免多寫一次，我們也可以在Node1和Node2上設置緩存（偏向可用性），即寫時不寫數據而是寫緩存。但設置緩存又會引發Node1 與Node2緩存不一致的情況發生（需要處理數據一致性）。好了，偏向可用性的討論先到此為止。 假設我們做的系統不是博客系統，是交易系統。我們的系統需要的是強一致性。即無論從Node1還是Node2讀寫數據，得到的結果都是一樣的。因為是交易系統，所以需要做到的是數據是強一致性的，即每時每刻數據一致。假設寫請求到了Node1，此時Node1需要寫數據並將數據同步到Node2。假如Node1與Node2的通信斷開了，那麽我們應該給用戶返回一個請等待的頁面。此時數據既沒有寫入Node1也沒有寫入Node2。假如通信沒斷開的話，怎樣保證寫入了Node1數據，也會寫入Node2數據呢？可以使用兩段提交的算法。兩段提交需要一個協調者，比如Node3，而所有待更新節點數據作為參與者。第一階段，請求階段：協調者Node3 請求 Node1和Node2是否對User1的賬戶進行更新，參與者Node1 回復可以更新，參與者Node2 回復不可以更新（比如正在有讀操作）第二階段，提交階段：只有所有參與者都同意才會提交事務。Node3根據Node1和Node2的回復，做出是否提交事務的判斷，不提交。參考 http://ksat.me/a-plain-english-introduction-to-cap-theorem/ https://stackoverflow.com/questions/12346326/cap-theorem-availability-and-partition-tolerance http://www.importnew.com/20633.html

【分布式系統設計】基礎概念

【分布式系統設計】基礎概念

由於數量 width 工作提供服務 height imp alt 應該在設計分布式系統時，通常要考慮到數據的一致性（consistency）、系統的可用性（availability）、以及分區容忍性（ partition tolerance）。即CAP定理。概

【分布式協調zookeeper】基礎篇

zookeeper 原理架構模型一、zookeeper介紹它是一個為分布式應用提供一致性服務的軟件，提供的功能包括：配置維護、名字服務、分布式同步、組服務等zookeeper做了什麽？1.命名服務 2.配置管理 3.集群管理 4.分布式鎖 5.隊列管理二、zookeeper架構的架構模型zookeeper

【分布式協調zookeeper】利用ansible部署篇

zookeeper一、環境準備操作系統：centOS-6.8 2.6.32-642.el6.x86_64【虛擬機環境】節點主機：10.0.55.3、10.0.55.5、10.0.55.6 目錄結構： /opt/ 軟件版本： jdk-7u67-linux-x64.rpm zooke

【分布式協調zookeeper】安裝篇

zookeeper 部署一、環境準備操作系統：centOS-6.8 2.6.32-642.el6.x86_64【虛擬機環境】節點主機：10.0.55.3、10.0.55.5、10.0.55.6 目錄結構： /opt/ 軟件版本： jdk-7u67-linux-x64.rpm zo

搞懂分布式技術1：分布式系統的一些基本概念

ble 數量 con 總結個數角度之間電纜工作內容搞懂分布式技術1：分布式系統的一些基本概念 1、分布式小明的公司又3個系統：系統A，系統B和系統C，這三個系統所做的業務不同，被部署在3個獨立的機器上運行，他們之間互相調用（當然是跨域網絡的），通力合作完成公司

分布式系統之緩存的微觀應用經驗談（一）【基礎細節篇】

聯網需要最新響應時間正文劃分發的討論 server 分布式系統之緩存的微觀應用經驗談（一）【基礎細節篇】前言　　近幾個月一直在忙些瑣事，幾乎年後都沒怎麽閑過。忙忙碌碌中就進入了2018年的秋天了，不得不感嘆時間總是如白駒過隙，也不知道收獲了什麽

設計----【分布式事務】分布式事務和解決方案

reat 錯誤級別 err ons 撤銷丟失 system 狀態一、前言分布式事務是企業集成中的一個技術難點，也是每一個分布式系統架構中都會涉及到的一個東西，特別是在微服務架構中，幾乎可以說是無法避免，本文就分布式事務來簡單聊一下。二、數據庫事務在說分布式

Zookeeper和Chubby【分布式協調系統】

觀察動態資源 zookeeper 技術需求配置信息通知方法前言大規模分布式系統需要解決各種類型的協調需求：當集群中有新的進程或服務器加入時，如何探測到它的加入？如何能夠自動獲取配置參數？當配置信息被某個進程或服務器改變時，如何實時通知整個集群中的其他機

【軟件構造】第十章線程和分布式系統

ack pty 安全策略 tput 共享數據原則都是比較 res 本章關註復雜軟件系統的構造。本章關註復雜軟件系統的構造。這裏的“復雜”包括三方面：這裏的“復雜”包括三方面：（1）多線程序（2）分布式程序（3） GUI 程序 Outline 並發編程

[原創]分布式系統之緩存的微觀應用經驗談（四）【交互場景篇】

預熱計算機硬件只需要多次閱讀分布式事務模糊 mil reat 分布式系統之緩存的微觀應用經驗談（四）【交互場景篇】前言　　近幾個月一直在忙些瑣事，幾乎年後都沒怎麽閑過。忙忙碌碌中就進入了2018年的秋天了，不得不感嘆時間總是如白駒過隙，也不

精華【分布式、微服務、雲架構、dubbo+zookeeper+springmvc+mybatis+shiro+redis】分布式大型互聯網企業架構！

net ios 系統數據庫權限分配容器移動 activit str 重復平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE快速開發平臺。 Jeesz本身集成Dubbo服務管控、

【分布式架構】企業級分布式應用服務EDAS使用攻略

互聯網架構計算框架分布式服務使用攻略解決方案 lips tle 基礎知識包括課程介紹本課程主要講解企業級分布式應用服務EDAS相關技術和使用方法。企業級分布式應用服務（EDAS，Enterprise Distributed Application Servi

日誌系統之基於Zookeeper的分布式協同設計

服務配置設計 onf 進程最新 secret 要求日誌搜索必須近期這段時間在設計和實現日誌系統。在整個日誌系統系統中Zookeeper的作用非常重要——它用

JA17-大型電商分布式系統應用實踐+性能優化+分布式應用架構+負載均衡+高並發設計+持久化存儲視頻教程

war height imageview clas 圖片進步 pac 點滴 blank JA17-大型電商分布式系統應用實踐+性能優化+分布式應用架構+負載均衡+高並發設計+持久化存儲視頻教程新年伊始，學習要趁早，點滴記錄，學習就是進步! 不要到處找了，抓緊提升自

你能不能設計出一個完美的分布式系統？

最大值 caption 註意 4.4 指標 nap 均勻分布出現資源 1. 分布式系統相關概念 1.1 模型 1.1.1 節點節點是一個可以獨立按照分布式協議完成一組邏輯的程序個體，工程中往往指進程。 1.1.2 通信節點之間完全獨立互相隔離，通信唯一

筆記：分布式系統中心跳協議的設計

處理格式實現失效答案字段負載均衡協議棧防止 1 分布式系統中是否需要應用層心跳？在采用TCP連接作為進程間通信方式的分布式系統中。當任意一方進程意外退出的時候，對方能及時得到連接斷開的通知，操作系統會關閉進程中使用的TCP scoket，會往對方發送FIN

【Hadoop 分布式部署九：分布式協作框架Zookeeper架構分布式安裝部署】

文件 com info 框架分享圖片 zkserver bubuko 情況 soft 1.首先將運行在本地上的 zookeeper 給停止掉 2.到/opt/softwares 目錄下將 zookeeper解壓到 /opt/app 目錄下　　　　命令: ta

【分布式事務】微服務架構下的分布式事務問題

queue spring 回滾事務提交 relative 社區 confirm 模型功能一、基本概念 ACID理論：關系型數據庫的事務滿足 ACID 的特性，具有 ACID 特性的數據庫支持數據的強一致性，保證了數據本身不會出現不一致。適用於傳統的單體架構。 CAP

【分布式事務】使用atomikos+jta解決分布式事務問題

alt property 自己 control lec 技術 unique unicode har 一、前言分布式事務，這個問題困惑了小編很久，在3個月之前，就間斷性的研究分布式事務。從MQ方面，數據庫事務方面，jta方面。近期終於成功了，使用JTA解決了分布式事務問題。

分布式系統唯一ID生成方案匯總

gen 傳輸數據 lee sleep gui 有效很難 sha 調整系統唯一ID是我們在設計一個系統的時候常常會遇見的問題，也常常為這個問題而糾結。生成ID的方法有很多，適應不同的場景、需求以及性能要求。所以有些比較復雜的系統會有多個ID生成的策略。下面就介紹一些常見的