1. 程式人生 > >關於負載均衡的一切,簡單易懂

關於負載均衡的一切,簡單易懂

什麼是負載均衡?

負載均衡(Load Balance)是分散式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料均勻分攤到多個操作單元上執行,負載均衡的關鍵在於均勻。

 

常見的負載均衡方案有哪些?

常見網際網路分散式架構如上,分為:

客戶端層

反向代理層

站點層

服務層

資料層

可以看到,每一個下游都有多個上游呼叫,只需要做到,每一個上游都均勻訪問每一個下游,就能實現整體的均勻分攤。

 

第一層:客戶端層到反向代理層

客戶端層到反向代理層的負載均衡,是通過“DNS輪詢”實現的。

DNS-server對於一個域名配置了多個解析ip,每次DNS解析請求來訪問DNS-server,會輪詢返回這些ip,保證每個ip的解析概率是相同的。這些ip就是nginx的外網ip,以做到每臺nginx的請求分配也是均衡的。

 

第二層:反向代理層到站點層

反向代理層到站點層的負載均衡,是通過“nginx”實現的。

畫外音:nginx是反向代理的泛指。

修改nginx.conf,可以實現多種均衡策略:

(1) 請求輪詢:和DNS輪詢類似,請求依次路由到各個web-server;

(2) 最少連線路由:哪個web-server的連線少,路由到哪個web-server;

(3) ip雜湊:按照訪問使用者的ip雜湊值來路由web-server,只要使用者的ip分佈是均勻的,請求理論上也是均勻的,ip雜湊均衡方法可以做到,同一個使用者的請求固定落到同一臺web-server上,此策略適合有狀態服務,例如session;

畫外音:站點層可以儲存session,但強烈不建議這麼做,站點層無狀態是分散式架構設計的基本原則之一,session最好放到資料層儲存。

(4) …

 

第三層:站點層到服務層

站點層到服務層的負載均衡,是通過“服務連線池”實現的。

上游連線池會建立與下游服務多個連線,每次請求會“隨機”選取連線來訪問下游服務。除了負載均衡,服務連線池還能夠實現故障轉移超時處理限流限速ID序列化等諸多功能。

 

第四層:訪問資料層

在資料量很大的情況下,由於資料層(db/cache)涉及資料的水平切分,所以資料層的負載均衡更為複雜一些,它分為“資料的均衡”,與“請求的均衡”。

資料的均衡是指:水平切分後的每個服務(db/cache),資料量是均勻的。

請求的均衡是指:水平切分後的每個服務(db/cache),請求量是均勻的。

業內常見的水平切分方式有這麼幾種:

一、按照range水平切分

每一個數據服務,儲存一定範圍的資料:

user0服務:儲存uid範圍1-1kw

user1服務:儲存uid範圍1kw-2kw

這個方案的好處是:

規則簡單,service只需判斷一下uid範圍就能路由到對應的儲存服務

資料均衡性較好

比較容易擴充套件,可以隨時加一個uid[2kw,3kw]的資料服務

不足是:

請求的負載不一定均衡,一般來說,新註冊的使用者會比老使用者更活躍,大range的服務請求壓力會更大

 

二、按照id雜湊水平切分

每一個數據服務,儲存某個key值hash後的部分資料:

user0服務:儲存偶數uid資料

user1服務:儲存奇數uid資料

這個方案的好處是:

規則簡單,service只需對uid進行hash能路由到對應的儲存服務

資料均衡性較好

請求均勻性較好

不足是:

不容易擴充套件,擴充套件一個數據服務,hash方法改變時候,可能需要進行資料遷移

 

總結

負載均衡(Load Balance)是分散式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料均勻分攤到多個操作單元上執行,其的關鍵在於均勻:在此我向大家推薦一個架構學習交流裙。交流學習裙號:821169538,裡面會分享一些資深架構師錄製的視訊錄影

反向代理層的負載均衡,是通過“DNS輪詢”實現的

站點層的負載均衡,是通過“nginx”實現的

服務層的負載均衡,是通過“服務連線池”實現的

資料層的負載均衡,要考慮“資料的均衡”與“請求的均衡”兩個點,常見的方式有“按照範圍水平切分”與“hash水平切分”