1. 程式人生 > >負載均衡與雙機熱備

負載均衡與雙機熱備

負載均衡原理與技術實現

負載均衡(Load Balance,簡稱LB)是一種伺服器或網路裝置的叢集技術。負載均衡將特定的業務(網路服務、網路流量等)分擔給多個伺服器或網路裝置,從而提高了業務處理能力,保證了業務的高可用性。

(一)HTTP重定向實現負載均衡

當用戶向伺服器發起請求時,請求首先被叢集排程者截獲;排程者根據某種分配策略,選擇一臺伺服器,並將選中的伺服器的IP地址封裝在HTTP響應訊息頭部的Location欄位中,並將響應訊息的狀態碼設為302,最後將這個響應訊息返回給瀏覽器。

當瀏覽器收到響應訊息後,解析Location欄位,並向該URL發起請求,然後指定的伺服器處理該使用者的請求,最後將結果返回給使用者。

在使用HTTP重定向來實現伺服器叢集負載均衡的過程中,需要一臺伺服器作為請求排程者。使用者的一項操作需要發起兩次HTTP請求,一次向排程伺服器傳送請求,獲取後端伺服器的IP,第二次向後端伺服器傳送請求,獲取處理結果。 

排程伺服器收到使用者的請求後,究竟選擇哪臺後端伺服器處理請求,這由排程伺服器所使用的排程策略決定。

  1. 隨機分配策略 
    當排程伺服器收到使用者請求後,可以隨機決定使用哪臺後端伺服器,然後將該伺服器的IP封裝在HTTP響應訊息的Location屬性中,返回給瀏覽器即可。
  2. 輪詢策略(RR) 
    排程伺服器需要維護一個值,用於記錄上次分配的後端伺服器的IP。那麼當新的請求到來時,排程者將請求依次分配給下一臺伺服器。

由於輪詢策略需要排程者維護一個值用於記錄上次分配的伺服器IP,因此需要額外的開銷;此外,由於這個值屬於互斥資源,那麼當多個請求同時到來時,為了避免執行緒的安全問題,因此需要鎖定互斥資源,從而降低了效能。而隨機分配策略不需要維護額外的值,也就不存線上程安全問題,因此效能比輪詢要高。 

優缺點分析

    採用HTTP重定向來實現伺服器叢集的負載均衡實現起來較為容易,邏輯比較簡單,但缺點也較為明顯。

在HTTP重定向方法中,排程伺服器只在客戶端第一次向網站發起請求的時候起作用。當排程伺服器向瀏覽器返回響應資訊後,客戶端此後的操作都基於新的URL進行的(也就是後端伺服器),此後瀏覽器就不會與排程伺服器產生關係,進而會產生如下幾個問題:

  • 由於不同使用者的訪問時間、訪問頁面深度有所不同,從而每個使用者對各自的後端伺服器所造成的壓力也不同。而排程伺服器在排程時,無法知道當前使用者將會對伺服器造成多大的壓力,因此這種方式無法實現真正意義上的負載均衡,只不過是把請求次數平均分配給每臺伺服器罷了。
  • 若分配給該使用者的後端伺服器出現故障,並且如果頁面被瀏覽器快取,那麼當用戶再次訪問網站時,請求都會發給出現故障的伺服器,從而導致訪問失敗。

(二)DNS負載均衡

我們提交的請求不會直接傳送給想要訪問的網站,而是首先發給域名伺服器,它會幫我們把域名解析成IP地址並返回給我們。我們收到IP之後才會向該IP發起請求。

那麼,DNS伺服器有一個天然的優勢,如果一個域名指向了多個IP地址,那麼每次進行域名解析時,DNS只要選一個IP返回給使用者,就能夠實現伺服器叢集的負載均衡。 

一般DNS提供商會提供一些排程策略供我們選擇,如隨機分配、輪詢、根據請求者的地域分配離他最近的伺服器。 

優缺點分析

       DNS負載均衡最大的優點就是配置簡單。伺服器叢集的排程工作完全由DNS伺服器承擔,那麼我們就可以把精力放在後端伺服器上,保證他們的穩定性與吞吐量。而且完全不用擔心DNS伺服器的效能,即便是使用了輪詢策略,它的吞吐率依然卓越。

此外,DNS負載均衡具有較強了擴充套件性,你完全可以為一個域名解析較多的IP,而且不用擔心效能問題。

但是,由於把叢集排程權交給了DNS伺服器,從而我們沒辦法隨心所欲地控制排程者,沒辦法定製排程策略。

DNS伺服器也沒辦法瞭解每臺伺服器的負載情況,因此沒辦法實現真正意義上的負載均衡。它和HTTP重定向一樣,只不過把所有請求平均分配給後端伺服器罷了。

此外,當我們發現某一臺後端伺服器發生故障時,即使我們立即將該伺服器從域名解析中去除,但由於DNS伺服器會有快取,該IP仍然會在DNS中保留一段時間,那麼就會導致一部分使用者無法正常訪問網站。這是一個致命的問題!好在這個問題可以用動態DNS來解決。 
 

動態DNS

動態DNS能夠讓我們通過程式動態修改DNS伺服器中的域名解析。從而當我們的監控程式發現某臺伺服器掛了之後,能立即通知DNS將其刪掉。

    綜上:DNS是一種粗獷的負載均衡方法,一般不推薦使用

(三)反向代理負載均衡

反向代理伺服器是一個位於實際伺服器之前的伺服器,所有向我們網站發來的請求都首先要經過反向代理伺服器,伺服器根據使用者的請求要麼直接將結果返回給使用者,要麼將請求交給後端伺服器處理,再返回給使用者。

用反向代理伺服器可以實現靜態頁面和常用的動態頁面的快取。

我們知道,所有傳送給我們網站的請求都首先經過反向代理伺服器。那麼,反向代理伺服器就可以充當伺服器叢集的排程者,它可以根據當前後端伺服器的負載情況,將請求轉發給一臺合適的伺服器,並將處理結果返回給使用者。 

優點

  1. 隱藏後端伺服器。 
    與HTTP重定向相比,反向代理能夠隱藏後端伺服器,所有瀏覽器都不會與後端伺服器直接互動,從而能夠確保排程者的控制權,提升叢集的整體效能。
  2. 故障轉移 
    與DNS負載均衡相比,反向代理能夠更快速地移除故障結點。當監控程式發現某一後端伺服器出現故障時,能夠及時通知反向代理伺服器,並立即將其刪除。
  3. 合理分配任務 
    HTTP重定向和DNS負載均衡都無法實現真正意義上的負載均衡,也就是排程伺服器無法根據後端伺服器的實際負載情況分配任務。但反向代理伺服器支援手動設定每臺後端伺服器的權重。我們可以根據伺服器的配置設定不同的權重,權重的不同會導致被排程者選中的概率的不同。或者使用IP/Url Hash的方法。 

缺點

  1. 排程者壓力過大 
    由於所有的請求都先由反向代理伺服器處理,那麼當請求量超過排程伺服器的最大負載時,排程伺服器的吞吐率降低會直接降低叢集的整體效能。
  2. 制約擴充套件 
    當後端伺服器也無法滿足巨大的吞吐量時,就需要增加後端伺服器的數量,可沒辦法無限量地增加,因為會受到排程伺服器的最大吞吐量的制約。 

常用負載均衡開源軟體有nginx、lvs、haproxy,商業的硬體負載均衡裝置F5、Netscale

LVS是 Linux Virtual Server 的簡稱,也就是Linux虛擬伺服器。

Nginx+keepalive實現主備:防止唯一的nginx宕機導致系統停止

Keepalived的作用是檢測伺服器的狀態,如果有一臺web伺服器宕機,或工作出現故障,Keepalived將檢測到,並將有故障的伺服器從系統中剔除,同時使用其他伺服器代替該伺服器的工作,當伺服器工作正常後Keepalived自動將伺服器加入到伺服器群中,這些工作全部自動完成,不需要人工干涉,需要人工做的只是修復故障的伺服器。

Keepalived原理分別如下:

網路層:Keepalived使用網路層的方式工作時,Keepalived會定期向伺服器群中的伺服器傳送一個ICMP的資料包(既我們平時用的Ping程式),如果發現某臺服務的IP地址沒有啟用,Keepalived便報告這臺伺服器失效,並將它從伺服器群中剔除,這種情況的典型例子是某臺伺服器被非法關機。網路層的方式是以伺服器的IP地址是否有效作為伺服器工作正常與否的標準。

傳輸層:如果您理解了網路層的方式,傳輸就容易了。傳輸主要以TCP埠的狀態來決定伺服器工作正常與否。如web server的服務埠一般是80,如果Keepalived檢測到80埠沒有啟動,則Keepalived將把這臺伺服器從伺服器群中剔除。

雙機熱備

1、一臺master、一臺backup(slave),master掛了backup自動補上去

2、135用master、246用backup,週末休息

3、兩臺Load Balancer都作為master,分別為不同的業務做負載均衡,並且同時設定為對方的slave,即可靠,又不浪費資源