1. 程式人生 > >漫話:如何給女朋友解釋什麼是負載均衡

漫話:如何給女朋友解釋什麼是負載均衡

週末晚上,和女朋友去電影院,準備看晚上的DC的海底動作冒險電影——海王。在入口處,人很多,有幾個引導人員時不時的指揮觀眾從不同的入口進入影院內。我們站在隊伍的尾端。

Load balancing,即負載均衡,是一種計算機技術,用來在多個計算機(計算機叢集)、網路連線、CPU、磁碟驅動器或其他資源中分配負載,以達到最優化資源使用、最大化吞吐率、最小化響應時間、同時避免過載的目的。

為什麼需要負載均衡

我們在日常生活中經常免不了要去一些比較擁擠的地方,比如地鐵站、火車站、電影院、銀行等。其實,根據我們的經驗,無論是買票,還是排隊入場,這些場所一般都會設定多個服務點或者入口的。

但是,如果沒有人引導的話,大多數情況下,最近的入口會擠滿人。而哪些距離較遠的服務點或者入口就寬鬆很多。

這種情況下,就會大大浪費資源,因為如果可以把這些排隊的人很好的分散到各個入口的話會大大縮短排隊時間。

其實,網站的建設也是一樣的。我們在《如何給女朋友介紹什麼是分散式》中提到過,為了提升網站的服務能力,很多網站採用叢集部署,就像話劇院有多個入口一樣。

而當用戶集中訪問網站的時候,如果沒有任何機制來疏導使用者的話,完全隨機或者就近原則的話,那麼就會導致某些伺服器的流量很大,而另外一個伺服器的qps很小。這不僅嚴重的浪費了資源,而且還會導致拉長使用者訪問網站的RT,影響使用者的體驗。更嚴重的可能直接拖垮那些流量大的伺服器。

這時候,就需要一個協調者,來均衡的分配這些使用者的請求,可以讓使用者的可以均勻的分派到不同的伺服器上。

在《如何給女朋友介紹什麼是分散式》中,我們說過,為了提升飯店的服務能力,飯店可能會僱傭多個廚師,而這些廚師就組成了一個廚師叢集。而當用戶在店內點菜的時候,就需要一個專業人員能夠把所有客戶的選單均勻的分配給店內的廚師。這樣才能最大程度的提升飯店的服務能力。

什麼是負載均衡

前面提到過了,為了提升網站的各方面能力,我們一般會把多臺機器組成一個叢集對外提供服務。然而,我們的網站對外提供的訪問入口都是一個的,比如www.taobao.com。那麼當用戶在瀏覽器輸入www.taobao.com的時候如何將使用者的請求分發到叢集中不同的機器上呢,這就是負載均衡在做的事情。


負載均衡(Load Balance),意思是將負載(工作任務,訪問請求)進行平衡、分攤到多個操作單元(伺服器,元件)上進行執行。是解決高效能,單點故障(高可用),擴充套件性(水平伸縮)的終極解決方案。

負載均衡分類

想要實現負載均衡,其實有很多種做法,在深入介紹負載均衡之前,要先介紹一個概念,那就是OSI七層模型。

OSI是一個開放性的通訊系統互連參考模型,他是一個定義得非常好的協議規範。

OSI模型有7層結構,每層都可以有幾個子層。 OSI的7層從上到下分別是 7、應用層;6、表示層;5、會話層;4、傳輸層;3、網路層;2、資料鏈路層;1、物理層;

其中高層(即7、6、5、4層)定義了應用程式的功能,下面3層(即3、2、1層)主要面向通過網路的端到端的資料流。

在這七層模型種,高層次都是依賴於低層次的。層次越高,使用起來越方便。


我們經常聽到的一些和計算機網路有關的概念中:

telnet、HTTP、FTP、NFS、SMTP、DNS等屬於第七層應用層的概念。

TCP、UDP、SPX等屬於第四層傳輸層的概念。

IP、IPX等屬於第三層網路層的概念。

ATM、FDDI等屬於第二層資料鏈路層的概念。

瞭解了網路協議的七層模型以後,再來看看負載均衡。我們可以很明確的一點是,負載均衡是要在網路傳輸中做文章的。而要在網路傳輸過程搞事情,那麼這七層模型就勢必躲不開。

所以,根據負載均衡技術實現在OSI七層模型的不同層次,是可以給負載均衡分類的。

常見的實現方式中,主要可以在應用層、傳輸層、網路層和資料傳輸層做文章。所以,工作在應用層的負載均衡,我們通常稱之為七層負載均衡、工作在傳輸層的我們稱之為四層負載均衡。

大致可以分為以下幾種,其中最常用的是四層和七層負載均衡:

二層負載均衡

負載均衡伺服器對外依然提供一個VIP(虛IP),叢集中不同的機器採用相同IP地址,但是機器的MAC地址不一樣。當負載均衡伺服器接受到請求之後,通過改寫報文的目標MAC地址的方式將請求轉發到目標機器實現負載均衡。

三層負載均衡

和二層負載均衡類似,負載均衡伺服器對外依然提供一個VIP(虛IP),但是叢集中不同的機器採用不同的IP地址。當負載均衡伺服器接受到請求之後,根據不同的負載均衡演算法,通過IP將請求轉發至不同的真實伺服器。

四層負載均衡

四層負載均衡工作在OSI模型的傳輸層,由於在傳輸層,只有TCP/UDP協議,這兩種協議中除了包含源IP、目標IP以外,還包含源埠號及目的埠號。四層負載均衡伺服器在接受到客戶端請求後,以後通過修改資料包的地址資訊(IP+埠號)將流量轉發到應用伺服器。

七層負載均衡

七層負載均衡工作在OSI模型的應用層,應用層協議較多,常用http、radius、dns等。七層負載就可以基於這些協議來負載。這些應用層協議中會包含很多有意義的內容。比如同一個Web伺服器的負載均衡,除了根據IP加埠進行負載外,還可根據七層的URL、瀏覽器類別、語言來決定是否要進行負載均衡。

負載均衡工具

市面上有很多開源的負載均衡的工具或軟體,基本都是基於前面提到的方案實現的,大多數是工作在第七層和第四層的。Nginx/LVS/HAProxy是目前使用最廣泛的三種負載均衡軟體。

LVS

LVS(Linux Virtual Server),也就是Linux虛擬伺服器, 是一個由章文嵩博士發起的自由軟體專案。使用LVS技術要達到的目標是:通過LVS提供的負載均衡技術和Linux作業系統實現一個高效能、高可用的伺服器群集,它具有良好可靠性、可擴充套件性和可操作性。從而以低廉的成本實現最優的服務效能。

LVS主要用來做四層負載均衡。

Nginx

Nginx(發音同engine x)是一個網頁伺服器,它能反向代理HTTP, HTTPS, SMTP, POP3, IMAP的協議連結,以及一個負載均衡器和一個HTTP快取。

Nginx主要用來做七層負載均衡。

HAProxy

HAProxy是一個使用C語言編寫的自由及開放原始碼軟體,其提供高可用性、負載均衡,以及基於TCP和HTTP的應用程式代理。

HAProxy主要用來做七層負載均衡。

負載均衡伺服器在決定將請求轉發到具體哪臺真實伺服器的時候,是通過負載均衡演算法來實現的。負載均衡演算法,是一個負載均衡伺服器的核心。

就像電影院門口的引導員一樣,他根據什麼把排隊人員分配到具體的入口呢?是哪個入口人少嗎?還是哪個入口速度最快?還是哪個入口最近呢?如果來了一個VIP怎麼辦呢?

負載均衡演算法可以分為兩類:靜態負載均衡演算法和動態負載均衡演算法。

靜態負載均衡演算法包括:輪詢,比率,優先權

動態負載均衡演算法包括: 最少連線數,最快響應速度,觀察方法,預測法,動態效能分配,動態伺服器補充,服務質量,服務型別,規則模式。

輪詢(Round Robin):順序迴圈將請求一次順序迴圈地連線每個伺服器。當其中某個伺服器發生第二到第7 層的故障,BIG-IP 就把其從順序迴圈佇列中拿出,不參加下一次的輪詢,直到其恢復正常。

比率(Ratio):給每個伺服器分配一個加權值為比例,根椐這個比例,把使用者的請求分配到每個伺服器。當其中某個伺服器發生第二到第7 層的故障,BIG-IP 就把其從伺服器佇列中拿出,不參加下一次的使用者請求的分配, 直到其恢復正常。

優先權(Priority):給所有伺服器分組,給每個組定義優先權,BIG-IP 使用者的請求,分配給優先順序最高的伺服器組(在同一組內,採用輪詢或比率演算法,分配使用者的請求);當最高優先順序中所有伺服器出現故障,BIG-IP 才將請求送給次優先順序的伺服器組。這種方式,實際為使用者提供一種熱備份的方式。

最少的連線方式(Least Connection):傳遞新的連線給那些進行最少連線處理的伺服器。當其中某個伺服器發生第二到第7 層的故障,BIG-IP 就把其從伺服器佇列中拿出,不參加下一次的使用者請求的分配, 直到其恢復正常。

最快模式(Fastest):傳遞連線給那些響應最快的伺服器。當其中某個伺服器發生第二到第7 層的故障,BIG-IP 就把其從伺服器佇列中拿出,不參加下一次的使用者請求的分配,直到其恢復正常。

觀察模式(Observed):連線數目和響應時間以這兩項的最佳平衡為依據為新的請求選擇伺服器。當其中某個伺服器發生第二到第7 層的故障,BIG-IP就把其從伺服器佇列中拿出,不參加下一次的使用者請求的分配,直到其恢復正常。

預測模式(Predictive):BIG-IP利用收集到的伺服器當前的效能指標,進行預測分析,選擇一臺伺服器在下一個時間片內,其效能將達到最佳的伺服器相應使用者的請求。(被BIG-IP 進行檢測)

動態效能分配(Dynamic Ratio-APM):BIG-IP 收集到的應用程式和應用伺服器的各項效能引數,動態調整流量分配。

動態伺服器補充(Dynamic Server Act.):當主伺服器群中因故障導致數量減少時,動態地將備份伺服器補充至主伺服器群。

服務質量(QoS):按不同的優先順序對資料流進行分配。

服務型別(ToS): 按不同的服務型別(在Type of Field中標識)負載均衡對資料流進行分配。

規則模式:針對不同的資料流設定導向規則,使用者可自行。

以上,就是目前實現負載均衡的主流演算法。不同的負載均衡伺服器會選擇不同的演算法。就像電影院和火車站可能會選用不同的引導策略一樣。火車站可能會把行李少的旅客分配到一個專門的入口,可能給即將發車的旅客分派到特快入口,手持可掃描車票的使用者單獨分配到特殊入口等。



作者:Java入門到入墳
連結:https://www.jianshu.com/p/c6b2a1a50185
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯絡作者獲得授權並註明出處。