1. 程式人生 > >cache節點、CDN的四大關鍵技術1

cache節點、CDN的四大關鍵技術1

一般來講,CDN網路主要由中心節點、邊緣節點兩部分構成。

CDN架構導引

最簡單的CDN網路只需一臺負責全域性負載均衡的DNS和各節點一臺Cache,即可執行。DNS支援根據使用者源IP地址解析不同的IP,實現就近訪問。為了保證高可用性等,CDN網管中心需要監控各節點的流量、健康狀況等。一個節點的單臺Cache承載數量不夠時,才需要多臺Cache,多臺Cache同時工作時,才需要負載均衡器,使Cache群協同工作。

CDN中心節點

中心節點包括CDN網管中心和全域性負載均衡DNS重定向解析系統,負責整個CDN網路的分發及管理。

CDN網管中心是整個CDN能夠正常運轉的基礎保證,它不僅能對整個CDN網路中的各個子系統和裝置進行實時監控,對各種故障產生相應的告警,還可以實時監測到系統中總的流量和各節點的流量,並儲存在系統資料庫中,使網管人員能夠方便地進行進一步分析。一套完善的網管系統,允許使用者按需對系統配置進行修改。

全域性負載均衡DNS通過一組預先定義好的策略,將當時最接近使用者的Cache節點地址提供給使用者,使使用者能夠得到快速的服務。同時,它還與分佈在各地的所有CDN節點保持持續通訊,蒐集各節點的通訊狀態,確保不會將使用者的請求分發到不可用、或不健康的Cache節點上。

CDN邊緣節點

CDN邊緣節點主要指異地分發節點,由負載均衡裝置、快取記憶體伺服器兩部分組成。

負載均衡裝置負責每個節點中各個Cache的負載均衡,保證節點的工作效率;同時還負責收集節點與周圍環境的資訊,保持與全域性負載均衡DNS的通訊,實現整個系統的負載均衡。

快取記憶體伺服器(Cache)負責儲存客戶網站的大量資訊,就像一個靠近使用者的網站伺服器一樣響應本地使用者的訪問請求。通過全域性負載均衡DNS的控制,使用者的請求被透明地指向離他最近的節點,節點中Cache伺服器就像網站的原始伺服器一樣,響應終端使用者的請求。因其距離使用者更近,故其響應時間才更快。

CDN的四大關鍵技術

CDN的關鍵技術主要有內容路由技術、內容分發技術、內容儲存技術、內容管理技術等。

內容路由技術

CDN負載均衡系統實現CDN的內容路由功能。它的作用是將使用者的請求導向整個CDN網路中的最佳節點。最佳節點的選定可以根據多種策略,例如距離最近、節點負載最輕等。負載均衡系統是整個CDN的核心,負載均衡的準確性和效率直接決定了整個CDN的效率和效能。

通常負載均衡可以分為兩個層次:全域性負載均衡(GSLB)和本地負載均衡(SLB)。全域性負載均衡(GSLB)主要的目的是在整個網路範圍內將使用者的請求定向到最近的節點(或者區域)。因此,就近性判斷是全域性負載均衡的主要功能。本地負載均衡一般侷限於一定的區域範圍內,其目標是在特定的區域範圍內尋找一臺最適合的節點提供服務,因此,CDN節點的健康性、負載情況、支援的媒體格式等執行狀態是本地負載均衡進行決策的主要依據。

負載均衡可以通過多種方法實現,主要的方法包括DNS、應用層重定向、傳輸層重定向等等。

對於全域性負載均衡而言,為了執行就近性判斷,通常可以採用兩種方式,一種是靜態的配置,例如根據靜態的IP地址配置表進行IP地址到CDN節點的對映。另一種方式是動態的檢測,例如實時地讓CDN節點探測到目標IP的距離(可以採用RRT,Hops作為度量單位),然後比較探測結果進行負載均衡。當然,靜態和動態的方式也可以綜合起來使用。

對於本地負載均衡而言,為了執行有效的決策,需要實時地獲取Cache裝置的執行狀態。獲取的方法一般有兩種,一種是主動探測,一種是協議互動。主動探測針對SLB裝置和Cache裝置沒有協議互動介面的情況,通過ping等命令主動發起探測,根據返回結果分析狀態。另一種是協議互動,即SLB和Cache根據事先定義好的協議實時交換執行狀態資訊,以便進行負載均衡。比較而言,協議互動比探測方式要準確可靠,但是目前尚沒有標準的協議,各廠家的實現一般僅是私有協議,互通比較困難。

內容分發技術

內容分發包含從內容源到CDN邊緣的Cache的過程。從實現上看,有兩種主流的內容分發技術:PUSH和PULL.

PUSH是一種主動分發的技術。通常,PUSH由內容管理系統發起,將內容從源或者中心媒體資源庫分發到各邊緣的Cache節點。分發的協議可以採用HTTP/FTP等。通過PUSH分發的內容一般是比較熱點的內容,這些內容通過PUSH方式預分發(Preload)到邊緣Cache,可以實現有針對的內容提供。對於PUSH分發需要考慮的主要問題是分發策略,即在什麼時候分發什麼內容。一般來說,內容分發可以由CP(內容提供商)或者CDN內容管理員人工確定,也可以通過智慧的方式決定,即所謂的智慧分發。它根據使用者訪問的統計資訊,以及預定義的內容分發的規則,確定內容分發的過程。

PULL是一種被動的分發技術,PULL分發通常由使用者請求驅動。當用戶請求的內容在本地的邊緣Cache上不存在(未命中)時,Cache啟動PULL方法從內容源或者其他CDN節點實時獲取內容。在PULL方式下,內容的分發是按需的。

在實際的CDN系統中,一般兩種分發方式都支援,但是根據內容的型別和業務模式的不同,在選擇主要的內容分發方式時會有所不同。通常,PUSH的方式適合內容訪問比較集中的情況,如熱點的影視流媒體內容;PULL方式比較適合內容訪問分散的情況。

在內容分發的過程中,對於Cache裝置而言,關鍵的是需要建立內容源URL、內容釋出的URL、使用者訪問的URL,以及內容在Cache中儲存的位置之間的對映關係。

內容儲存技術

對於CDN系統而言,需要考慮兩個方面的內容儲存問題。一個是內容源的儲存,一個是內容在Cache節點中的儲存。

對於內容源的儲存,由於內容的規模比較大(通常可以達到幾個甚至幾十個TB),而且內容的吞吐量較大,因此,通常採用海量儲存架構。如NAS和SON.

對於在Cache節點中的儲存,是Cache設計的一個關鍵問題。需要考慮的因素包括功能和效能兩個方面:在功能上包括對各種內容格式的支援、對部分快取的支援,在效能上包括支援的容量、多檔案吞吐率、可靠性、穩定性。

其中,多種內容格式的支援要求儲存系統根據不同檔案格式的讀寫特點進行優化,以提高檔案內容讀寫的效率,特別是對流媒體檔案的讀寫。

部分快取能力指流媒體內容可以以不完整的方式儲存和讀取。部分快取的需求來自使用者訪問行為的隨機性,因為許多使用者並不會完整地收看整個流媒體節目,事實上,許多使用者訪問單個流媒體節目的時間不超過10分鐘。因此,部分快取能力能夠大大提高儲存空間的利用率,並有效地提高使用者請求的響應時間。但是部分快取可能導致內容出現碎片問題,需要進行良好的設計和控制。

Cache儲存的另一個重要因素是儲存的可靠性,目前,多數儲存系統都採用了RAID技術進行可靠儲存。但是不同裝置使用的RAID方式各有不同。

內容管理技術

內容管理在廣義上涵蓋了從內容的釋出、注入、分發、調整、傳遞等一系列過程。在這裡,內容管理重點強調內容進入Cache點後的內容管理,我們稱為本地內容管理。

本地內容管理主要針對一個CDN節點(由多個CDN Cache裝置和一個SLB裝置構成)進行。本地內容管理的主要目標是提高內容服務的效率,提高本地節點的儲存利用率。通過本地內容管理,可以在CDN節點實現基於內容感知的排程,通過內容感知的排程,可以避免將使用者重定向到沒有該內容的Cache裝置上,從而提高負載均衡的效率。通過本地內容管理還可以有效地實現在CDN節點內容的儲存共享,提高儲存空間的利用率。

在實現上,本地內容管理主要包括如下幾個方面。

一是本地內容索引。本地內容管理首先依賴於對本地內容的瞭解。包括每個Cache裝置上內容的名稱、URL、更新時間、內容資訊等。本地內容索引是實現基於內容感知的排程的關鍵。

二是本地內容拷貝。通常,為了提高儲存效率,同一個內容在一個CDN節點中僅儲存一份,即僅儲存在某個特定的Cache上。但是一旦對該內容的訪問超過該Cache的服務提供能力,就需要在本地(而不是通過PUSL的方式)實現內容的分發。這樣可以大大提高效率。

三是本地內容訪問狀態資訊收集。蒐集各個Cache裝置上各個內容訪問的統計資訊,Cache裝置的可用服務提供能力及內容變化的情況。

可以看出,通過本地內容管理,可以將內容的管理從原來的Cache裝置一級,提高到CDN節點一級,從而大大增加了CDN的可擴充套件性和綜合能力。

原文https://blog.csdn.net/ikscher/article/details/6877854