1. 程式人生 > >深入理解HTTP協議及原理分析之快取

深入理解HTTP協議及原理分析之快取

3.2 快取的實現原理

3.2.1什麼是Web快取

WEB快取(cache)位於Web伺服器和客戶端之間。

快取會根據請求儲存輸出內容的副本,例如html頁面,圖片,檔案,當下一個請求來到的時候:如果是相同的URL,快取直接使用副本響應訪問請求,而不是向源伺服器再次傳送請求。

HTTP協議定義了相關的訊息頭來使WEB快取儘可能好的工作。

3.2.2快取的優點

減少相應延遲:因為請求從快取伺服器(離客戶端更近)而不是源伺服器被相應,這個過程耗時更少,讓web伺服器看上去相應更快。

減少網路頻寬消耗:當副本被重用時會減低客戶端的頻寬消耗;客戶可以節省頻寬費用,控制頻寬的需求的增長並更易於管理。

3.2.3與快取相關的HTTP擴充套件訊息頭

Expires:指示響應內容過期的時間,格林威治時間GMT

Cache-Control:更細緻的控制快取的內容

Last-Modified:響應中資源最後一次修改的時間

ETag:響應中資源的校驗值,在伺服器上某個時段是唯一標識的。

Date:伺服器的時間

If-Modified-Since:客戶端存取的該資源最後一次修改的時間,同Last-Modified。

If-None-Match:客戶端存取的該資源的檢驗值,同ETag。

3.2.4客戶端快取生效的常見流程

伺服器收到請求時,會在200OK中回送該資源的Last-Modified和ETag頭,客戶端將該資源儲存在cache中,並記錄這兩個屬性。當客戶端需要傳送相同的請求時,會在請求中攜帶If-Modified-Since和If-None-Match兩個頭。兩個頭的值分別是響應中Last-Modified和ETag頭的值。伺服器通過這兩個頭判斷本地資源未發生變化,客戶端不需要重新下載,返回304響應。常見流程如下圖所示:

客戶端快取生效的常見流程

3.2.5 Web快取機制

HTTP/1.1中快取的目的是為了在很多情況下減少傳送請求,同時在許多情況下可以不需要傳送完整響應。前者減少了網路迴路的數量;HTTP利用一個“過期(expiration)”機制來為此目的。後者減少了網路應用的頻寬;HTTP用“驗證(validation)”機制來為此目的。

HTTP定義了3種快取機制:

1)Freshness:允許一個迴應訊息可以在源伺服器不被重新檢查,並且可以由伺服器和客戶端來控制。例如,Expires迴應頭給了一個文件不可用的時間。Cache-Control中的max-age標識指明瞭快取的最長時間;

2)Validation:用來檢查以一個快取的迴應是否仍然可用。例如,如果一個迴應有一個Last-Modified迴應頭,快取能夠使用If-Modified-Since來判斷是否已改變,以便判斷根據情況傳送請求;

3)Invalidation: 在另一個請求通過快取的時候,常常有一個副作用。例如,如果一個URL關聯到一個快取迴應,但是其後跟著POST、PUT和DELETE的請求的話,快取就會過期。

3.3 斷點續傳和多執行緒下載的實現原理

HTTP協議的GET方法,支援只請求某個資源的某一部分;

206 Partial Content 部分內容響應;

Range 請求的資源範圍;

Content-Range 響應的資源範圍;

在連線斷開重連時,客戶端只請求該資源未下載的部分,而不是重新請求整個資源,來實現斷點續傳。

分塊請求資源例項:

Eg1:Range: bytes=306302- :請求這個資源從306302個位元組到末尾的部分;

Eg2:Content-Range: bytes 306302-604047/604048:響應中指示攜帶的是該資源的第306302-604047的位元組,該資源共604048個位元組;

客戶端通過併發的請求相同資源的不同片段,來實現對某個資源的併發分塊下載。從而達到快速下載的目的。目前流行的FlashGet和迅雷基本都是這個原理。

多執行緒下載的原理:

下載工具開啟多個發出HTTP請求的執行緒;

每個http請求只請求資原始檔的一部分:Content-Range: bytes 20000-40000/47000;

合併每個執行緒下載的檔案。

3.4 https通訊過程

3.4.1什麼是https

HTTPS(全稱:Hypertext Transfer Protocol over Secure Socket Layer),是以安全為目標的HTTP通道,簡單講是HTTP的安全版。即HTTP下加入SSL層,HTTPS的安全基礎是SSL,因此加密的詳細內容請看SSL。

見下圖:

什麼是https

https所用的埠號是443。