1. 程式人生 > >第9章 應用層(4)_超文字傳輸協議HTTP

第9章 應用層(4)_超文字傳輸協議HTTP

5. 超文字傳輸協議HTTP

5.1 統一資源定位符URL

(1)URL的一般形式:<協議>://<主機>:<埠>/<路徑>

  ①協議後面必須寫上“://”,不能省略;

  ②主機是指該主機在因特網上的域名或IP地址;

  ③埠和路徑有時候可以省略。

(2)舉例

  ①HTTP的URL一般形式:http://<主機>:<埠>/<路徑>。其中埠預設為80,通常可省略。

  ②FTP的URL一般形式:ftp:// <主機>:<埠>/<路徑>。其中埠號預設為21。如ftp://user:[email protected]

:9921

5.2 絕對路徑和相對路徑

(1)絕對路徑(URL):為檔案提供完全的路徑,包括使用的協議,如http、ftp和rtsp等。如http://www.sohu.com,ftp://202.136.254.1當連結到其他網站資源時,必須使用絕對路徑

(2)相對路徑:指向站點資料夾之內的檔案(或資料夾)。只要是同一網站之下的,即使不在同一個目錄之下,相對路徑也非常合適。

  ①如果連結到同一目錄下,則只需要輸入要連結文件的名稱。

  ②要連結到下一級目錄中的檔案,只需先輸入目錄名,然後加“/”再輸入檔名。

  ③如果要連結到上一級目錄中的檔案,則先輸入“../”,再輸入目錄名、檔名。

(3)根路徑:相對於網站的根目錄。以斜槓開頭,然後是資料夾名,最後寫檔名。如“/dir/file1.txt”

5.3 HTTP協議版本

(1)http1.0和http1.1的比較

  ①由於Web站點訪問量大,為了提高系統的效率,HTTP1.0規定瀏覽器與服務只保持短暫連線,瀏覽器的每次請求都需要與伺服器建立一個tcp連線。這也造成一些效能上的缺陷。比如,當一個包含許多影象的網頁檔案(如大量的<img>標籤),每下載一個影象檔案都必須單獨建立一個tcp連線,那怕影象檔案很小也如此。由於頻繁建立和關閉tcp連線會嚴重影響伺服器的效能。

  ②http1.1支援持續連線

。指的是Web伺服器在傳送響應後的一段時間內仍保持這條連線,使同一客戶(瀏覽器)和該伺服器的通訊可以繼續使用該連線。這並不侷限於傳送同一個頁面上鍊接的文件,而只要這些文件都在同一個伺服器上就行,它減少了建立和關閉連線的浪費。(目前IE預設使用http1.1,可在“工具”→“Internet選項”→“高階”→“HTTP1.1設定”中設定或取消,若取消則使用的是1.0版本)

(2)http1.1持續連線的兩種工作方式

 

  ①非流水線方式的特點:客戶在收到前一個響應後才能發出下一個請求。因此在TCP連線建立後,客戶每訪問一次物件都要用去一個往返時間RTT。如果要下載的檔案很多,伺服器在傳送完一個物件後,其TCP連線就處理空閒狀態,浪費了伺服器資源。

  ②流水線方式的特點:客戶在收到http的響應報文 就能夠接著傳送新的請求報文。於是一個接一個的請求報文到達伺服器後,伺服器就可以連線發回響應報文。這種方式使TCP連線的空閒時間減少,提高了文件的下載效率。因此,下載速度比非流水線的快很多。

5.4 HTTP的請求報文和響應報文

(1)請求報文(從客戶端向伺服器傳送的請求報文)

   ①由於http是面向文字的,因此在報文中的每個欄位都是一些ASCII碼串,通常以\r\n結束

  ②http請求報文由三部分組成:A.開始行。主要用於區別是請求報文還是響應服文。B.首部行,用來說明瀏覽器、伺服器或報文主體的一些資訊。首部可以多行,也可以不使用。每一行都以“回車”和“換行”結束。整個部分行結束,還要有一個“回車”和“換行”。C.實體主體。在請求報文中一般不用這個欄位,而響應報文中也可能沒有這個欄位。

  ③“請求行”的“Request Method”共有8方法見上圖)。用來表示對“Request URI”指定的資源的不同操作方式,注意方法名是區別大小寫的!

(2)響應報文(從伺服器到客戶端的應答)

  ①響應報文的第1行是狀態行:包括http版本、狀態碼以及解釋狀態碼的簡單短語等三項內容。

  ②狀態碼(Status Code)共5大類33種

狀態碼

含義

1xx

表示通知資訊。如請求收到了或正在進行處理

2xx

表示成功。如接受或知道了

3xx

表示重定向。如要完成請求還必須採取進一步的行動

4xx

表示客戶端的錯誤。如請求中有錯誤的語法或不能完成

5xx

表示伺服器的差錯。如伺服器失效無法完成請求

5.5 Cookie

(1)Cookie簡介:

  ①由於http是一種無狀態的協議。為了記錄資訊,當客戶端請求伺服器時,如果伺服器記錄需要記錄該使用者的狀態,就使用response向客戶端瀏覽器頒發一個Cookie,客戶端瀏覽器會把Cookie儲存起來。

  ②當瀏覽器再次請求該網站時,瀏覽器把請求的網址連同該Cookie一同提交給伺服器。伺服器會檢查該Cookie,還可以根據需要修改Cookie的內容。

(2)Cookie的匯出和匯入

  ①匯出:瀏覽126郵箱,選擇“十天內免登入”。然後“檔案”→“匯入和匯出”→“匯出Cookie” →指定儲存位置

  ②匯入:在另一臺計算機上,開啟瀏覽器→“檔案”→“匯入和匯出”→“匯入Cookie”,然後開啟126郵箱,該網站自動讀取Cookie並自動登入。

(3)Cookie安全(刪除Cookie):“Internet選項”→“常規”→“刪除Cookie”

5.6 通過代理伺服器訪問網站

(1)代理伺服器應用場景

  ①使用代理伺服器,繞過防火牆封鎖。由於國內防火牆攔截了到某些國外網站(如B)的流量。但國外有很多Web代理伺服器(如C),國內使用者可以設定瀏覽器使用國外的代理伺服器,然後再去訪問這些網站就能成功。

  ②提高內網使用者的訪問速度。代理伺服器可以快取使用者訪問過的內容,當其他使用者再訪問相同的URL時,由代理伺服器從快取中找到要訪問的資訊,傳給使用者,從而提高訪問速度。

  ③隱藏真實IP。有些網站的論壇會記錄發貼人的IP地址,可以使用代理伺服器去訪問,這樣網站只會記錄代理的地址,從而隱藏自己的IP。

(2)架設Web代理伺服器

  ①將Win2003虛擬機器架設成Web代理伺服器:執行CCProxy軟體。(注意本機IP:192.16.80.20,執行該軟體後預設會在808埠監聽客戶端連線)

  ②通常代理伺服器有兩個網絡卡,一個連線Internet,一個連線內網。連線內網的網絡卡為內網計算機上網的代理地址。(本實驗Web代理伺服器就一個網絡卡,因此需要指定哪個地址可以作為代理地址,方法是CCProxy→“帳戶” →在“允許範圍”中選擇“允許所有”)。

(3)測試代理

  ①xp機上指定使用代理伺服器:開啟IE→“工具”→“Internet選項”→“連線”選項卡→“區域網設定”→在“代理伺服器”中填入IP和埠(如上面的IP:192.168.80.20,埠808)

  ②瀏覽網站。然後用netstat -an檢視,就可以看到只有和Web代理建立的TCP連線了。也可以在Win2003的代理服務軟體的“監控”中看到這些資訊。