1. 程式人生 > >WEB 請求處理 一:瀏覽器 請求發起處理

WEB 請求處理 一:瀏覽器 請求發起處理

最近,終於要把《WEB請求處理系列》提上日程了,一直答應小夥伴們給分享一套完整的WEB請求處理流程:從瀏覽器、Nginx、Servlet容器,最終到應用程式WEB請求的一個處理流程,前段時間由於其他工作事情的安排,一直未進行整理。不過還好該系列終於啟動了,給大家分享的同時,也順便整理下自己的思路,以便溫故而知新吧。希望大家都能在此過程中得到新的收穫吧。

本系列主要分五部分:

1.《WEB請求處理一:瀏覽器請求發起處理》:分析使用者在瀏覽器中輸入URL地址,瀏覽器如何找到伺服器地址的過程,併發起請求;

2.《WEB請求處理二:Nginx請求反向代理》:分析請求在達反向代理伺服器內部處理過程;

3.《WEB請求處理三:Servlet容器請求處理》:分析請求在Servlet容器內部處理過程,並找到目標應用程式;

4.《WEB請求處理四:WEB MVC框架請求處理》:分析請求在應用程式內部,開源MVC框架的處理過程;

5.《WEB請求處理五:瀏覽器請求響應處理》:分析請求在伺服器端處理完成後,瀏覽器渲染響應頁面過程;

為直觀明瞭,先上一張圖,紅色部分為本章所述模組:

本章所述模組

1 B/S網路架構概述#

我們先了解下B/S網路架構是什麼?B/S網路架構從前端到後端都得到了簡化,都基於統一的應用層協議HTTP來互動資料,HTTP協議採用無狀態的短連結的通訊方式

,通常情況下,一次請求就完成了一次資料互動,通常也對應一個業務邏輯,然後這次通訊連線就斷開了。採用這種方式是為了能夠同時服務更多的使用者,因為當前網際網路應用每天都會處理上億的使用者請求,不可能每個使用者訪問一次後就一直保持住這個連線

當一個使用者在瀏覽器裡輸入www.google.com這個URL時,將會發生如下操作:

  1. 首先,瀏覽器會請求DNS把這個域名解析成對應的IP地址

  2. 然後,根據這個IP地址在網際網路上找到對應的伺服器,建立Socket連線,向這個伺服器發起一個HTTP Get請求,由這個伺服器決定返回預設的資料資源給訪問的使用者;

  3. 在伺服器端實際上還有複雜的業務邏輯:伺服器可能有多臺

    ,到底指定哪臺伺服器處理請求,這需要一個負載均衡裝置來平均分配所有使用者的請求;

  4. 還有請求的資料是儲存在分散式快取裡還是一個靜態檔案中,或是在資料庫裡

  5. 當資料返回瀏覽器時,瀏覽器解析資料發現還有一些靜態資源(如:css,js或者圖片)時又會發起另外的HTTP請求,而這些請求可能會在CDN上,那麼CDN伺服器又會處理這個使用者的請求;

以上具體流程,如圖所示:

以上具體流程,如圖所示

不管網路架構如何變化,但是始終有一些固定不變的原則需要遵守:

  1. 網際網路上所有資源都要用一個URL來表示。URL就是統一資源定位符;

  2. 必須基於HTTP協議與服務端互動;

  3. 資料展示必須在瀏覽器中進行;

2 HTTP協議解析#

B/S網路架構的核心是HTTP協議,最重要的就是要熟悉HTTP協議中的HTTP Header,HTTP Header控制著網際網路上成千上萬的使用者的資料傳輸。最關鍵的是,它控制著使用者瀏覽器的渲染行為和伺服器的執行邏輯

常見的HTTP請求頭:

常見的HTTP請求頭

常見的HTTP響應頭:

常見的HTTP響應頭

常見的HTTP狀態碼:

常見的HTTP狀態碼

2.1 瀏覽器快取機制##

當我們使用Ctrl+F5組合鍵重新整理一個頁面時,首先是在瀏覽器端,會直接向目標URL傳送請求,而不會使用瀏覽器快取的資料;其次即使請求傳送到服務端,也有可能訪問到的是快取的資料。所以在HTTP的請求頭中會增加一些請求頭,它告訴服務端我們要獲取最新的資料而非快取。最重要的是在請求Head中增加了兩個請求項Pragma:no-cache和Cache-Control:no-cache

  1. Cache-Control/Pragma

這個HTTP Head欄位用於指定所有快取機制在整個請求/響應鏈中必須服從的指令,如果知道該頁面是否為快取,不僅可以控制瀏覽器,還可以控制和HTTP協議相關的快取或代理伺服器

Cache-Control/Pragma欄位的可選值:

Cache-Control/Pragma欄位的可選值

Cache-Control請求欄位被各個瀏覽器支援的較好,而且它的優先順序也比較高,它和其他一些請求欄位(如Expires)同時出現時,Cache-Control會覆蓋其他欄位

Pragma欄位的作用和Cache-Control有點類似,它也是在HTTP頭中包含一個特殊的指令,使相關的伺服器來遵守,最常用的就是Pragma:no-cache,它和Cache-Control:no-cache的作用是一樣的

  1. Expires 快取過期時間

Expires通常的使用格式是Expires:Sat,25 Feb 2012 12:22:17 GMT,後面跟著一個日期和時間,超過這個值後,快取的內容將失效,也就是瀏覽器在發出請求之前檢查這個頁面的這個欄位,看該頁面是否已經過期了,過期了將重新向伺服器發起請求

  1. Last-Modified/Etag 最後修改時間

Last-Modified欄位一般用於表示一個伺服器上的欄位的最後修改時間,資源可以是靜態(靜態內容自動加上Last-Modified)或者動態的內容(如Servlet提供了一個getLastModified方法用於檢查某個動態內容是否已經更新),通過這個最後修改時間可以判斷當前請求的資源是否是最新的

一般伺服器端在響應頭中返回一個Last-Modified欄位,告訴瀏覽器這個頁面的最後修改時間,如:Sat,25 Feb 2012 12:55:04 GMT,瀏覽器再次請求時在請求頭中增加一個If-Modified-Since:Sat,25 Feb 2012 12:55:04 GMT欄位,詢問當前快取的頁面是否是最新的,如果是最新的就會返回304狀態碼,告訴瀏覽器是最新的,伺服器也不會傳輸新的資料。

與Last-Modified欄位有類似功能的還有一個Etag欄位,這個欄位的作用是讓服務端給每個頁面分配一個唯一編號,然後通過這個編號來區分當前這個頁面是否是最新的。這種方式比使用Last-Modified更加靈活,但是在後端的Web伺服器有多臺時比較難處理,因為每個Web伺服器都要記住網站的所有資源編號,否則瀏覽器返回這個編號就沒有意義了

3 WEB工作流程#

對於正常的上網過程,系統其實是這樣做的:

瀏覽器本身是一個客戶端,當你輸入URL的時候,首先瀏覽器會去請求DNS伺服器,通過DNS獲取相應的域名對應的IP,然後通過IP地址找到IP對應的伺服器後,要求建立TCP連線,等瀏覽器傳送完HTTP Request(請求)包後,伺服器接收到請求包之後才開始處理請求包,伺服器呼叫自身服務,返回HTTP Response(響應)包;客戶端收到來自伺服器的響應後開始渲染這個Response包裡的主體(body),等收到全部的內容隨後斷開與該伺服器之間的TCP連線。

Web請求的工作原理

Web請求的工作原理可以簡單地歸納為:

  1. 瀏覽器通過DNS域名解析到伺服器IP

  2. 客戶機通過TCP/IP協議建立到伺服器的TCP連線

  3. 客戶端向伺服器傳送HTTP協議請求包,請求伺服器裡的資源文件;

  4. 伺服器向客戶機發送HTTP協議應答包,如果請求的資源包含有動態語言的內容,那麼伺服器會呼叫動態語言的解釋引擎負責處理“動態內容”,並將處理得到的資料返回給客戶端;

  5. 客戶機與伺服器斷開。由客戶端解釋HTML文件,在客戶端螢幕上渲染圖形結果;

一個簡單的HTTP事務就是這樣實現的,看起來很複雜,原理其實是挺簡單的。需要注意的是客戶機與伺服器之間的通訊是非持久連線的,也就是當伺服器傳送了應答後就與客戶機斷開連線,等待下一次請求。

4 DNS域名解析#

4.1 DNS域名解析過程##

當用戶在瀏覽器中輸入域名,如:www.google.com,並按下回車後,DNS解析過程大體如下:

DNS解析過程

  1. 瀏覽器快取檢查(本機)

瀏覽器會首先搜尋瀏覽器自身的DNS快取(快取時間比較短,大概只有1分鐘,且只能容納1000條快取),看自身的快取中是否有www.google.com對應的條目,而且沒有過期,如果有且沒有過期則解析到此結束

瀏覽器快取域名也是有限制的,不僅瀏覽器快取大小有限制,而且快取的時間也有限制,通常情況下為幾分鐘到幾小時不等,域名被快取的時間限制可以通過TTL屬性來設定。這個快取時間太長和太短都不好,如果快取時間太長,一旦域名被解析到的IP有變化,會導致被客戶端快取的域名無法解析到變化後的IP地址,以致該域名不能正常解析,這段時間內有可能會有一部分使用者無法訪問網站。如果時間設定太短,會導致使用者每次訪問網站都要重新解析一次域名。

注:我們怎麼檢視Chrome自身的快取?可以使用 chrome://net-internals/#dns 來進行檢視

檢視Chrome自身的DNS快取

  1. 作業系統快取檢查(本機)+hosts解析(本機)

如果瀏覽器自身的快取裡面沒有找到對應的條目,其實作業系統也會有一個域名解析的過程,那麼Chrome會首先搜尋作業系統自身的DNS快取中是否有這個域名對應的DNS解析結果,如果找到且沒有過期則停止搜尋解析到此結束

其次在Linux中可以通過/etc/hosts檔案來設定,你可以將任何域名解析到任何能夠訪問的IP地址。如果你在這裡指定了一個域名對應的IP地址,那麼瀏覽器會首先使用這個IP地址。當解析到這個配置檔案中的某個域名時,作業系統會在快取中快取這個解析結果,快取的時間同樣是受這個域名的失效時間和快取的空間大小控制的。

  1. 本地區域名伺服器解析(LDNS)

如果在hosts檔案中也沒有找到對應的條目,瀏覽器就會發起一個DNS的系統呼叫,就會向本地配置的首選DNS伺服器(LDNS一般是電信運營商提供的,也可以使用像Google提供的DNS伺服器)發起域名解析請求(通過的是UDP協議向DNS的53埠發起請求,這個請求是遞迴的請求,也就是運營商的DNS伺服器必須得提供給我們該域名的IP地址)。

在我們的網路配置中都會有“DNS伺服器地址”這一項,這個地址就用於解決前面所說的如果兩個過程無法解析時要怎麼辦,作業系統會把這個域名傳送給這裡設定的LDNS,也就是本地區的域名伺服器這個DNS通常都提供給你本地網際網路接入的一個DNS解析服務,例如你是在學校接入網際網路,那麼你的DNS伺服器肯定在你的學校,如果你是在一個小區接入網際網路的,那這個DNS就是提供給你接入網際網路的應用提供商,即電信或者聯通,也就是通常所說的SPA,那麼這個DNS通常也會在你所在城市的某個角落,通常不會很遠。這個專門的域名解析伺服器效能都會很好,它們一般都會快取域名解析結果,當然快取時間是受域名的失效時間控制的,一般快取空間不是影響域名失效的主要因素。大約80%的域名解析都到這裡就已經完成了,所以LDNS主要承擔了域名的解析工作。

運營商的DNS伺服器首先查詢自身的快取,找到對應的條目,且沒有過期,則解析成功。

運營商的DNS伺服器

  1. 根域名伺服器解析(Root Server)

如果LDNS沒有找到對應的條目,則由運營商的DNS代我們的瀏覽器發起迭代DNS解析請求。它首先是會找根域的DNS的IP地址(這個DNS伺服器都內建13臺根域的DNS的IP地址),找到根域的DNS地址,就會向其發起請求(請問www.google.com這個域名的IP地址是多少啊?)。

  1. 根域名伺服器返回給本地域名伺服器一個所查詢域的主域名伺服器(gTLD Server)地址,gTLD是國際頂級域名伺服器,如.com、.cn、.org等,全球只有13臺左右。

根域發現這是一個頂級域com域的一個域名,於是就告訴運營商的DNS我不知道這個域名的IP地址,但是我知道com域的IP地址,你去找它去。

  1. 本地域名伺服器(Local DNS Server)再向上一步返回的gTLD伺服器傳送請求

於是運營商的DNS就得到了com域的IP地址,又向com域的IP地址發起了請求(請問www.google.com這個域名的IP地址是多少?),com域這臺伺服器告訴運營商的DNS我不知道www.google.com這個域名的IP地址,但是我知道google.com這個域的DNS地址,你去找它去。

  1. 接受請求的gTLD伺服器查詢並返回此域名對應的Name Server域名伺服器的地址,這個Name Server通常就是你註冊的域名伺服器,例如你在某個域名服務提供商申請的域名,那麼這個域名解析任務就由這個域名提供商的伺服器來完成。

於是運營商的DNS又向google.com這個域名的DNS地址(這個一般就是由域名註冊商提供的,像萬網,新網等)發起請求(請問www.google.com這個域名的IP地址是多少?),這個時候google.com域的DNS伺服器一查,果真在我這裡,於是就把找到的結果傳送給運營商的DNS伺服器,這個時候運營商的DNS伺服器就拿到了www.google.com這個域名對應的IP地址

  1. Name Server域名伺服器會查詢儲存的域名和IP的對映關係表,正常情況下都根據域名得到目標IP記錄,連同一個TTL值返回給DNS Server域名伺服器。

  2. 返回該域名對應的IP和TTL值,Local DNS Server會快取這個域名和IP的對應關係,快取的時間由TTL值控制。

  3. 把解析的結果返回給使用者,使用者根據TTL值快取在本地系統快取中,域名解析過程結束

通過上面的步驟,我們最後獲取的是IP地址,也就是瀏覽器最後發起請求的時候是基於IP來和伺服器做資訊互動的。在實際的DNS解析過程中,可能還不止這10個步驟,如Name Server也可能有多級,或者有一個GTM來負載均衡控制,這都有可能會影響域名解析的過程。根據以上解析流程,DNS解析整個過程,分為:遞迴查詢過程和迭代查詢過程。如圖所示:

DNS解析整個過程

所謂 遞迴查詢過程 就是 “查詢的遞交者” 更替, 而 迭代查詢過程 則是 “查詢的遞交者”不變。

舉個例子來說,你想知道某個一起上法律課的女孩的電話,並且你偷偷拍了她的照片,回到寢室告訴一個很仗義的哥們兒,這個哥們兒二話沒說,拍著胸脯告訴你,甭急,我替你查(此處完成了一次遞迴查詢,即,問詢者的角色更替)。然後他拿著照片問了學院大四學長,學長告訴他,這姑娘是xx系的;然後這哥們兒馬不停蹄又問了xx系的辦公室主任助理同學,助理同學說是xx系yy班的,然後很仗義的哥們兒去xx系yy班的班長那裡取到了該女孩兒電話。(此處完成若干次迭代查詢,即,問詢者角色不變,但反覆更替問詢物件)最後,他把號碼交到了你手裡。完成整個查詢過程。

4.2 跟蹤域名解析過程##

在Linux系統中還可以使用dig命名來查詢DNS的解析過程,如下所示:dig +cmd +trace www.google.com

使用dig命名來查詢DNS的解析過程

上面清楚地顯示了整個域名是如何發起和解析的,從根域名(.)到gTLD Server(.com.)再到Name Server (google.com.)的整個過程都顯示出來了。還可以看出DNS的伺服器有多個備份,可以從任何一臺查詢到解析結果。

4.3 清除快取的域名##

我們知道DNS域名解析後會快取解析結果,其中主要在兩個地方快取結果,一個是Local DNS Server,另外一個是使用者的本地機器。這兩個快取都是TTL值和本機快取大小控制的,但是最大快取時間是TTL值,基本上Local DNS Server的快取時間就是TTL控制的,很難人工介入,但是我們的本機快取可以通過如下方式清除。

在Linux下可以通過/etc/init.d/nscd restart來清除DNS快取。如下:

在Linux下清除DNS快取

JVM快取DNS解析結果:

在Java應用中JVM也會快取DNS的解析結果,這個快取是在InetAddress類中完成的,而且這個快取時間還比較特殊,它有兩種快取策略:一種是正確解析結果快取,另一種是失敗的解析結果快取。這兩個快取時間由兩個配置項控制,配置項是在%JAVA_ HOME%\lib\security\java.security檔案中配置的。兩個配置項分別是networkaddress.cache.ttl 和networkaddress.cache.negative.ttl,它們的預設值分別是-1(永不失效)和10(快取10秒)

要修改這兩個值同樣有幾種方式,分別是:直接修改java.security檔案中的預設值、在Java的啟動引數中增加-Dsun.net.inetaddr.ttl=xxx來修改預設值、通過InetAddress類動態修改。

在這裡還要特別強調一下,如果我們需要用InetAddress類解析域名時,一定要是單例模式,不然會有嚴重的效能問題,如果每次都建立InetAddress例項,每次都要進行一次完整的域名解析,非常耗時,這點要特別注意。

4.4 幾種域名解析方式##

  1. A記錄,A代表的是Address,用來指定域名對應的IP地址

如將item.taobao.com指定到115.238.23.241,將switch.taobao.com指定到121.14.24.241。A記錄可以將多個域名解析到一個IP地址,但是不能將一個域名解析到多個IP地址

  1. MX記錄,表示的是Mail Exchange,就是可以將某個域名下的郵件伺服器指向自己的Mail Server

taobao.com域名的A記錄IP地址是115.238.25.245,如果MX記錄設定為115.238.25.246,是[email protected]的郵件路由,DNS會將郵件傳送到115.238.25.246所在的伺服器,而正常通過Web請求的話仍然解析到A記錄的IP地址

  1. CNAME記錄,全稱是Canonical Name(別名解析),所謂的別名解析就是可以為一個域名設定一個或者多個別名

如將taobao.com解析到xulingbo.net,將srcfan.com也解析到xulingbo.net,其中xulingbo.net分別是taobao.com和srcfan.com的別名。前面的跟蹤域名解析中的“www.taobao.com. 1542 IN CNAME www.gslb.taobao.com”就是CNAME解析。

  1. NS記錄,為某個域名指定DNS解析伺服器,也就是這個域名有指定的IP地址的DNS伺服器去解析

前面的“google.com. 172800 IN NS ns4.google.com.”就是NS解析。

  1. TXT記錄,為某個主機名或域名設定說明

如可以為google.com設定TXT記錄為“谷歌|中國”這樣的說明。

4.5 網路抓包分析##

Linux虛擬機器測試,使用命令 wget www.linux178.com 來請求,發現直接使用chrome瀏覽器請求時,干擾請求比較多,所以就使用wget命令來請求,不過使用wget命令只能把index.html請求回來,並不會對index.html中包含的靜態資源(js、css等檔案)進行請求

抓包截圖如下:

抓包截圖

1號包,這個是那臺虛擬機器在廣播,要獲取192.168.100.254(也就是閘道器)的MAC地址,因為區域網的通訊靠的是MAC地址,它為什麼需要跟閘道器進行通訊是因為我們的DNS伺服器IP是外圍IP,要出去必須要依靠閘道器幫我們出去才行

2號包,這個是閘道器收到了虛擬機器的廣播之後,迴應給虛擬機器的迴應,告訴虛擬機器自己的MAC地址,於是客戶端找到了路由出口。

3號包,這個包是wget命令向系統配置的DNS伺服器提出域名解析請求(準確的說應該是wget發起了一個DNS解析的系統呼叫),請求的域名www.linux178.com期望得到的是IP6的地址(AAAA代表的是IPv6地址)

4號包,這個DNS伺服器給系統的響應,很顯然目前使用IPv6的還是極少數,所以得不到AAAA記錄的。

5&6號包,這個還是請求解析IPv6地址,但是www.linux178.com.leo.com這個主機名是不存在的,所以得到結果就是no such name。

7號包,這個才是請求的域名對應的IPv4地址(A記錄)。

8號包,DNS伺服器不管是從快取裡面,還是進行迭代查詢最終得到了域名的IP地址,響應給了系統,系統再給了wget命令,wget於是得到了www.linux178.com的IP地址,這裡也可以看出客戶端和本地的DNS伺服器是遞迴的查詢(也就是伺服器必須給客戶端一個結果)這就可以開始下一步了,進行TCP的三次握手。

5 發起TCP的3次握手#

拿到域名對應的IP地址之後,User-Agent(一般是指瀏覽器)會以一個隨機埠(1024 < 埠 < 65535)向伺服器的WEB程式(常用的有httpd,nginx等)80埠發起TCP的連線請求。這個連線請求(原始的http請求經過TCP/IP4層模型的層層封包)到達伺服器端後(這中間通過各種路由裝置,區域網內除外),進入到網絡卡,然後是進入到核心的TCP/IP協議棧(用於識別該連線請求,解封包,一層一層的剝開),還有可能要經過Netfilter防火牆(屬於核心的模組)的過濾,最終到達WEB程式,最終建立了TCP/IP的連線。

如下圖所示:

03174517_saG0.png

  1. Client首先發送一個連線試探,ACK=0 表示確認號無效,SYN = 1 表示這是一個連線請求或連線接受報文,同時表示這個資料報不能攜帶資料,seq = x 表示Client自己的初始序號(seq = 0 就代表這是第0號包),這時候Client進入syn_sent狀態,表示客戶端等待伺服器的回覆。

  2. Server監聽到連線請求報文後,如同意建立連線,則向Client傳送確認。TCP報文首部中的SYN 和 ACK都置1 ,ack = x + 1表示期望收到對方下一個報文段的第一個資料位元組序號是x+1,同時表明x為止的所有資料都已正確收到(ack=1其實是ack=0+1,也就是期望客戶端的第1個包),seq = y 表示Server自己的初始序號(seq=0就代表這是伺服器這邊發出的第0號包)。這時伺服器進入syn_rcvd,表示伺服器已經收到Client的連線請求,等待client的確認。

  3. Client收到確認後還需再次傳送確認,同時攜帶要傳送給Server的資料。ACK 置1 表示確認號ack= y + 1 有效(代表期望收到伺服器的第1個包),Client自己的序號seq= x + 1(表示這就是我的第1個包,相對於第0個包來說的),一旦收到Client的確認之後,這個TCP連線就進入Established狀態,就可以發起http請求了。

看抓包截圖:

抓包截圖

TCP 為什麼需要3次握手?

舉個例子:假設一個老外在故宮裡面迷路了,看到了小明,於是就有下面的對話:

老外: Excuse me,Can you Speak English?

小明: yes 。

老外: OK,I want ...

在問路之前,老外先問小明是否會說英語,小明回答是的,這時老外才開始問路。

2個計算機通訊是靠協議(目前流行的TCP/IP協議)來實現,如果2個計算機使用的協議不一樣,那是不能進行通訊的,所以這個3次握手就相當於試探一下對方是否遵循TCP/IP協議,協商完成後就可以進行通訊了,當然這樣理解不是那麼準確。

為什麼HTTP協議要基於TCP來實現?

目前在Internet中所有的傳輸都是通過TCP/IP進行的,HTTP協議作為TCP/IP模型中應用層的協議也不例外,TCP是一個端到端的可靠的面向連線的協議,所以HTTP基於傳輸層TCP協議不用擔心資料的傳輸的各種問題。

6 建立TCP連線後發起http請求#

經過TCP3次握手之後,瀏覽器發起了http的請求(看第⑫包),使用的http的方法 GET 方法,請求的URL是 / ,協議是HTTP/1.0:

03175340_4j8z.png

下面是第12號包的詳細內容:

03175429_kHoP.png

以上的報文是HTTP請求報文。那麼HTTP請求報文和響應報文會是什麼格式呢?

起始行:如 GET / HTTP/1.0 (請求的方法 請求的URL 請求所使用的協議)

頭部資訊:User-Agent Host等成對出現的值

主體

不管是請求報文還是響應報文都會遵循以上的格式。那麼起始行中的請求方法有哪些種呢?

GET: 完整請求一個資源 (常用)

HEAD: 僅請求響應首部

POST: 提交表單 (常用)

PUT: 上傳

DELETE: 刪除

OPTIONS: 返回請求的資源所支援的方法的方法

TRACE: 追求一個資源請求中間所經過的代理

那什麼是URL、URI、URN?

URI Uniform Resource Identifier 統一資源識別符號,如:scheme://[username:[email protected]]HOST:port/path/to/source

URL Uniform Resource Locator 統一資源定位符,如:http://www.magedu.com/downloads/nginx-1.5.tar.gz

URN Uniform Resource Name 統一資源名稱

URL和URN都屬於URI,為了方便就把URL和URI暫時都通指一個東西。

請求的協議有哪些種?有以下幾種:

http/0.9: stateless

http/1.0: MIME, keep-alive (保持連線), 快取

http/1.1: 更多的請求方法,更精細的快取控制,持久連線(persistent connection) 比較常用

下面是Chrome發起的http請求報文頭部資訊:

03181252_cIE1.png

Accept 就是告訴伺服器端,接受那些MIME型別

Accept-Encoding 這個看起來是接受那些壓縮方式的檔案

Accept-Lanague 告訴伺服器能夠傳送哪些語言

Connection 告訴伺服器支援keep-alive特性,TCP連線在傳送後將仍然保持開啟狀態,於是,瀏覽器可以繼續通過相同的TCP連線傳送請求。保持連線節省了為每個請求建立新連線所需的時間,還節約了網路頻寬。

Cookie 每次請求時都會攜帶上Cookie以方便伺服器端識別是否是同一個客戶端

Host 用來標識請求伺服器上的那個虛擬主機,比如Nginx裡面可以定義很多個虛擬主機,那這裡就是用來標識要訪問那個虛擬主機。

User-Agent 使用者代理,一般情況是瀏覽器,也有其他型別,如:wget curl 搜尋引擎的蜘蛛等

條件請求頭部:If-Modified-Since是瀏覽器向伺服器端詢問某個資原始檔如果自從什麼時間修改過,那麼重新發給我,這樣就保證伺服器端資原始檔更新時,瀏覽器再次去請求,而不是使用快取中的檔案。

安全請求頭部:Authorization: 客戶端提供給伺服器的認證資訊;

什麼是MIME?

MIME(Multipurpose Internet Mail Extesions 多用途網際網路郵件擴充套件)是一個網際網路標準,它擴充套件了電子郵件標準,使其能夠支援非ASCII字元、二進位制格式附件等多種格式的郵件訊息,這個標準被定義在RFC 2045、RFC 2046、RFC 2047、RFC 2048、RFC 2049等RFC中。 由RFC 822轉變而來的RFC 2822,規定電子郵件標準並不允許在郵件訊息中使用7位ASCII字符集以外的字元。正因如此,一些非英語字元訊息和二進位制檔案,影象,聲音等非文字訊息都不能在電子郵件中傳輸。

MIME規定了用於表示各種各樣的資料型別的符號化方法。此外,在全球資訊網中使用的HTTP協議中也使用了MIME的框架,標準被擴充套件為網際網路媒體型別。

MIME 遵循以下格式:major/minor 主型別/次型別 例如:

image/jpg

image/gif

text/html

video/quicktime

appliation/x-httpd-php



轉自:https://www.jianshu.com/p/558455228c43