1. 程式人生 > >使用者在瀏覽器輸入URL回車之後,瀏覽器都做了什麼

使用者在瀏覽器輸入URL回車之後,瀏覽器都做了什麼

在直接列出執行的步驟之前先來普及幾個知識,相信瞭解完這些知識之後會對前後端的互動有更深入的理解。

1、TCP連線

TCP:Transmission Control Protocol, 傳輸控制協議,是一種面向連線的、可靠的、基於位元組流的傳輸層通訊協議。
說的這麼專業,有啥用呢?
先來舉個栗子吧
還記得小時候我們做的紙杯電話麼?兩個紙杯用一條繩子連到一起,兩個各拿一個紙杯把線拉直,一個對著紙杯講,一個用耳朵對著紙杯聽。

這其實就是一種最簡單的連線通訊,兩人通過一根線連線起來,聲音從這邊的紙杯發出通過線傳輸到另一個紙杯接收,擴充套件到現在家家戶戶都有的固定電話也是如此,它的通訊也是建立在雙方可接受並且信任的基礎上進行,如:

  1. A拿起電話,撥通0775-6532122,開始呼叫B
  2. B聽到電話聲響起,拿起電話,此時A收到B已經拿起電話的聲音
  3. 雙方開始講話

回到我們的tcp協議,其實它和上面所說的電話協議差不多,只不過電話的協議是服務於電話通訊,而tcp是服務於網路通訊的一種協議,類似的,通訊雙方建立一次tcp連線,也需要經過三個步驟(握手)。

  1. 客戶端傳送syn包(syn=j)到伺服器,並進入SYN_SEND狀態,等待伺服器確認。
  2. 伺服器收到syn包,必須確認客戶的SYN(ack=j+1),同時自己也傳送一個SYN包(syn=k),即SYN+ACK包,此時伺服器進入SYN_RECV狀態。
  3. 客戶端收到伺服器的SYN+ACK包,向伺服器傳送確認包ACK(ack=k+1),此包傳送完畢,客戶端和伺服器進入ESTABLISHED狀態,完成三次握手。

上面的字母意思如下:

SYN:synchronous   建立聯機
ACK:acknowledgement  確認
SYN_SENT:請求連線  
SYN_RECV:服務端被動開啟後,接收到了客戶端的SYN並且傳送了ACK時的狀態。再進一步接收到客戶端的ACK就進入ESTABLISHED狀態。

值得注意的是:tcp在握手過程中並不攜帶資料,(就像你打電話給酒店訂房時,在確認對方是酒店客服人員之前,你也不會馬上把身份證號碼報給他吧?),而是在三次握手完成之後,才會進行資料傳送

至於它的應用場景,其實是根據它本身的特點而定的,比如對網路通訊質量有要求,需要保證資料準確性時,就需要用到TCP協議了,如HTTP、ftp等檔案傳輸協議、或一些郵件傳輸協議(SMTP、pop等)

2、UDP連線

UDP :User Datagram Protocol 使用者資料報協議
相比於TCP的面向連線需要反覆確認的繁瑣步驟,UDP是一中性格特立獨行並且主觀性超強的非面向連線的協議,使用udp協議經常通訊並不需要建立連線,它只是負責把資料儘可能快的傳送出去,簡單粗暴,並且不可靠,而在接收端,UDP把每個訊息斷放入佇列中,接收端程式從佇列中讀取資料。

有人會說,UDP協議這麼不可靠,為啥還會造出來呢?

話說回來,天底下沒有無用之人,只有你不懂用的人而已,雖然UDP不可靠,但是它的傳輸速度快,效率高,在一些對資料準確性要求不高的場景,UDP就變得很有用了,比如qq語音、qq視訊。

3、巢狀字Socket

為什麼要說巢狀字?
那是因為就像前面說的,TCP或UDP都是一種協議,也就是計算機網路通訊中在傳輸層的一種協議,簡單地說,就是一種約定,就像合作雙方的合同一樣,然後合同是死的,只有履行合同才是實質性的行動,因此無論是TCP還是UDP要產生作用,都需要有實際的行為去執行才能體現協議的作用,
那麼,有什麼辦法讓這些協議作用呢?
這就要說到socket了。

socket:也叫巢狀字 ,是一組實現TCP/UDP通訊的介面API,也就是說無論TCP還是UDP,通過對scoket的程式設計,都可以實現TCP/UCP通訊,作為一個通訊鏈的控制代碼,它包含網路通訊必備的5種資訊:

  1. 連線使用的協議
  2. 本地主機的IP地址
  3. 本地程序的協議埠
  4. 遠地主機的IP地址
  5. 遠地程序的協議埠

可見,socket包含了通訊本方和對方的ip和埠以及連線使用的協議(TCP/UDP)。通訊雙方中的一方(暫稱:客戶端)通過scoket(巢狀字)對另一方(暫稱:服務端)發起連線請求,服務端在網路上監聽請求,當收到客戶端發來的請求之後,根據socket裡攜帶的資訊,定位到客戶端,就相應請求,把socket描述發給客戶端,雙方確認之後連線就建立了。
因此套接字之間的連線過程有三個步驟:

  1. 伺服器監聽:伺服器實時監控網路狀態等待客戶端發來的連線請求
  2. 客戶端請求:客戶端根據遠端主機伺服器的IP地址和協議埠向其發起連線請求
  3. 連線確認:服務端收到套接字的連線請求之後,就響應請求,把服務端套接字描述發給客戶端,客戶端收到後一旦確認,則雙方建立連線,進行資料互動。

通常情況下socket連線就是TCP連線,因此socket連線一旦建立,通訊雙方開始互發資料進行通訊,直到其中一方或雙方斷開連線為止。

socket在即時通訊(qq等各種聊天軟體)等應用上應用廣泛。

4、HTTP協議

HTTP協議:Hypertext Transfer Protocol 也叫超文字傳送協議 ,它是一種基於TCP/IP協議棧、在表示層和應用層上的協議(TCP在傳輸層的協議),通俗一點說就是:

  • TCP/IP是位於傳輸層上的一種協議,用於在網路中傳輸資料;
  • HTTP協議是應用層協議,基於TCP協議,用於包裝資料,程式使用它進行通訊,可以簡單高效的處理通訊中資料的傳輸和識別處理

而在現在應用非常廣泛的HTTP連線則是建立在HTTP協議上的、處於應用層中的一種具體應用。
上面說到socket連線一旦建立就保持連線狀態,而HTTP連線則不一樣,它基於tcp協議的短連線,也就是客戶端發起請求,伺服器響應請求之後,連線就會自動斷開,不會一直保持。

5、URL

前面講了tcp、udp、http…等等都是為了講一個具體問題而做的知識點鋪墊,那就是:我們開發的web應用中請求的發起和響應,是一個怎樣的底層原理。
我們都知道,web應用絕大部分都是通過HTTP來進行請求的,而URL則是HTTP用來做連線建立和傳輸資料的一種具體實現,因此在此要簡單講一下URL。

URL:Uniform Resource Locator 統一資源定位符。說白了就是網路上用來標識具體資源的一個地址,包含了使用者查詢該資源的資訊,HTTP使用它來傳輸資料和建立連線
一個URL有以下組成部分:

  1. 協議
  2. 伺服器地址(域名或IP+埠)
  3. 路徑
  4. 檔名

比如:https://www.baidu.com/index.html
其中

  • https://是一種協議 當然,HTTP也是 ftp也是…
  • www.baidu.com是伺服器地址,當然你知道百度的IP也可以,例如我用ping命令得到百度的ip14.215.177.39,那麼我可以用http://14.215.177.39開啟百度
  • index.html包含了路徑和檔名,當然通常index.html是可以省略的,所以你開啟百度時,並沒有看到這個。

6、DNS

DNS:Domain Name Server,域名伺服器。
是進行域名(domain name)和與之相對應的IP地址 (IP address)轉換的伺服器。DNS中儲存了一張域名(domain name)和與之相對應的IP地址 (IP address)的表,以解析訊息的域名。
在平時我們進行開發時,後端提供的介面地址通常是有IP地址加上埠號(8080什麼鬼的)組成的,但是當我們把網站釋出出去時,通常都需要把IP改成用域名。
為什麼呢?
你想想哦,比如谷歌的地址是89.12.21.221:9090,百度的地址是132.21.33.221:8766。。。
這麼一看你根本沒有慾望是記住這些亂七八糟的數字吧?
但是域名就不一樣了,比如谷歌的google.com,百度的baidu.com 是不是一遍就記住了呢?
所以為了處理這個問題,就需要用域名去對映IP地址,達到易記易用的目的。

因此,當用戶在瀏覽器輸入https://www.baidu.com回車時,它經歷了以下步驟:

  1. 瀏覽器根據地址去本身快取中查詢dns解析記錄,如果有,則直接返回IP地址,否則瀏覽器會查詢作業系統中(hosts檔案)是否有該域名的dns解析記錄,如果有則返回。
  2. 如果瀏覽器快取和作業系統hosts中均無該域名的dns解析記錄,或者已經過期,此時就會向域名伺服器發起請求來解析這個域名。
  3. 請求會先到LDNS(本地域名伺服器),讓它來嘗試解析這個域名,如果LDNS也解析不了,則直接到根域名解析器請求解析
  4. 根域名伺服器給LDNS返回一個所查詢餘的主域名伺服器(gTLDServer)地址。
  5. 此時LDNS再向上一步返回的gTLD伺服器發起解析請求。
  6. gTLD伺服器接收到解析請求後查詢並返回此域名對應的Name Server域名伺服器的地址,這個Name Server通常就是你註冊的域名伺服器(比如阿里dns、騰訊dns等)
  7. Name Server域名伺服器會查詢儲存的域名和IP的對映關係表,正常情況下都根據域名得到目標IP記錄,連同一個TTL值返回給DNS Server域名伺服器
  8. 返回該域名對應的IP和TTL值,Local DNS Server會快取這個域名和IP的對應關係,快取的時間有TTL值控制。
  9. 把解析的結果返回給使用者,使用者根據TTL值快取在本地系統快取中,域名解析過程結束。

7、HTTP請求發起和響應

在一個web程式開發中,一般都有前端和後端之分,前端負責向後端請求資料和展示頁面,後端負責接收請求和做出響應發回給前端,他們之間的協作的橋樑是什麼呢?
是API
API是什麼?不就是一個URL嗎?
URL又是啥呢?上面說到就是HTTP連線的一種具體的載體
因此,
無論對於前端或者是後端,理解HTTP,無論是對自身對程式設計的理解,還是和同事協作,都是好處大大的,
下面,根據上面各個知識點的理解,我們來整理一下並解決一下上面提到的第一個問題:
從使用者輸入URL,到瀏覽器呈現給使用者頁面,經過了什麼過程

  1. 使用者輸入URL,瀏覽器獲取到URL
  2. 瀏覽器(應用層)進行DNS解析(如果輸入的是IP地址,此步驟省略)
  3. 根據解析出的IP地址+埠,瀏覽器(應用層)發起HTTP請求,請求中攜帶(請求頭header(也可細分為請求行和請求頭)、請求體body);header包含:(1)請求的方法(get、post、put..)(2)協議(http、https、ftp、sftp…)(3)目標url(具體的請求路徑已經檔名)(4)一些必要資訊(快取、cookie之類)body包含:請求的內容
  4. 請求到達傳輸層,tcp協議為傳輸報文提供可靠的位元組流傳輸服務,它通過三次握手等手段來保證傳輸過程中的安全可靠。通過對大塊資料的分割成一個個報文段的方式提供給大量資料的便攜傳輸。
  5. 到網路層, 網路層通過ARP定址得到接收方的Mac地址,IP協議把在傳輸層被分割成一個個資料包傳送接收方。
  6. 資料到達資料鏈路層,請求階段完成
  7. 接收方在資料鏈路層收到資料包之後,層層傳遞到應用層,接收方應用程式就獲得到請求報文。
  8. 接收方收到傳送方的HTTP請求之後,進行請求檔案資源(如HTML頁面)的尋找並響應報文
  9. 傳送方收到響應報文後,如果報文中的狀態碼錶示請求成功,則接受返回的資源(如HTML檔案),進行頁面渲染。

 

文章轉自:https://mp.weixin.qq.com/s/G8cx8G-VhUtC6XA1PIysCg,感謝作者