1. 程式人生 > >在瀏覽器輸入一個網址,按回車之後發生了什麼

在瀏覽器輸入一個網址,按回車之後發生了什麼

當你在瀏覽器輸入一個網址,如http://www.taobao.com,按回車之後發生了什麼?請從技術的角度描述,如瀏覽器、網路(UDP、TCP、HTTP等),以及伺服器等各種參與物件上由此引發的一系列活動,請儘可能的涉及到所有的關鍵技術點。

解析:首先你輸入了一個網址並按下了回車,這個時候瀏覽器會根據這個URL去查詢其對應的IP,具體過程如下:

首先是查詢瀏覽器快取,瀏覽器會儲存一段時間你之前訪問過的一些網址的DNS資訊,不同瀏覽器儲存的時常不等。

如果沒有找到對應的記錄,這個時候瀏覽器會嘗試呼叫系統快取來繼續查詢這個網址的對應DNS資訊。

如果還是沒找到對應的IP,那麼接著會發送一個請求到路由器上,然後路由器在自己的路由器快取上查詢記錄,路由器一般也存有DNS資訊。

如果還是沒有,這個請求就會被髮送到ISP(注:Internet Service Provider,網際網路服務提供商,就是那些拉網線到你家裡的運營商,中國電信中國移動什麼的),ISP也會有相應的ISP DNS伺服器,一聽中國電信就知道這個DNS伺服器的規模肯定不會小,所以基本上都能在這裡找得到。題外話:會跑到這裡進行查詢是因為你沒有改動過"網路中心"的"ipv4"的DNS地址,萬惡的電信聯通可以改動了這個DNS伺服器,換句話說他們可以讓你的瀏覽器跳轉到他們設定的頁面上,這也就是人盡皆知的DNS和HTTP劫持,ISP們還美名曰“免費推送服務”。強烈鄙視這種霸王行為。我們也可以自行修改DNS伺服器來防止DNS被ISP汙染。

如果還是沒有的話, 你的ISP的DNS伺服器會將請求發向根域名伺服器進行搜尋。根域名伺服器就是面向全球的頂級DNS伺服器,共有13臺邏輯上的伺服器,從A到M命名,真正的實體伺服器則有幾百臺,分佈於全球各大洲。所以這些伺服器有真正完整的DNS資料庫。如果到了這裡還是找不到域名的對應資訊,那隻能說明一個問題:這個域名本來就不存在,它沒有在網上正式註冊過。或者賣域名的把它回收掉了(通常是因為欠費)。 這也就是為什麼開啟一個新頁面會有點慢,因為本地沒什麼快取,要這樣遞迴地查詢下去。

多說一句,例如"mp3.baidu.com",域名先是解析出這是個.com的域名,然後跑到管理.com域名的伺服器上進行進一步查詢,然後是.baidu,最後是mp3, 所以域名結構為:三級域名.二級域名.一級域名。

瀏覽器終於得到了IP以後,瀏覽器接著給這個IP的伺服器傳送了一個http請求,方式為get,例如訪問nbut.cn

這個get請求包含了主機(host)、使用者代理(User-Agent),使用者代理就是自己的瀏覽器,它是你的"代理人",Connection(連線屬性)中的keep-alive表示瀏覽器告訴對方伺服器在傳輸完現在請求的內容後不要斷開連線,不斷開的話下次繼續連線速度就很快了。其他的顧名思義就行了。還有一個重點是Cookies,Cookies儲存了使用者的登陸資訊,在每次向伺服器傳送請求的時候會重複傳送給伺服器。Corome上的F12與Firefox上的firebug(快捷鍵shift+F5)均可檢視這些資訊。

傳送完請求接下來就是等待迴應了,如下圖:

當然了,伺服器收到瀏覽器的請求以後(其實是WEB伺服器接收到了這個請求,WEB伺服器有iis、apache等),它會解析這個請求(讀請求頭),然後生成一個響應頭和具體響應內容。接著伺服器會傳回來一個響應頭和一個響應,響應頭告訴了瀏覽器一些必要的資訊,例如重要的Status Code,2開頭如200表示一切正常,3開頭表示重定向,4開頭,如404,呵呵。響應就是具體的頁面編碼,就是那個......,瀏覽器先讀了關於這個響應的說明書(響應頭),然後開始解析這個響應並在頁面上顯示出來。在下一次CF的時候(不是穿越火線,是http://codeforces.com/),由於經常難以承受幾千人的同時訪問,所以CF頁面經常會出現崩潰頁面,到時候可以點開火狐的firebug或是Chrome的F12看看狀態,不過這時候一般都急著看題和提交程式碼,似乎根本就沒心情理會這個狀態吧-.-。

如果是個靜態頁面,那麼基本上到這一步就沒了,但是如今的網站幾乎沒有靜態的了吧,基本全是動態的。所以這時候事情還沒完,根據我們的經驗,瀏覽器開啟一個網址的時候會慢慢載入這個頁面,一部分一部分的顯示,直到完全顯示,最後標籤欄上的圈圈就不轉了。

這是因為,主頁(index)頁面框架傳送過來以後,瀏覽器還要繼續向伺服器傳送請求,請求的內容是主頁裡面包含的一些資源,如圖片,視訊,css樣式等等。這些"非靜態"的東西要一點點地請求過來,所以標籤欄轉啊轉,內容刷啊刷,最後全部請求並載入好了就終於好了。

需要說明的是,對於靜態的頁面內容,瀏覽器通常會進行快取,而對於動態的內容,瀏覽器通常不會進行快取。快取的內容通常也不會儲存很久,因為難保網站不會被改動。