1. 程式人生 > >Http和Https的簡單理解

Http和Https的簡單理解

原文的很多資訊出自

http://www.cnblogs.com/wqhwe/p/5407468.html

加了點自己的理解,謝樓主分享

超文字傳輸協議HTTP協議被用於在web瀏覽器和網站伺服器之間傳遞資訊,HTTP協議以明文方式傳送內容,不提供任何方式的資料加密,如果攻擊者截取了web瀏覽器和網站伺服器之間的傳輸報文,就可以直接讀懂其中的資訊,因此,HTTP協議不適合傳輸一些敏感資訊,比如:信用卡號,密碼等支付資訊.

為了解決HTTP協議的這一缺陷,需要使用另一種協議:安全套接字層超文字傳輸協議HTTPS,為了資料傳輸的安全,HTTPS在HTTP的基礎上加入了SSL協議,SSL依靠證書來驗證伺服器的身份,併為瀏覽器和伺服器之間的通訊加密.

一:HTTPHTTPS的基本概念

HTTP:是網際網路上應用最為廣泛的一種網路協議,是一個客戶端和伺服器端請求和應答的標準(TCP),用於從www伺服器傳輸超文字到本地瀏覽器的傳輸協議,他可以使瀏覽器更加高效,使網路傳輸減少.

HTTPS:使以安全為目標的HTTP通道,簡單講是HTTP的安全版,即HTTP下加入SSL層,HTTPS的安全基礎是SSL.因此加密的詳細內容就需要SSL.

HTTPS協議的主要作用可以分為兩種:一種是建立一個資訊保安通道,來保證資料傳輸的安全;另一種就是確認網站的真實性.

HTTPHTTPS的區別:

HTTP協議傳輸的資料都是未加密的,也就是明文的,因此使用HTTP協議傳輸隱私資訊非常不安全,為了保證這些隱私資料能加密傳輸,於是網景公司設計了SSL(Secure Socket Layer)協議用於對HTTP協議傳輸的資料進行加密,從而就誕生了HTTPS.簡單來說,HTTPS協議是由SSL+HTTP協議構建的可進行加密傳輸,身份認證的網路協議,要比http協議安全

HTTPS和HTTP的區別主要如下:

1.        https協議需要到ca申請證書,一般免費證書較少,因而需要一定費用

2.        http是超文字傳輸協議,資訊是明文傳輸,http則是具有安全性的ssl加密傳輸協議

3.        http和https使用的是完全不同的連線方式,用的埠也不一樣,前者是80,後者是443.

4.        http的連線根簡單,是無狀態的;HTTPS協議是由SSL+HTTP協議構建的可進行加密傳輸.身份認證的網路協議,比http協議安全.

HTTP響應

在接收和解釋請求訊息後,伺服器返回一個HTTP響應訊息

http響應也是由三個部分組成,分別是:狀態行,訊息報頭,響應正文

1, 狀態行格式如下:

HTTP-Version status-code Reason-Phrase CRLF

其中,HTTP-Version表示伺服器HTTP協議的版本;status-code表示伺服器發回的響應狀態程式碼;Reason-Phrase表示狀態碼的文字描述.

狀態程式碼有三位數字組成,第一個數字第你故意了響應的類別,且有五種可能取值:

1xx:指示資訊 ---表示請求已接收,繼續處理

2xx:成功      ---表示請求已被成功接收,理解,接受.

3xx:重定向      ---要完成請求必須進行更進一步的操作;

4xx:客戶端錯誤---要求有語法錯誤或請求無法實現

5xx:伺服器端錯誤---伺服器未能實現合法的請求

常見狀態碼.狀態描述.說明:

200 ok                                 //客戶端請求成功

400 bad request //客戶端請求有語法錯誤,不能被伺服器所理解

401 Unauthorized //請求未經授權,這個狀態碼必須和www-authenticate報頭域一起使用

403 Forbidden  //伺服器收到請求,但是拒絕提供服務

404 Not Found  //請求資源不存在,eg:輸入了錯誤的URL

500 Internal Server Error //伺服器發生不可預期的錯誤

503 Server Unavailable  //伺服器當前不能處理客戶端的請求,一段時間後才能恢復正常

Eg:HTTP/1.1 200 ok (CRLF)

2, 請求報頭

請求報頭允許客戶端向伺服器端傳遞請求的附件資訊以及客戶端自身的資訊.

常用的請求報頭

Accept請求報頭域用於指定客戶端接收哪些型別的資訊.eg:Accept:image/gif,表明客戶端希望接收GIF影象格式的資源;Accept:text/html,表明客戶單希望接收html文字.

Accept-charset: 請求報頭域用於指定客戶端接收的字符集.eg:

Accept-charset:iso-8859-1,gb2312.如果在請求訊息中沒有設定這個域,預設是任何字符集都可以接收

Accept-Encoding 請求報頭域類似於Accept,但是他是用於指定可接收的內容編碼.eg:

Accept-Encoding:gzip,deflate.如果請求訊息中沒喲設定這個域伺服器假定客戶端對各種內容編碼都可以接收

Accept-Language 請求報頭域類似於Accept,但是他是用於指定一種自然語言.eg:

Accept-language:zh-cn.如果請求訊息中沒有設定這個報頭域,伺服器假定客戶端對各種語言都可以接收

Authorization請求報頭域主要用於證明客戶端有權檢視某個資源.當瀏覽器訪問一個頁面時,如果收到伺服器的響應程式碼為401(未授權),可以傳送一個包含Authorization請求報頭域的請求,要求伺服器對其進行驗證.

Host請求報頭域主要用於指定被請求資源的Internet主機和埠號,他通常從HTTP URL中提取出來的,傳送請求時,該報頭域是必須的,eg:我們在瀏覽器輸入:

http://www.guet.edu.cn/index.html

瀏覽器傳送的請求訊息中,就會 包含Host請求報頭域,如下:Host:www.guet.edu.cn,此處使用預設埠號80,若指定了埠號,則變成:Host:www.guet.edu.cn:指定埠號

Uset-Agent 我們上網登入論壇的時候,往往會看到一些歡迎資訊,其中列出了作業系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,伺服器應用程式就是從User-Agent這個請求報頭域中獲取到這些資訊.User-Agent請求報頭域允許客戶端將他的作業系統.瀏覽器和其他屬性告訴伺服器,不過,這個報頭域不是必須的,如果我們寫自己編寫一個瀏覽器,不適用User-Agent請求報頭域,那麼伺服器端就無法得知我們的資訊了..

響應報頭

響應報頭允許伺服器傳遞不能放在狀態行中的附加響應資訊,以及關於伺服器的資訊和對Request-URI所標識的資源進行下一步訪問的資訊

常用的響應報頭

Location 響應報頭域用於重定向接受者到一個新的位置.Location響應報頭域常用在更換域名的時候

Server響應報頭域包含了伺服器用來處理請求的軟體資訊.與User-Agent請求報頭域是相對應的.下面的Server響應報頭域的一個例子:Server:Apache-Coyote/1.1

www-Authenticate響應報頭域必須包含在401(未授權的)響應訊息中,客戶端收到401響應訊息時候,併發送Autorization報頭域請求伺服器對其進行驗證時,服務端響應報頭就包含該報頭域

eg:WWW-Authenticate:Basic ralm=”Basic AuthTest!”  //可以看出伺服器對請求資源採用的是基本驗證機制

實體報頭

請求和響應訊息都可以傳送一個實體.一個實體由實體報頭域和實體正文組成,但並不是說實體報頭域和實體正文要在一起傳送,可以只發送實體報頭域.實體報頭定義了關於實體正文(eg:有無實體正文)和請求所標識的資源的元資訊

常用的實體報頭:

Content-Encoding:實體報頭域被用作媒體型別的修飾符,他的值指示了已經被應用到實體正文的附加內容的編碼,因而要獲得Content-Type報頭域中所引用的媒體型別,必須採用相應的解碼機制.Content-Encoding這樣用於記錄文件的壓縮方法,eg:

Content-Encoding:gzip

Content-Language實體報頭域描述了資源所用的自然語言,沒有設定該域則認為實體內容將提供給所有的語言閱讀者

Eg:Content-language:da

Content-Length 實體報頭域用於指明實體正文的長度,以位元組方式儲存的十進位制數字來表示.

Content-type:實體報頭域用於指明發送給接受者的實體正文的媒體型別.eg:

Content-type:text/html;charset=ISO-8859-1

Content-type:text/html;charset=GB2312

Last-Modified:實體報頭域用於指示資源的最後修改日期和時間.

Expires實體報頭域給出響應過期的日期和時間,為了讓代理伺服器或瀏覽器在一旦時間以後更新快取中(再次訪問曾訪問過的頁面時,直接從快取中載入,縮短響應時間和降低伺服器負載)的頁面,我們可以使用Expires實體報頭域指定頁面過期的時間.eg:Expires:Thu,15 Sep 2016 16:23:12 GMT

HTTP1.1的客戶端和快取必須將其他非法的日期格式(包括0)看作已經過期.eg:為了讓瀏覽器不要快取頁面,我們也可以利用Expires實體報頭域,設定為0,jsp中程式如下:

Response.setDateHeader(“Expires”,”0”)

HTTPS的工作原理

Https能夠加密資訊,以免敏感資訊被第三方獲取,所以很多銀行網站或電子郵箱等安全級別較高的服務都會採用HTTPS協議.

客戶端在使用HTTPS方式與WEB伺服器通訊時有以下幾個步驟,如圖:


1.        客戶使用https的URL訪問web伺服器,要求與web伺服器建立SSL連線

2.        Web伺服器收到客戶端請求後,會將網站的證書資訊(證書中包含公鑰)傳送一份給客戶端

3.        客戶端的瀏覽器與web伺服器開始協商SSL連線的安全等級,也就是資訊加密的等級

4.        客戶端的瀏覽器根據雙方同意的安全等級,建立會話祕鑰,然後利用網站的公鑰將會話祕鑰加密,並傳送給網站

5.        Web伺服器利用自己的私鑰解密出會話祕鑰

6.        Web伺服器利用會話祕鑰加密與客戶端之間的通訊


HTTPS的優點

儘管HTTPS並非絕對安全,掌握根證書的機構,掌握加密演算法的組織同樣可以進行中間人形式的攻擊,但HTTPS仍是現行架構下最安全的解決方案,主要有以下幾個好處:

1.        使用HTTPS協議可認證使用者和伺服器,確保資料傳送到正確的客戶機和伺服器.

2.        HTTPS協議是由SSL+HTTP協議構建的可進行加密傳輸,身份認證的網路協議,要比http協議安全,可防止資料在傳輸過程中不被竊取.改變,確保資料的完整性.

3.        HTTPS是現行架構下最安全的解決方案,雖然不是絕對安全,但他大幅增加了中間人攻擊的成本

4.        谷歌曾在2014年8月份調整搜尋引擎演算法,並稱”比起同等HTTP網站,採用HTTPS加密的網站在搜尋結果中的排名將會更高”.

HTTPS的缺點

雖說HTTPS有很大的優勢,但其相對來說,還是存在不足之處的

1.        HTTPS協議握手階段比較費時,會使頁面的載入時間延長近50%,增加10%到20%的耗電

2.        HTTPS連線快取不如HTTP高效,會增加資料開銷和功耗,甚至已有的安全措施也會因此而受到影響

3.        SSL證書需要錢,功能越強大的證書費用越高,個人網站,小網站沒有必要一般不會用.

4.        SSL證書通常需要繫結IP,不能在同一IP上繫結多個域名,IPV4資源不可能 支撐這個消耗

5.        HTTPS協議的加密範圍也比較有限,在黑客攻擊,拒絕服務攻擊,伺服器劫持等方面幾乎起不到什麼作用.最關鍵的,SSL證書的信用鏈體系並不安全,特別是在某些國家可以控制CA根證書的情況下,中間人攻擊一樣可行.

http切換到HTTPS

如果需要將網站從http切換到https到底該如何實現呢?

這裡需要將頁面中所有的連線,例如js,css,圖片等等連結都是由http改為HTTPS.例如:http://www.baidu.com改為https://baidu.com

但是,這裡雖然將http切換為https,還是建議保留http.所以我們在切換的時候可以做http和https的相容,具體實現方式是,去掉頁面連線中的http頭部,這樣可以自動匹配http頭和https頭.例如:將http://www.baidu.com改為//www.baidu.com.然後當用戶從http的入口進入訪問頁面時,頁面就是http,如果使用者是從https的入口進入訪問頁面,頁面即使是https.