1. 程式人生 > >http協議是用於從全球資訊網伺服器傳輸超文字到本地瀏覽器的傳送協議。所有www都遵從這個協議。http是一個基於TCP/IP的通訊協議來傳遞html 檔案 查詢結果 圖片檔案等

http協議是用於從全球資訊網伺服器傳輸超文字到本地瀏覽器的傳送協議。所有www都遵從這個協議。http是一個基於TCP/IP的通訊協議來傳遞html 檔案 查詢結果 圖片檔案等

HTTP 工作原理
HTTP協議工作於客戶端-服務端架構上。瀏覽器作為HTTP客戶端通過URL向HTTP服務端即WEB伺服器傳送所有請求。
Web伺服器有:Apache伺服器,IIS伺服器(Internet Information Services)等。
Web伺服器根據接收到的請求後,向客戶端傳送響應資訊。
HTTP預設埠號為80,但是你也可以改為8080或者其他埠。
1.HTTP三點注意事項:
HTTP是無連線:無連線的含義是限制每次連線只處理一個請求。伺服器處理完客戶的請求,並收到客戶的應答後,即斷開連線。採用這種方式可以節省傳輸時間。
HTTP是媒體獨立的:這意味著,只要客戶端和伺服器知道如何處理的資料內容,任何型別的資料都可以通過HTTP傳送。客戶端以及伺服器指定使用適合的MIME-type內容型別。
HTTP是無狀態:HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力。缺少狀態意味著如果後續處理需要前面的資訊,則它必須重傳,這樣可能導致每次連線傳送的資料量增大。另一方面,在伺服器不需要先前資訊時它的應答就較快。
2.HTTP 訊息結構
HTTP是基於客戶端/服務端(C/S)的架構模型,通過一個可靠的連結來交換資訊,是一個無狀態的請求/響應協議。
一個HTTP”客戶端”是一個應用程式(Web瀏覽器或其他任何客戶端),通過連線到伺服器達到向伺服器傳送一個或多個HTTP的請求的目的。
一個HTTP”伺服器”同樣也是一個應用程式(通常是一個Web服務,如Apache Web伺服器或IIS伺服器等),通過接收客戶端的請求並向客戶端傳送HTTP響應資料。
HTTP使用統一資源識別符號(Uniform Resource Identifiers, URI)來傳輸資料和建立連線。
一旦建立連線後,資料訊息就通過類似Internet郵件所使用的格式[RFC5322]和多用途Internet郵件擴充套件(MIME)[RFC2045]來傳送。
客戶端傳送一個HTTP請求到伺服器的請求訊息包括以下格式:
請求行(request line)
請求頭部(header)
空行
請求資料
HTTP響應也由四個部分組成
狀態行
訊息報頭
空行
響應正文
下面是一個完整的客戶端請求服務端事例
客戶端請求:
GET /hello.txt HTTP/1.1 //請求行
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3 //請求頭資訊
Host: www.example.com
Accept-Language: en, mi
服務端響應:
HTTP/1.1 200 OK //狀態行
//訊息報頭
Date: Mon, 27 Jul 2009 12:28:53 GMT
Server: Apache
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
ETag: “34aa387-d-1568eb00”
Accept-Ranges: bytes
Content-Length: 51
Vary: Accept-Encoding
//內容響應正文
Content-Type: text/plain
輸出結果:

Hello World! My payload includes a trailing CRLF.

3.HTTP請求方法
HTTP1.0定義了三種請求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五種請求方法:
OPTIONS:允許客戶端檢視伺服器的效能。,
PUT:從客戶端向伺服器傳送的資料取代指定的文件的內容。,
DELETE:請求伺服器刪除指定的頁面,
TRACE:回顯伺服器收到的請求,主要用於測試或診斷。 ,
CONNECT:HTTP/1.1協議中預留給能夠將連線改為管道方式的代理伺服器。
4.HTTP 響應頭資訊
HTTP請求頭提供了關於請求,響應或者其他的傳送實體的資訊。
1.Allow:伺服器支援哪些請求方法(GET、POST等)
2.Content-Encoding:文件的編碼方法。只有在解碼之後才可以得到Content-Type頭指定的內容型別。利用gzip壓縮文件能夠顯著地減少HTML文件的下載時間。Java的GZIPOutputStream可以很方便地進行gzip壓縮,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支援它。因此,Servlet應該通過檢視Accept-Encoding頭(即request.getHeader(“Accept-Encoding”))檢查瀏覽器是否支援gzip,為支援gzip的瀏覽器返回經gzip壓縮的HTML頁面,為其他瀏覽器返回普通頁面。
3.Content-Length
表示內容長度。只有當瀏覽器使用持久HTTP連線時才需要這個資料。如果你想要利用持久連線的優勢,可以把輸出文件寫入 ByteArrayOutputStream,完成後檢視其大小,然後把該值放入Content-Length頭,最後通過byteArrayStream.writeTo(response.getOutputStream()傳送內容。
4.Server
伺服器名字。Servlet一般不設定這個值,而是由Web伺服器自己設定。
5.Set-Cookie
設定和頁面關聯的Cookie。Servlet不應使用response.setHeader(“Set-Cookie”, …),而是應使用HttpServletResponse提供的專用方法addCookie。參見下文有關Cookie設定的討論。
6.Date
當前的GMT時間。你可以用setDateHeader來設定這個頭以避免轉換時間格式的麻煩。
7.Expires
應該在什麼時候認為文件已經過期,從而不再快取它?
Last-Modified
文件的最後改動時間。客戶可以通過If-Modified-Since請求頭提供一個日期,該請求將被視為一個條件GET,只有改動時間遲於指定時間的文件才會返回,否則返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設定。
9.Location
表示客戶應當到哪裡去提取文件。Location通常不是直接設定的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設定狀態程式碼為302
10.Refresh
表示瀏覽器應該在多少時間之後重新整理文件,以秒計。除了重新整理當前文件之外,你還可以通過setHeader(“Refresh”, “5; URL=

http://host/path“)讓瀏覽器讀取指定的頁面。
注意這種功能通常是通過設定HTML頁面HEAD區的<META HTTP-EQUIV=”Refresh” CONTENT=”5;URL=http://host/path“>實現,這是因為,自動重新整理或重定向對於那些不能使用CGI或Servlet的HTML編寫者十分重要。但是,對於Servlet來說,直接設定Refresh頭更加方便。

注意Refresh的意義是”N秒之後重新整理本頁面或訪問指定頁面”,而不是”每隔N秒重新整理本頁面或訪問指定頁面”。因此,連續重新整理要求每次都發送一個Refresh頭,而傳送204狀態程式碼則可以阻止瀏覽器繼續重新整理,不管是使用Refresh頭還是<META HTTP-EQUIV=”Refresh” …>。

注意Refresh頭不屬於HTTP 1.1正式規範的一部分,而是一個擴充套件,但Netscape和IE都支援它。
11.Server
伺服器名字。Servlet一般不設定這個值,而是由Web伺服器自己設定。
5.HTTP狀態碼
當瀏覽者訪問一個網頁時,瀏覽者的瀏覽器會向網頁所在伺服器發出請求。當瀏覽器接收並顯示網頁前,此網頁所在的伺服器會返回一個包含HTTP狀態碼的資訊頭(server header)用以響應瀏覽器的請求。
200 - 請求成功
301 - 資源(網頁等)被永久轉移到其它URL
404 - 請求的資源(網頁等)不存在
500 - 內部伺服器錯誤