1. 程式人生 > >【轉】使用 Nginx 提升網站訪問速度【反向代理】

【轉】使用 Nginx 提升網站訪問速度【反向代理】

Nginx ("engine x") 是一個高效能的 HTTP 和 反向代理 伺服器,也是一個 IMAP/POP3/SMTP 代理伺服器。 Nginx 是由 Igor Sysoev 為俄羅斯訪問量第二的 Rambler.ru 站點開發的,它已經在該站點執行超過兩年半了。 Igor 將原始碼以類 BSD 許可證的形式釋出。儘管還是測試版,但是,Nginx 已經因為它的穩定性、豐富的功能集、示例配置檔案和低系統資源的消耗而聞名了。

根據最新一期(08 年 6 月份)的 NetCraft 調查報告顯示,已經有超過兩百萬的主機使用了 Nginx,這個數字超過了另外一個輕量級的 HTTP 伺服器 lighttpd, 排名第四,並且發展迅速。下面是這份報告的前幾名的報表:

產品 網站數
Apache 84,309,103
IIS 60,987,087
Google GFE 10,465,178
Unknown 4,903,174
nginx 2,125,160
Oversee 1,953,848
lighttpd 1,532,952

關於這期調查報告的更詳細資訊請看下面連結:

下圖是最近幾個月使用 Nginx 和 lighttpd 的網站數比較

  1. 目前官方 Nginx 並不支援 Windows,您只能在包括 Linux、UNIX、BSD 系統下安裝和使用;
  2. Nginx 本身只是一個 HTTP 和反向代理伺服器,它無法像 Apache 一樣通過安裝各種模組來支援不同的頁面指令碼,例如 PHP、CGI 等;
  3. Nginx 支援簡單的負載均衡和容錯;
  4. 支援作為基本 HTTP 伺服器的功能,例如日誌、壓縮、Byte ranges、Chunked responses、SSL、虛擬主機等等,應有盡有。

為了確保能在 Nginx 中使用正則表示式進行更靈活的配置,安裝之前需要確定系統是否安裝有 PCRE(Perl Compatible Regular Expressions)包。您可以到 ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/ 下載最新的 PCRE 原始碼包,使用下面命令下載編譯和安裝 PCRE 包:

# wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-7.7.tar.gz
# tar zxvf pcre-7.7.tar.gz
# cd pcre-7.7
# ./configure
# make
# make install
			

接下來安裝 Nginx,Nginx 一般有兩個版本,分別是穩定版和開發版,您可以根據您的目的來選擇這兩個版本的其中一個,下面是把 Nginx 安裝到 /opt/nginx 目錄下的詳細步驟:

# wget http://sysoev.ru/nginx/nginx-0.6.31.tar.gz
# tar zxvf nginx-0.6.31.tar.gz
# cd nginx-0.6.31
# ./configure --with-http_stub_status_module –prefix=/opt/nginx
# make
# make install
			

其中引數 --with-http_stub_status_module 是為了啟用 nginx 的 NginxStatus 功能,用來監控 Nginx 的當前狀態。

安裝成功後 /opt/nginx 目錄下有四個子目錄分別是:conf、html、logs、sbin 。其中 Nginx 的配置檔案存放於 conf/nginx.conf,Nginx 只有一個程式檔案位於 sbin 目錄下的 nginx 檔案。確保系統的 80 埠沒被其他程式佔用,執行 sbin/nginx 命令來啟動 Nginx,開啟瀏覽器訪問此機器的 IP,如果瀏覽器出現 Welcome to nginx! 則表示 Nginx 已經安裝並執行成功。

Nginx 安裝後只有一個程式檔案,本身並不提供各種管理程式,它是使用引數和系統訊號機制對 Nginx 程序本身進行控制的。 Nginx 的引數包括有如下幾個:

-c <path_to_config>:使用指定的配置檔案而不是 conf 目錄下的 nginx.conf 。

-t :測試配置檔案是否正確,在執行時需要重新載入配置的時候,此命令非常重要,用來檢測所修改的配置檔案是否有語法錯誤。

-v :顯示 nginx 版本號。

-V :顯示 nginx 的版本號以及編譯環境資訊以及編譯時的引數。

例如我們要測試某個配置檔案是否書寫正確,我們可以使用以下命令

sbin/nginx – t – c conf/nginx2.conf

Nginx 支援下表中的訊號:

訊號名 作用描述
TERM, INT 快速關閉程式,中止當前正在處理的請求
QUIT 處理完當前請求後,關閉程式
HUP 重新載入配置,並開啟新的工作程序,關閉就的程序,此操作不會中斷請求
USR1 重新開啟日誌檔案,用於切換日誌,例如每天生成一個新的日誌檔案
USR2 平滑升級可執行程式
WINCH 從容關閉工作程序

有兩種方式來通過這些訊號去控制 Nginx,第一是通過 logs 目錄下的 nginx.pid 檢視當前執行的 Nginx 的程序 ID,通過 kill – XXX <pid> 來控制 Nginx,其中 XXX 就是上表中列出的訊號名。如果您的系統中只有一個 Nginx 程序,那您也可以通過 killall 命令來完成,例如執行 killall – s HUP nginx 來讓 Nginx 重新載入配置。

先來看一個實際的配置檔案:

 user  nobody;# 工作程序的屬主
 worker_processes  4;# 工作程序數,一般與 CPU 核數等同

 #error_log  logs/error.log; 
 #error_log  logs/error.log  notice; 
 #error_log  logs/error.log  info; 

 #pid        logs/nginx.pid; 

 events { 
    use epoll;#Linux 下效能最好的 event 模式
    worker_connections  2048;# 每個工作程序允許最大的同時連線數
 } 

 http { 
    include       mime.types; 
    default_type  application/octet-stream; 

    #log_format  main  '$remote_addr - $remote_user [$time_local] $request ' 
    #                  '"$status" $body_bytes_sent "$http_referer" ' 
    #                  '"$http_user_agent" "$http_x_forwarded_for"'; 

    #access_log  off; 
    access_log  logs/access.log;# 日誌檔名

    sendfile        on; 
    #tcp_nopush     on; 
    tcp_nodelay     on; 

    keepalive_timeout  65; 

    include 	 gzip.conf; 
    
    # 叢集中的所有後臺伺服器的配置資訊
    upstream tomcats { 
	 server 192.168.0.11:8080 weight=10; 
	 server 192.168.0.11:8081 weight=10; 
	 server 192.168.0.12:8080 weight=10; 
	 server 192.168.0.12:8081 weight=10; 
	 server 192.168.0.13:8080 weight=10; 
	 server 192.168.0.13:8081 weight=10; 
    } 



    server { 
        listen       80;#HTTP 的埠
        server_name  localhost; 

        charset utf-8; 

        #access_log  logs/host.access.log  main; 

	 location ~ ^/NginxStatus/ { 
	    stub_status on; #Nginx 狀態監控配置
	    access_log off; 
	 } 

	 location ~ ^/(WEB-INF)/ { 
	    deny all; 
	 } 
	

	 location ~ \.(htm|html|asp|php|gif|jpg|jpeg|png|bmp|ico|rar|css|js|
	 zip|java|jar|txt|flv|swf|mid|doc|ppt|xls|pdf|txt|mp3|wma)$ { 
             root /opt/webapp; 
	    expires 24h; 
        } 

        location / { 
	    proxy_pass http://tomcats;# 反向代理
	    include proxy.conf; 
        } 

        error_page 404 /html/404.html; 

        # redirect server error pages to the static page /50x.html 
        # 
	 error_page 502 503 /html/502.html; 
        error_page 500 504 /50x.html; 
        location = /50x.html { 
            root   html; 
        } 
    } 
 } 

上面是一個實際網站的配置例項,其中灰色文字為配置說明。上述配置中,首先我們定義了一個 location ~ ^/NginxStatus/,這樣通過 http://localhost/NginxStatus/ 就可以監控到 Nginx 的執行資訊,顯示的內容如下:

Active connections: 70 
server accepts handled requests
 14553819 14553819 19239266 
Reading: 0 Writing: 3 Waiting: 67 
			

NginxStatus 顯示的內容意思如下:

  • active connections – 當前 Nginx 正處理的活動連線數。
  • server accepts handled requests -- 總共處理了 14553819 個連線 , 成功建立 14553819 次握手 ( 證明中間沒有失敗的 ), 總共處理了 19239266 個請求 ( 平均每次握手處理了 1.3 個數據請求 )。
  • reading -- nginx 讀取到客戶端的 Header 資訊數。
  • writing -- nginx 返回給客戶端的 Header 資訊數。
  • waiting -- 開啟 keep-alive 的情況下,這個值等於 active - (reading + writing),意思就是 Nginx 已經處理完正在等候下一次請求指令的駐留連線。

通過正則表示式,我們可讓 Nginx 識別出各種靜態檔案,例如 images 路徑下的所有請求可以寫為:

location ~ ^/images/ {
    root /opt/webapp/images;
}
			

而下面的配置則定義了幾種檔案型別的請求處理方式。

location ~ \.(htm|html|gif|jpg|jpeg|png|bmp|ico|css|js|txt)$ {
    root /opt/webapp;
    expires 24h;
}
			

對於例如圖片、靜態 HTML 檔案、js 指令碼檔案和 css 樣式檔案等,我們希望 Nginx 直接處理並返回給瀏覽器,這樣可以大大的加快網頁瀏覽時的速度。因此對於這類檔案我們需要通過 root 指令來指定檔案的存放路徑,同時因為這類檔案並不常修改,通過 expires 指令來控制其在瀏覽器的快取,以減少不必要的請求。 expires 指令可以控制 HTTP 應答中的“ Expires ”和“ Cache-Control ”的頭標(起到控制頁面快取的作用)。您可以使用例如以下的格式來書寫 Expires:

expires 1 January, 1970, 00:00:01 GMT;
expires 60s;
expires 30m;
expires 24h;
expires 1d;
expires max;
expires off;
			

Nginx 本身並不支援現在流行的 JSP、ASP、PHP、PERL 等動態頁面,但是它可以通過反向代理將請求傳送到後端的伺服器,例如 Tomcat、Apache、IIS 等來完成動態頁面的請求處理。前面的配置示例中,我們首先定義了由 Nginx 直接處理的一些靜態檔案請求後,其他所有的請求通過 proxy_pass 指令傳送給後端的伺服器 (在上述例子中是 Tomcat)。最簡單的 proxy_pass 用法如下:

location / {
    proxy_pass        http://localhost:8080;
    proxy_set_header  X-Real-IP  $remote_addr;
}
			

這裡我們沒有使用到叢集,而是將請求直接送到執行在 8080 埠的 Tomcat 服務上來完成類似 JSP 和 Servlet 的請求處理。

當頁面的訪問量非常大的時候,往往需要多個應用伺服器來共同承擔動態頁面的執行操作,這時我們就需要使用叢集的架構。 Nginx 通過 upstream 指令來定義一個伺服器的叢集,最前面那個完整的例子中我們定義了一個名為 tomcats 的叢集,這個叢集中包括了三臺伺服器共 6 個 Tomcat 服務。而 proxy_pass 指令的寫法變成了:

location / {
    proxy_pass        http://tomcats;
    proxy_set_header  X-Real-IP  $remote_addr;
}
			

在 Nginx 的叢集配置中,Nginx 使用最簡單的平均分配規則給叢集中的每個節點分配請求。一旦某個節點失效時,或者重新起效時,Nginx 都會非常及時的處理狀態的變化,以保證不會影響到使用者的訪問。

總結

儘管整個程式包只有五百多 K,但麻雀雖小、五臟俱全。 Nginx 官方提供的各種功能模組應有盡有,結合這些模組可以完整各種各樣的配置要求,例如:壓縮、防盜鏈、叢集、FastCGI、流媒體伺服器、 Memcached 支援、URL 重寫等等 ,更關鍵的是 Nginx 擁有 Apache 和其他 HTTP 伺服器無法比擬的高效能。您甚至可以在不改變原有網站的架構上,通過在前端引入 Nginx 來提升網站的訪問速度。

本文只是簡單介紹了 Nginx 的安裝以及常見的基本的配置和使用,更多關於 Nginx 的資訊請閱讀文章後面的參考資源。在這裡要非常感謝我的朋友——陳磊([email protected]),他一直在做 Nginx 的中文 WIKI(http://wiki.codemongers.com/NginxChs ),同時也是他介紹給我這麼好的一款軟體。

如果您的網站是執行在 Linux 下,如果您並沒有使用一些非常複雜的而且確定 Nginx 無法完成的功能,那您應該試試 Nginx 。