Nginx伺服器出現502錯誤的原因和解決辦法總結

阿新 • • 發佈：2018-11-07

一些執行在Nginx上的網站有時候會出現“502 Bad Gateway”錯誤，有些時候甚至頻繁的出現。有些站長是在剛剛轉移到Nginx之後就出現了這個問題，所以經常會懷疑這是不是Nginx的問題，但事實上這是個誤區。

以下是從張宴和Ayou的部落格蒐集整理的一些Nginx 502錯誤的排查方法，供大家參考：

Nginx 502錯誤的原因比較多，是因為在代理模式下後端伺服器出現問題引起的。這些錯誤一般都不是nginx本身的問題，一定要從後端找原因！但nginx把這些出錯都攬在自己身上了，著實讓nginx的推廣者備受置疑，畢竟從字眼上理解，bad gateway？不就是bad nginx嗎？讓不瞭解的人看到，會直接把責任推在nginx身上，希望nginx下一個版本會把出錯提示寫稍微友好一些，至少不會是現在簡單的一句502 Bad Gateway，另外還不忘附上自己的大名。

Nginx 502的觸發條件

502錯誤最通常的出現情況就是後端主機當機。在upstream配置裡有這麼一項配置：proxy_next_upstream，這個配置指定了nginx在從一個後端主機取資料遇到何種錯誤時會轉到下一個後端主機，裡頭寫上的就是會出現502的所有情況拉，預設是error timeout。error就是當機、斷線之類的，timeout就是讀取堵塞超時，比較容易理解。我一般是全寫上的：

proxy_next_upstream error timeout invalid_header http_500 http_503;

不過現在可能我要去掉http_500這一項了，http_500指定後端返回500錯誤時會轉一個主機，後端的jsp出錯的話，本來會列印一堆stacktrace的錯誤資訊，現在被502取代了。

503錯誤就可以保留，因為後端通常是apache resin，如果apache宕機就是error，但resin宕機，僅僅是503，所以還是有必要保留的。

解決辦法

遇到502問題，可以優先考慮按照以下兩個步驟去解決。

1、檢視當前的PHP FastCGI程序數是否夠用

netstat -anpo | grep "php-cgi"| wc -l

如果實際使用的“FastCGI程序數”接近預設的“FastCGI程序數”，那麼，說明“FastCGI程序數”不夠用，需要增大。

2、部分PHP程式的執行時間超過了Nginx的等待時間

可以適當增加nginx.conf配置檔案中FastCGI的timeout時間，例如：

......

http

{

......

fastcgi_connect_timeout 300;

fastcgi_send_timeout 300;

fastcgi_read_timeout 300;

......

}

......

php.ini中memory_limit設低了會出錯，修改了php.ini的memory_limit為64M，重啟nginx，發現好了，原來是PHP的記憶體不足了。

如果這樣修改了還解決不了問題，可以參考下面這些方案：

3、max-children和max-requests

一臺伺服器上執行著nginx php(fpm) xcache，訪問量日均 300W pv左右

最近經常會出現這樣的情況： php頁面開啟很慢，cpu使用率突然降至很低，系統負載突然升至很高，檢視網絡卡的流量，也會發現突然降到了很低。這種情況只持續數秒鐘就恢復了

檢查php-fpm的日誌檔案發現了一些線索：

Sep3008:32:23.289973[NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200

Sep3008:32:23.290212[NOTICE] fpm_sockets_init_main(), line 371:using inherited socket fd=10,“127.0.0.1:9000″

Sep3008:32:23.290342[NOTICE] fpm_event_init_main(), line 109: libevent:using epoll

Sep3008:32:23.296426[NOTICE] fpm_init(), line 47: fpm is running, pid 30587

http://www.server110.com/nginx/201312/4409.html

在這幾句的前面，是1000多行的關閉children和開啟children的日誌

原來，php-fpm有一個引數 max_requests，該引數指明瞭，每個children最多處理多少個請求後便會被關閉，預設的設定是500。因為php是把請求輪詢給每個children，在大流量下，每個childre到達max_requests所用的時間都差不多，這樣就造成所有的children基本上在同一時間被關閉。

在這期間，nginx無法將php檔案轉交給php-fpm處理，所以cpu會降至很低(不用處理php，更不用執行sql)，而負載會升至很高(關閉和開啟children、nginx等待php-fpm)，網絡卡流量也降至很低(nginx無法生成資料傳輸給客戶端)

解決問題很簡單，增加children的數量，並且將 max_requests 設定未 0 或者一個比較大的值：

開啟 /usr/local/php/etc/php-fpm.conf

調大以下兩個引數(根據伺服器實際情況，過大也不行）

5120

600

然後重啟php-fpm。

4、增加緩衝區容量大小

將nginx的error log開啟，發現“pstream sent too big header while reading response header from upstream”這樣的錯誤提示。查閱了一下資料，大意是nginx緩衝區有一個bug造成的,我們網站的頁面消耗佔用緩衝區可能過大。參考老外寫的修改辦法增加了緩衝區容量大小設定，502問題徹底解決。後來系統管理員又對引數做了調整隻保留了2個設定引數：client head buffer，fastcgi buffer size。

5、request_terminate_timeout

如果主要是在一些post或者資料庫操作的時候出現502這種情況，而不是在靜態頁面操作中常見，那麼可以檢視一下php-fpm.conf設定中的一項：request_terminate_timeout

這個值是max_execution_time，就是fast-cgi的執行指令碼時間。

0s為關閉，就是無限執行下去。（當時裝的時候沒仔細看就改了一個數字）

發現，問題解決了，執行很長時間也不會出錯了。

優化fastcgi中，還可以改改這個值5s 看看效果。

php-cgi程序數不夠用、php執行時間長、或者是php-cgi程序死掉，都會出現502錯誤

轉載地址:http://www.usa-idc.com/news/idc/2017121202.shtml

Nginx伺服器出現502錯誤的原因和解決辦法總結

Nginx伺服器出現502錯誤的原因和解決辦法總結

Android JNI錯誤--原因和解決辦法

服務器出現 HTTP 400、404、500、502 錯誤原因及解決方法

PHP網站從Apache轉移到Nginx後產生404錯誤的原因和解決辦法

PHP網站從Apache轉移到Nginx後只能訪問主頁跳轉產生404錯誤的原因和解決辦法

釋出asp net core 2.0 到騰訊雲伺服器出現502錯誤的解決辦法

伺服器出現400,505,403錯誤原因及解決辦法

error while loading shared libraries: xxx.so.x"錯誤的原因和解決辦法

/var/spool/postfix/maildrop 出現大量文件原因和解決辦法

執行緒安全問題出現的根本原因和解決方案

線程安全問題出現的根本原因和解決方案

python:module 'pickle' has no attribute 'load'錯誤原因和解決方案

error while loading shared libraries: xxx.so.x" 錯誤的原因和解決辦法

error while loading shared libraries: xxx.so"錯誤的原因和解決辦法

伺服器出現502錯誤可能程序過多導致

呼叫Dubbo服務報以下錯誤（com.alibaba.dubbo.remoting.RemotingException），問題原因和解決辦法

java.sql.SQLException: Access denied for user ''@'localhost' (using password: NO) 出現原因和解決辦法

java.util.ConcurrentModificationException 出現的原因和解決辦法

detached entity passed to persist 錯誤的引起的原因和解決辦法

錯誤"error while loading shared libraries: xxx.so.x" 的原因和解決辦法

Nginx伺服器出現502錯誤的原因和解決辦法總結

相關推薦