Java Web應用中調優執行緒池的重要性

阿新 • • 發佈：2019-02-05

來源：http://www.infoq.com/cn/articles/the-importance-of-thread-pool-in-java-web-application

不論你是否關注，Java Web應用都或多或少的使用了執行緒池來處理請求。執行緒池的實現細節可能會被忽視，但是有關於執行緒池的使用和調優遲早是需要了解的。本文主要介紹Java執行緒池的使用和如何正確的配置執行緒池。

單執行緒

我們先從基礎開始。無論使用哪種應用伺服器或者框架（如Tomcat、Jetty等），他們都有類似的基礎實現。Web服務的基礎是套接字（socket），套接字負責監聽埠，等待TCP連線，並接受TCP連線。一旦TCP連線被接受，即可從新建立的TCP連線中讀取和傳送資料。

為了能夠理解上述流程，我們不直接使用任何應用伺服器，而是從零開始構建一個簡單的Web服務。該服務是大部分應用伺服器的縮影。一個簡單的單執行緒Web服務大概是這樣的：

ServerSocket listener = new ServerSocket(8080);
try {
 while (true) {
   Socket socket = listener.accept();
   try {
     handleRequest(socket);
   } catch (IOException e) {
     e.printStackTrace();
   }
 }
} finally {
 listener.close();
}

上述程式碼建立了一個服務端套接字（ServerSocket），監聽8080埠，然後迴圈檢查這個套接字，檢視是否有新的連線。一旦有新的連線被接受，這個套接字會被傳入handleRequest方法。這個方法會將資料流解析成HTTP請求，進行響應，並寫入響應資料。在這個簡單的示例中，handleRequest方法僅僅實現資料流的讀入，返回一個簡單的響應資料。在通常實現中，該方法還會複雜的多，比如從資料庫讀取資料等。

final static String response =
   “HTTP/1.0 200 OK\r\n” +
   “Content-type: text/plain\r\n” +
   “\r\n” +
   “Hello World\r\n”;

public static void handleRequest(Socket socket) throws IOException {
 // Read the input stream, and return “200 OK”
 try {
   BufferedReader in = new BufferedReader(
     new InputStreamReader(socket.getInputStream()));
   log.info(in.readLine());

   OutputStream out = socket.getOutputStream();
   out.write(response.getBytes(StandardCharsets.UTF_8));
 } finally {
   socket.close();
 }
}

由於只有一個執行緒來處理請求，每個請求都必須等待前一個請求處理完成之後才能夠被響應。假設一個請求響應時間為100毫秒，那麼這個伺服器的每秒響應數（tps）只有10。

多執行緒

雖然handleRequest方法可能阻塞在IO上，但是CPU仍然可以處理更多的請求。但是在單執行緒情況下，這是無法做到的。因此，可以通過建立多執行緒的方式，來提升伺服器的並行處理能力。

public static class HandleRequestRunnable implements Runnable {

 final Socket socket;

 public HandleRequestRunnable(Socket socket) {
   this.socket = socket;
 }

 public void run() {
   try {
     handleRequest(socket);
   } catch (IOException e) {
     e.printStackTrace();
   }
 }
}

ServerSocket listener = new ServerSocket(8080);
try {
 while (true) {
   Socket socket = listener.accept();
   new Thread(new HandleRequestRunnable(socket)).start();
 }
} finally {
 listener.close();
}

這裡，accept()方法仍然在主執行緒中呼叫，但是一旦TCP連線建立之後，將會建立一個新的執行緒來處理新的請求，既在新的執行緒中執行前文中的handleRequest方法。

通過建立新的執行緒，主執行緒可以繼續接受新的TCP連線，且這些信求可以並行的處理。這個方式稱為“每個請求一個執行緒（thread per request）”。當然，還有其他方式來提高處理效能，例如NGINX和Node.js使用的非同步事件驅動模型，但是它們不使用執行緒池，因此不在本文的討論範圍。

在每個請求一個執行緒實現中，建立一個執行緒（和後續的銷燬）開銷是非常昂貴的，因為JVM和作業系統都需要分配資源。另外，上面的實現還有一個問題，即建立的執行緒數是不可控的，這將可能導致系統資源被迅速耗盡。

資源耗盡

每個執行緒都需要一定的棧記憶體空間。在最近的64位JVM中，預設的棧大小是1024KB。如果伺服器收到大量請求，或者handleRequest方法執行很慢，伺服器可能因為建立了大量執行緒而崩潰。例如有1000個並行的請求，創建出來的1000個執行緒需要使用1GB的JVM記憶體作為執行緒棧空間。另外，每個執行緒程式碼執行過程中建立的物件，還可能會在堆上建立物件。這樣的情況惡化下去，將會超出JVM堆記憶體，併產生大量的垃圾回收操作，最終引發記憶體溢位（OutOfMemoryErrors）。

這些執行緒不僅僅會消耗記憶體，它們還會使用其他有限的資源，例如檔案控制代碼、資料庫連線等。不可控的建立執行緒，還可能引發其他型別的錯誤和崩潰。因此，避免資源耗盡的一個重要方式，就是避免不可控的資料結構。

順便說下，由於執行緒棧大小引發的記憶體問題，可以通過-Xss開關來調整棧大小。縮小執行緒棧大小之後，可以減少每個執行緒的開銷，但是可能會引發棧溢位（StackOverflowErrors）。對於一般應用程式而言，預設的1024KB過於富裕，調小為256KB或者512KB可能更為合適。Java允許的最小值是160KB。

執行緒池

為了避免持續建立新執行緒，可以通過使用簡單的執行緒池來限定執行緒池的上限。執行緒池會管理所有執行緒，如果執行緒數還沒有達到上限，執行緒池會建立執行緒到上限，且儘可能複用空閒的執行緒。

ServerSocket listener = new ServerSocket(8080);
ExecutorService executor = Executors.newFixedThreadPool(4);
try {
 while (true) {
   Socket socket = listener.accept();
   executor.submit( new HandleRequestRunnable(socket) );
 }
} finally {
 listener.close();
}

在這個示例中，沒有直接建立執行緒，而是使用了ExecutorService。它將需要執行的任務（需要實現Runnables介面）提交到執行緒池，使用執行緒池中的執行緒執行程式碼。示例中，使用執行緒數量為4的固定大小執行緒池來處理所有請求。這限制了處理請求的執行緒數量，也限制了資源的使用。

除了通過newFixedThreadPool方法建立固定大小執行緒池，Executors類還提供了newCachedThreadPool方法。複用執行緒池還是有可能導致不可控的執行緒數，但是它會盡可能使用之前已經建立的空閒執行緒。通常該型別執行緒池適合使用在不會被外部資源阻塞的短任務上。

工作佇列

使用了固定大小執行緒池之後，如果所有的執行緒都繁忙，再新來一個請求將會發生什麼呢？ThreadPoolExecutor使用一個佇列來儲存等待處理的請求，固定大小執行緒池預設使用無限制的連結串列。注意，這又可能引起資源耗盡問題，但只要執行緒處理的速度大於佇列增長的速度就不會發生。然後前面示例中，每個排隊的請求都會持有套接字，在一些作業系統中，這將會消耗檔案控制代碼。由於作業系統會限制程序開啟的檔案控制代碼數，因此最好限制下工作佇列的大小。

public static ExecutorService newBoundedFixedThreadPool(int nThreads, int capacity) {
 return new ThreadPoolExecutor(nThreads, nThreads,
     0L, TimeUnit.MILLISECONDS,
     new LinkedBlockingQueue<Runnable>(capacity),
     new ThreadPoolExecutor.DiscardPolicy());
}

public static void boundedThreadPoolServerSocket() throws IOException {
 ServerSocket listener = new ServerSocket(8080);
 ExecutorService executor = newBoundedFixedThreadPool(4, 16);
 try {
   while (true) {
     Socket socket = listener.accept();
     executor.submit( new HandleRequestRunnable(socket) );
   }
 } finally {
   listener.close();
 }
}

這裡我們沒有直接使用Executors.newFixedThreadPool方法來建立執行緒池，而是自己構建了ThreadPoolExecutor物件，並將工作佇列長度限制為16個元素。

如果所有的執行緒都繁忙，新的任務將會填充到佇列中，由於佇列限制了大小為16個元素，如果超過這個限制，就需要由構造ThreadPoolExecutor物件時的最後一個引數來處理了。示例中，使用了拋棄策略（DiscardPolicy），即當佇列到達上限時，將拋棄新來的任務。初次之外，還有中止策略（AbortPolicy）和呼叫者執行策略（CallerRunsPolicy）。前者將丟擲一個異常，而後者會再呼叫者執行緒中執行任務。

對於Web應用來說，最優的預設策略應該是拋棄或者中止策略，並返回一個錯誤給客戶端（如HTTP 503錯誤）。當然也可以通過增加工作佇列長度的方式，避免拋棄客戶端請求，但是使用者請求一般不願意進行長時間的等待，且這樣會更多的消耗伺服器資源。工作佇列的用途，不是無限制的響應客戶端請求，而是平滑突發暴增的請求。通常情況下，工作佇列應該是空的。

執行緒數調優

前面的示例展示瞭如何建立和使用執行緒池，但是，使用執行緒池的核心問題在於應該使用多少執行緒。首先，我們要確保達到執行緒上限時，不會引起資源耗盡。這裡的資源包括記憶體（堆和棧）、開啟檔案控制代碼數量、TCP連線數、遠端資料庫連線數和其他有限的資源。特別的，如果執行緒任務是計算密集型的，CPU核心數量也是資源限制之一，一般情況下執行緒數量不要超過CPU核心數量。

由於執行緒數的選定依賴於應用程式的型別，可能需要經過大量效能測試之後，才能得出最優的結果。當然，也可以通過增加資源數的方式，來提升應用程式的效能。例如，修改JVM堆記憶體大小，或者修改作業系統的檔案控制代碼上限等。然後，這些調整最終還是會觸及理論上限。

利特爾法則

利特爾法則描述了在穩定系統中，三個變數之間的關係。

其中L表示平均請求數量，λ表示請求的頻率，W表示響應請求的平均時間。舉例來說，如果每秒請求數為10次，每個請求處理時間為1秒，那麼在任何時刻都有10個請求正在被處理。回到我們的話題，就是需要使用10個執行緒來進行處理。如果單個請求的處理時間翻倍，那麼處理的執行緒數也要翻倍，變成20個。

理解了處理時間對於請求處理效率的影響之後，我們會發現，通常理論上限可能不是執行緒池大小的最佳值。執行緒池上限還需要參考任務處理時間。

假設JVM可以並行處理1000個任務，如果每個請求處理時間不超過30秒，那麼在最壞情況下，每秒最多隻能處理33.3個請求。然而，如果每個請求只需要500毫秒，那麼應用程式每秒可以處理2000個請求。

拆分執行緒池

在微服務或者面向服務架構（SOA）中，通常需要訪問多個後端服務。如果其中一個服務效能下降，可能會引起執行緒池執行緒耗盡，從而影響對其他服務的請求。

應對後端服務失效的有效辦法是隔離每個服務所使用的執行緒池。在這種模式下，仍然有一個分派的執行緒池，將任務分派到不同的後端請求執行緒池中。該執行緒池可能因為一個緩慢的後端而沒有負載，而將負擔轉移到了請求緩慢後端的執行緒池中。

另外，多執行緒池模式還需要避免死鎖問題。如果每個執行緒都阻塞在等待未被處理請求的結果上時，就會發生死鎖。因此，多執行緒池模式下，需要了解每個執行緒池執行的任務和它們之間的依賴，這樣可以儘可能避免死鎖問題。

總結

即使沒有在應用程式中直接使用執行緒池，它們也很有可能在應用程式中被應用伺服器或者框架間接使用。Tomcat、JBoss、Undertow、Dropwizard等框架，都提供了調優執行緒池（servlet執行使用的執行緒池）的選項。

Java Web應用中調優執行緒池的重要性

單執行緒

多執行緒

資源耗盡

執行緒池

工作佇列

執行緒數調優

利特爾法則

拆分執行緒池

總結

Java Web應用中調優執行緒池的重要性

Java併發程式設計中四種執行緒池及自定義執行緒使用教程

Java Web應用中支持跨域請求

java中常見的執行緒池（不看後悔，一看必懂）

web專案中使用多執行緒的一些坑

初識Java中的四大執行緒池和ThreadPoolExecutor的使用（歡迎指正）

Python web 應用效能調優

Java併發程式設計中的多執行緒是怎麼實現的？

Java web應用中的安全問題整理

web專案中啟動一個執行緒，的方法

Java web應用中如何判斷Web容器型別

第35節：Java面向物件中的多執行緒

Java中五種執行緒池的介紹

java中四種執行緒池的區別

Java 單元測試中的多執行緒無故退出

詳解執行緒池的作用及Java中如何使用執行緒池

Java併發（11）- 有關執行緒池的10個問題

Java併發程式設計：4種執行緒池和緩衝佇列BlockingQueue

使用Java佇列來處理日誌資訊(執行緒池的使用)

執行緒池實現原理（Executor框架），java提供常用的幾種執行緒池、死鎖產生條件和避免

Java Web應用中調優執行緒池的重要性

單執行緒

多執行緒

資源耗盡

執行緒池

工作佇列

執行緒數調優

利特爾法則

拆分執行緒池

總結

相關推薦