1. 程式人生 > >SpringCloud 熔斷引數配置說明 Spring Cloud Hystrix(服務容錯保護)

SpringCloud 熔斷引數配置說明 Spring Cloud Hystrix(服務容錯保護)

Spring Cloud Hystrix(服務容錯保護)

2017年06月26日 17:57:42 閱讀數:3763

Hystrix介紹

簡介

Hystrix是由Netflix建立一個類庫。

在微服務的分散式環境中,系統存在許多服務依賴。在高併發訪問下,這些依賴的穩定性與否對系統的影響非常大,但是依賴有很多不可控問題:如網路連線緩慢,資源繁忙,暫時不可用,服務離線等。 Hystrix可以通過新增延遲容錯和容錯邏輯來幫助我們控制這些分散式服務之間的互動。 Hystrix通過隔離服務之間的接入點,阻止它們之間的級聯故障,並提供備用選項,從而提高系統的整體彈性。

Hystrix流程結構

流程說明:

  1. 每次呼叫建立一個新的HystrixCommand,把依賴呼叫封裝在run()方法中.
  2. 執行execute()/queue做同步或非同步呼叫.
  3. 是否開啟請求快取,如果開啟了,並且如果快取中對請求的響應可用,則此快取響應將立即以“Observable”的形式返回。
  4. 判斷熔斷器(circuit-breaker)是否開啟,如果開啟跳到步驟8,進行降級策略,如果關閉進入步驟.
  5. 判斷執行緒池/佇列/訊號量是否跑滿,如果跑滿進入降級步驟8,否則繼續後續步驟.
  6. 呼叫HystrixCommand的run方法.執行依賴邏輯
    1. 依賴邏輯呼叫超時,進入步驟8.
  7. 判斷邏輯是否呼叫成功
    1. 返回成功呼叫結果
    2. 調用出錯,進入步驟8.
  8. 計算熔斷器狀態,所有的執行狀態(成功, 失敗, 拒絕,超時)上報給熔斷器,用於統計從而判斷熔斷器狀態.
  9. getFallback()降級邏輯.
    • 以下四種情況將觸發getFallback呼叫:
      1. (1):run()方法丟擲非HystrixBadRequestException異常。
      2. (2):run()方法呼叫超時
      3. (3):熔斷器開啟攔截呼叫
      4. (4):執行緒池/佇列/訊號量是否跑滿
    1. 沒有實現getFallback的Command將直接丟擲異常
    2. fallback降級邏輯呼叫成功直接返回
    3. 降級邏輯呼叫失敗丟擲異常
  10. 返回執行成功結果

為什麼要使用Hystrix

分散式微服務系統中有多依賴,在高併發訪問下,這些依賴的穩定性與否對系統的影響非常大,但是依賴有很多不可控問題:如網路連線緩慢,資源繁忙,暫時不可用,服務離線等。高併發情況下,某個依賴服務(如下面的Vehicle Service)失敗,其他依賴服務可用。

如果不對失敗依賴採取隔離措施,將會生產雪崩效應,最終可能導致當前應用服務就有被拖垮的風險。

解決以上問題的方案-斷路器:

斷路器(英文名稱:circuit-breaker,circuit breaker)是指能夠關合、承載和開斷正常回路條件下的電流並能關合、在規定的時間內承載和開斷異常回路條件下的電流的開關裝置。

下圖是家用配電箱

Hystrix實現的斷路器模式,在分散式微服務系統中當對特定服務的呼叫達到一定閾值時(Hystrix中預設為20秒,20秒),電路將開啟,不進行通話。在錯誤和開路的情況下,開發人員可以提供後備
還是回到剛才的底層依賴服務失敗的場景,在消費者一端多次呼叫依賴服務失敗,達到斷路器開啟的閾值,斷路器被開啟,對應 的FallBack方法被執行,一段時間內將不會再向失敗的服務發起請求。


資料

官方文件

http://cloud.spring.io/spring-cloud-static/Dalston.SR1/#_circuit_breaker_hystrix_clients

原始碼地址

https://github.com/Netflix/Hystrix

博文推薦

如何整合Hystrix

step1. 在消費者微服務的pom.xml中新增Hystrix依賴

 展開原始碼

step2. 在啟動程式中啟用斷路器

 展開原始碼

step3. 在具體方法中添加註解並新增FallBack方法

 展開原始碼

Hystrix配置

配置樣例:

@HystrixCommand (fallbackMethod =  "stubMyServiceFallBack" ,      commandProperties = {        @HystrixProperty (name= "execution.isolation.strategy" , value= "SEMAPHORE" )      } )


Execution相關的屬性的配置:

  • hystrix.command.default.execution.isolation.strategy 隔離策略,預設是Thread, 可選Thread|Semaphore

    • thread 通過執行緒數量來限制併發請求數,可以提供額外的保護,但有一定的延遲。一般用於網路呼叫
    • semaphore 通過semaphore count來限制併發請求數,適用於無網路的高併發請求
  • hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds 命令執行超時時間,預設1000ms

  • hystrix.command.default.execution.timeout.enabled 執行是否啟用超時,預設啟用true
  • hystrix.command.default.execution.isolation.thread.interruptOnTimeout 發生超時是是否中斷,預設true
  • hystrix.command.default.execution.isolation.semaphore.maxConcurrentRequests 最大併發請求數,預設10,該引數當使用ExecutionIsolationStrategy.SEMAPHORE策略時才有效。如果達到最大併發請求數,請求會被拒絕。理論上選擇semaphore size的原則和選擇thread size一致,但選用semaphore時每次執行的單元要比較小且執行速度快(ms級別),否則的話應該用thread。
    semaphore應該佔整個容器(tomcat)的執行緒池的一小部分。

Fallback相關的屬性

這些引數可以應用於Hystrix的THREAD和SEMAPHORE策略

  • hystrix.command.default.fallback.isolation.semaphore.maxConcurrentRequests 如果併發數達到該設定值,請求會被拒絕和丟擲異常並且fallback不會被呼叫。預設10
  • hystrix.command.default.fallback.enabled 當執行失敗或者請求被拒絕,是否會嘗試呼叫hystrixCommand.getFallback() 。預設true

Circuit Breaker相關的屬性

  • hystrix.command.default.circuitBreaker.enabled 用來跟蹤circuit的健康性,如果未達標則讓request短路。預設true
  • hystrix.command.default.circuitBreaker.requestVolumeThreshold 一個rolling window內最小的請求數。如果設為20,那麼當一個rolling window的時間內(比如說1個rolling window是10秒)收到19個請求,即使19個請求都失敗,也不會觸發circuit break。預設20
  • hystrix.command.default.circuitBreaker.sleepWindowInMilliseconds 觸發短路的時間值,當該值設為5000時,則當觸發circuit break後的5000毫秒內都會拒絕request,也就是5000毫秒後才會關閉circuit。預設5000
  • hystrix.command.default.circuitBreaker.errorThresholdPercentage錯誤比率閥值,如果錯誤率>=該值,circuit會被開啟,並短路所有請求觸發fallback。預設50
  • hystrix.command.default.circuitBreaker.forceOpen 強制開啟熔斷器,如果開啟這個開關,那麼拒絕所有request,預設false
  • hystrix.command.default.circuitBreaker.forceClosed 強制關閉熔斷器 如果這個開關開啟,circuit將一直關閉且忽略circuitBreaker.errorThresholdPercentage

Metrics相關引數

  • hystrix.command.default.metrics.rollingStats.timeInMilliseconds 設定統計的時間視窗值的,毫秒值,circuit break 的開啟會根據1個rolling window的統計來計算。若rolling window被設為10000毫秒,則rolling window會被分成n個buckets,每個bucket包含success,failure,timeout,rejection的次數的統計資訊。預設10000
  • hystrix.command.default.metrics.rollingStats.numBuckets 設定一個rolling window被劃分的數量,若numBuckets=10,rolling window=10000,那麼一個bucket的時間即1秒。必須符合rolling window % numberBuckets == 0。預設10
  • hystrix.command.default.metrics.rollingPercentile.enabled 執行時是否enable指標的計算和跟蹤,預設true
  • hystrix.command.default.metrics.rollingPercentile.timeInMilliseconds 設定rolling percentile window的時間,預設60000
  • hystrix.command.default.metrics.rollingPercentile.numBuckets 設定rolling percentile window的numberBuckets。邏輯同上。預設6
  • hystrix.command.default.metrics.rollingPercentile.bucketSize 如果bucket size=100,window=10s,若這10s裡有500次執行,只有最後100次執行會被統計到bucket裡去。增加該值會增加記憶體開銷以及排序的開銷。預設100
  • hystrix.command.default.metrics.healthSnapshot.intervalInMilliseconds 記錄health 快照(用來統計成功和錯誤綠)的間隔,預設500ms

Request Context 相關引數

hystrix.command.default.requestCache.enabled 預設true,需要過載getCacheKey(),返回null時不快取
hystrix.command.default.requestLog.enabled 記錄日誌到HystrixRequestLog,預設true

Collapser Properties 相關引數

hystrix.collapser.default.maxRequestsInBatch 單次批處理的最大請求數,達到該數量觸發批處理,預設Integer.MAX_VALUE
hystrix.collapser.default.timerDelayInMilliseconds 觸發批處理的延遲,也可以為建立批處理的時間+該值,預設10
hystrix.collapser.default.requestCache.enabled 是否對HystrixCollapser.execute() and HystrixCollapser.queue()的cache,預設true

ThreadPool 相關引數

執行緒數預設值10適用於大部分情況(有時可以設定得更小),如果需要設定得更大,那有個基本得公式可以follow:
requests per second at peak when healthy × 99th percentile latency in seconds + some breathing room
每秒最大支撐的請求數 (99%平均響應時間 + 快取值)
比如:每秒能處理1000個請求,99%的請求響應時間是60ms,那麼公式是:
1000 
(0.060+0.012)

基本得原則時保持執行緒池儘可能小,他主要是為了釋放壓力,防止資源被阻塞。
當一切都是正常的時候,執行緒池一般僅會有1到2個執行緒啟用來提供服務

  • hystrix.threadpool.default.coreSize 併發執行的最大執行緒數,預設10
  • hystrix.threadpool.default.maxQueueSize BlockingQueue的最大佇列數,當設為-1,會使用SynchronousQueue,值為正時使用LinkedBlcokingQueue。該設定只會在初始化時有效,之後不能修改threadpool的queue size,除非reinitialising thread executor。預設-1。
  • hystrix.threadpool.default.queueSizeRejectionThreshold 即使maxQueueSize沒有達到,達到queueSizeRejectionThreshold該值後,請求也會被拒絕。因為maxQueueSize不能被動態修改,這個引數將允許我們動態設定該值。if maxQueueSize == -1,該欄位將不起作用
  • hystrix.threadpool.default.keepAliveTimeMinutes 如果corePoolSize和maxPoolSize設成一樣(預設實現)該設定無效。如果通過plugin(https://github.com/Netflix/Hystrix/wiki/Plugins)使用自定義實現,該設定才有用,預設1.
  • hystrix.threadpool.default.metrics.rollingStats.timeInMilliseconds 執行緒池統計指標的時間,預設10000
  • hystrix.threadpool.default.metrics.rollingStats.numBuckets 將rolling window劃分為n個buckets,預設10

官方說明:

https://github.com/Netflix/Hystrix/wiki/Configuration