Kubernetes 彈性伸縮全場景解讀（二）- HPA 的原理與演進

阿新 • • 發佈：2019-07-24

前言

在上一篇文章 Kubernetes 彈性伸縮全場景解析（一）：概念延伸與元件佈局中，我們介紹了在 Kubernetes 在處理彈性伸縮時的設計理念以及相關元件的佈局，在今天這篇文章中，會為大家介紹在 Kubernetes 中彈性伸縮最常用的元件 HPA（Horizontal Pod Autoscaler）。HPA 是通過計算 Pod 的實際工作負載進行重新容量規劃的元件，在資源池符合滿足條件的前提下，HPA 可以很好的實現彈性伸縮的模型。HPA 到目前為止，已經演進了三個大版本，本文將會為大家詳細解析 HPA 底層的原理以及在 Kubernetes 中彈性伸縮概念的演變歷程。

HPA 基本原理

HPA 是根據實際工作負載水平伸縮容器數目的元件，從中可以提煉出兩個非常重要的關鍵字：負載和數目。我們可以用一個非常簡單的數學公式進行歸納：下面舉一個實際例子進行上述公式的闡述。假設存在一個叫 A 的 Deployment，包含3個 Pod，每個副本的 Request 值是 1 核，當前 3 個 Pod 的 CPU 利用率分別是 60%、70% 與 80%，此時我們設定 HPA 閾值為 50%，最小副本為 3，最大副本為 10。接下來我們將上述的資料帶入公式中：

總的 Pod 的利用率是 60%+70%+80% = 210%；
當前的 Target 是 3；
算式的結果是 70%，大於50%閾值，因此當前的 Target

數目過小，需要進行擴容；
重新設定 Target 值為 5，此時算式的結果為 42% 低於 50%，判斷還需要擴容兩個容器；
此時 HPA 設定 Replicas 為 5，進行 Pod 的水平擴容。

經過上面的推演，可以協助開發者快速理解 HPA 最核心的原理，不過上面的推演結果和實際情況下是有所出入的，如果開發者進行試驗的話，會發現 Replicas 最終的結果是 6 而不是 5。這是由於 HPA 中一些細節的處理導致的，主要包含如下三個主要的方面：

噪聲處理

通過上面的公式可以發現，Target 的數目很大程度上會影響最終的結果，而在 Kubernetes 中，無論是變更或者升級，都更傾向於使用 Recreate

而不是 Restart 的方式進行處理。這就導致了在 Deployment 的生命週期中，可能會出現某一個時間，Target 會由於計算了 Starting 或者 Stopping 的 Pod 而變得很大。這就會給 HPA 的計算帶來非常大的噪聲，在 HPA Controller 的計算中，如果發現當前的物件存在 Starting 或者 Stopping 的 Pod 會直接跳過當前的計算週期，等待狀態都變為 Running 再進行計算。

冷卻週期

在彈性伸縮中，冷卻週期是不能逃避的一個話題，很多時候我們期望快速彈出與快速回收，而另一方面，我們又不希望叢集震盪，所以一個彈性伸縮活動冷卻週期的具體數值是多少，一直被開發者所挑戰。在 HPA 中，預設的擴容冷卻週期是 3 分鐘，縮容冷卻週期是 5 分鐘。

邊界值計算

我們回到剛才的計算公式，第一次我們算出需要彈出的容器數目是 5，此時擴容後整體的負載是 42%，但是我們似乎忽略了一個問題：一個全新的 Pod 啟動會不會自己就佔用了部分資源？此外，8% 的緩衝區是否就能夠緩解整體的負載情況？要知道當一次彈性擴容完成後，下一次擴容要最少等待 3 分鐘才可以繼續擴容。為了解決這些問題，HPA 引入了邊界值 △，目前在計算邊界條件時，會自動加入 10% 的緩衝，這也是為什麼在剛才的例子中最終的計算結果為 6 的原因。

HPA 的演進歷程

在瞭解了 HPA 的基本原理後，我們來聊一下 HPA 的演進歷程，目前 HPA 已經支援了 autoscaling/v1、autoscaling/v1beta1 和 autoscaling/v1beta2 三個大版本。大部分的開發者目前比較熟悉的是autoscaling/v1 的版本，這個版本的特點是隻支援 CPU 一個指標的彈性伸縮，大致的 yaml 內容如下：

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  targetCPUUtilizationPercentage: 50

接下來我們再來看一下 v2beta1 與 v2beta2 的 yaml，會發現裡面支援的 metrics 型別增加了很多，結構也複雜了很多。

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        kind: AverageUtilization
        averageUtilization: 50
  - type: Pods
    pods:
      metric:
        name: packets-per-second
      targetAverageValue: 1k
  - type: Object
    object:
      metric:
        name: requests-per-second
      describedObject:
        apiVersion: extensions/v1beta1
        kind: Ingress
        name: main-route
      target:
        kind: Value
        value: 10k
---
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50

而這些變化的產生不得不提的是 Kubernetes 社群中對監控與監控指標的認識與轉變。在 Kubernetes 中，有兩個核心的監控元件 Heapster 與 Metrics Server。Heapster 是早期 Kubernetes 社群中唯一的監控元件，它所包含的功能很強大，通過採集 kubelet 提供的 metrics 介面，並支援監控資料的離線與歸檔。

大致的架構圖如上：source 的部分是不同的資料來源，主要是 kubelet 的 common api 與後來提供的 summary api；processor 的作用是將採集的資料進行處理，分別在 namespace 級別、cluster 級別進行聚合，並建立新的聚合型別的監控資料；sink 的作用是資料離線與歸檔，常見的歸檔方式包括 influxdb、kafka 等等。Heapster 元件在相當長時間成為了 Kubernetes 社群中監控資料的唯一來源，也因此有非常多的和監控相關的元件通過 Heapster 的鏈路進行監控資料的消費。但是後來，Kubernetes 社群發現了 Heapster 存在非常嚴重的幾個問題：

強大繁多的 Sink 由不同的 Maintainer 進行維護，50% 以上的 Heapster Issues 都是關於 Sink 無法使用的，而由於 Maintainer 的活躍度不同造成 Heapster 社群有大量的 issues 無法解決；
對於開發者而言，監控資料的型別已經不再是 CPU、Memory 這麼簡單的幾個指標項了，越來越多的開發者需要應用內或者接入層的監控指標，例如 ingress 的 QPS、應用的線上活躍人數等等。而這些指標的獲取是 Heapster 無法實現的；
Prometheus 的成熟讓 Heapster 的生存空間不斷被擠壓，自從 Prometheus 被 CNCF 收錄為孵化專案，Heapster 的不可替代地位被正式移除。

社群經過反思後，決定將監控的指標邊界進行劃分，分為 Resource、Custom 和 External 三種不同的 Metrics，而 Heapster(Metrics Server) 的定位就只關心 Resource 這一種指標型別。為了解決程式碼維護性的問題，Metrics Server 對 Heapster 進行了裁剪，裁剪後的架構如下：

去掉了 Sink 的機制，並將呼叫方式改為標準的 API 註冊的方式，這樣的好處是既精簡了核心程式碼的邏輯又提供了替代的可能，也就是說此時 Metrics Server 也是可以替代的，只要實現了相同的 API 介面，並註冊到 API Server 上，就可以替代 Metrics Server。

接下來我們解析一下三種不同的 Metrics 與使用的場景：

	API	註釋
Resource	metrics.k8s.io	Pod的資源指標，計算的時要除以Pod數目再對比閾值進行判斷
Custom	custom.metrics.k8s.io	Object： CRD等物件的監控指標，直接計算指標比對閾值<br />Pods : 每個Pod的自定義指標，計算時要除以Pods的數目
External	external.metrics.k8s.io	External：叢集指標的監控指標，通常由雲廠商實現

其中 autoscaling/v2beta1 支援 Resource 與 Custom 兩種指標，而 autoscaling/v2beta2 中增加了 External 的指標的支援。

最後

HPA 目前已經進入了 GA 階段，在大體的功能上面不會進行過多的變化，目前社群的主要發力點在如何配置化的調整細節引數、豐富監控 adapter 的實現等等。在本文中，我們在概念上給大家介紹了 HPA 的一些原理以及發展的趨勢，在下一篇文章中，我們會為大家講解如何開啟 v2beta1 與 v

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Kubernetes彈性伸縮全場景解讀（二） - HPA的原理與演進
      前言 
在上一篇文章中，我們介紹了在Kubernetes在處理彈性伸縮時的設計理念以及相關元件的佈局，在今天這篇文章中，會為大家介紹在Kubernetes中彈性伸縮最常用的元件HPA（Horizontal Pod Autoscaler）。HPA是通過計算Pod的實際工作負載進行重新容量規劃的元件，在資源池符合 

  
 

    

    
    Kubernetes 彈性伸縮全場景解讀（二）- HPA 的原理與演進
      
                                        
                                                前言
在上一篇文章 Kubernetes 彈性伸縮全場景解析 （一）：概念延伸與元件佈局中，我們介紹了在 Kubernetes 在 

  
 

    

    
    《Kubernetes彈性伸縮全場景解讀（五）
      
                                        
                                                
前言 
容器技術的發展讓軟體交付和運維變得更加標準化、輕量化、自動化。這使得動態調整負載的容量變成一件非常簡單的事情。在kube 

  
 

    

    
    Kubernetes 彈性伸縮全場景解讀（五） - 定時伸縮元件釋出與開源
      
 
作者| 阿里雲容器技術專家劉中巍（莫源）

導讀：Kubernetes彈性伸縮系列文章為讀者一一解析了各個彈性伸縮元件的相關原理和用法。本篇文章中，阿里雲容器技術專家莫源將為你帶來定時伸縮元件  kubernetes-cronhpa-controller &nbs 

  
 

    

    
    Kubernetes 彈性伸縮全場景解讀（五）
      
                                        
                                                 
 
 導讀：Kubernetes彈性伸縮系列文章為讀者一一解析了各個彈性伸縮元件的相關原理和用法。本篇文章中，阿里雲容器技術專 

  
 

    

    
    Kubernetes 彈性伸縮全場景解析 （一）- 概念延伸與元件佈局
      傳統彈性伸縮的困境 
彈性伸縮是Kubernetes中被大家關注的一大亮點，在討論相關的元件和實現方案之前。首先想先給大家擴充下彈性伸縮的邊界與定義，傳統意義上來講，彈性伸縮主要解決的問題是容量規劃與實際負載的矛盾。 
 

如上圖所示，藍色的水位線表示叢集的容量隨著負載的提高不斷的增長，紅色的曲線表示叢集的 

  
 

    

    
    Kubernetes彈性伸縮全場景解析（三） - HPA實踐手冊
      前言 
在上一篇文章中，給大家介紹和剖析了HPA的實現原理以及演進的思路與歷程。在本文中，我們會為大家講解如何使用HPA以及一些需要注意的細節。 
 autoscaling/v1實踐 
v1的模板可能是大家平時見到最多的也是最簡單的，v1版本的HPA只支援一種指標 —— CPU。傳統意義上，彈性伸縮最少也會支 

  
 

    

    
    Kubernetes 彈性伸縮全場景解析 （四）- 讓核心組件充滿彈性
      ces   param   serve   try   ingress   ont   整體   per   區間   前言
在本系列的前三篇中，我們介紹了彈性伸縮的整體布局以及HPA的一些原理，HPA的部分還遺留了一些內容需要進行詳細解析。在準備這部分內容的期間，會穿插幾篇彈性伸縮組件的最佳實踐。今天我們要 

  
 

    

    
    Kubernetes 彈性伸縮全場景解析 （一）：概念延伸與元件佈局
      
                                        
                                                傳統彈性伸縮的困境
彈性伸縮是 Kubernetes 中被大家關注的一大亮點，在討論相關的元件和實現方案之前。首先想先給大家擴充下 

  
 

    

    
    移動GPU全解讀（二）
      分表   標量   2.0   特效   one   高精   上一個   能夠   兩個   


【編者按】：本文作者為愛搞機特約作者、技術達人“炮神”@ioncannon。

在上一篇移動GPU解讀中，對移動GPU的架構、相關參數進行了介紹，本部分介紹的則是移動GPU的Shader、GPU兼容 

  
 

    

    
    DispNet中Caffe自定義層解讀（二）——DataAugmentation
       
 
  
  
 DispNet中Caffe自定義層解讀（二）——DataAugmentation 
 這一系列博文記錄了博主在學習DispNet過程中遇到的自定義Caffe層的筆記。這一部分是DataAugmentation層，其主要功能是：根據要求對輸入的資料進行擴張，從而從資料的角度上儘量緩解過擬合 

  
 

    

    
    Fragment全解析系列（二）：正確的使用姿勢
       
 
 Fragment是可以讓你的app縱享絲滑的設計，如果你的app想在現在基礎上效能大幅度提高，並且佔用記憶體降低，同樣的介面Activity佔用記憶體比Fragment要多，響應速度Fragment比Activty在中低端手機上快了很多，甚至能達到好幾倍！如果你的app當前或以後有移植平板等平臺時， 

  
 

    

    
    API網關Kong（二）：Kong與Kubernetes集成的方法
      ada   Once   services   per   gpl   recommend   methods   args   timeout   作者: 李佶澳   轉載請保留：原文地址   發布時間：2018-09-30 16:07:13 +0800
 



說明
先說組成

控制平面與數據平面


 

  
 

    

    
    OSG場景漫遊（二）
       
 
 二、測試TravelManipulator.DLL 
 下面我們來建立一個只需幾行程式碼就可以完成漫遊功能的程式，具體步驟如下： 
 第一步：選單檔案->新建專案->WIN32/WIN32控制檯應用程式，專案名取test，在應用程式設定中點選空專案後完成。 
 第二步：選單專案-> 

  
 

    

    
    Thrift解讀（二）——TNonblockingServer I/O執行緒
      
                TNonblockingServer的I/O執行緒是TNonblockingIOThread物件。每個TNonblockingIOThread儲存服務的server指標，同時記錄監聽的套接字。他並不是真正的pthread，所以執行緒號是額外指定的，在構造方法中指定。

TNo 

  
 

    

    
    零基礎實現攝像頭的全平臺直播 （二）公網直播的實現
       
  
  
  
  接上回，我們實現內網直播，可以實現直播的web觀看，該篇博文我們將實現公網的直播。 
  
 由於通用最多都是 window系統，我們的軟體也是可以在Windows上執行，我們後面就以window為例進行操作 
 下載穿透軟體 
 下載地址：https://natapp.cn/#do 

  
 

    

    
    Netty原始碼解讀（二）Netty中的buffer
      
      感謝網友【黃億華】投遞本稿。
上一篇文章我們概要介紹了Netty的原理及結構，下面幾篇文章我們開始對Netty的各個模組進行比較詳細的分析。Netty的結構最底層是buffer模組，這部分也相對獨立，我們就先從buffer講起。
What: buffer二三事
buffer中文名又叫緩衝區，按 

  
 

    

    
    log4j2非同步日誌解讀（二）AsyncLogger
      
前文已經講了log4j2的AsyncAppender的實現【log4j2非同步日誌解讀（一）AsyncAppender】，今天我們看看AsyncLogger的實現。

看了這個圖，應該很清楚AsyncLogger呼叫Disruptor，然後直接返回。至於高效能佇列 這裡已經展開講了是如何實現的。
A 

  
 

    

    
    Emoji開源專案解讀（二）自定義表情
      
                

介紹
上一節呢，我們解讀了一個系統Emoji表情，這節呢， 我們談談自定義表情，如QQ、微信等，正好前兩天看到一個仿QQ的一個應用，雖然還是有許多需要完善的地方， 不過對於自定義Emoji表情功能，做的也是比較成熟了，這裡要謝謝白玉樑同學，下面我帶領大家來一起學習一下他的 

  
 

    

    
    VSCode外掛開發全攻略（二）HelloWord
      
寫著前面
學習一門新的語言或者生態首先肯定是從HelloWord開始。
您可以直接克隆我放在GitHub上vscode-plugin-demo 的程式碼到本地，然後嘗試修改程式碼並執行，也可以使用微軟官方的腳手架vscode-generator-code來生成專案結構，腳手架的使用我們後面再來介紹，先來熟悉

Kubernetes 彈性伸縮全場景解讀（二）- HPA 的原理與演進

前言

HPA 基本原理

HPA 的演進歷程

最後

Kubernetes彈性伸縮全場景解讀（二） - HPA的原理與演進

Kubernetes 彈性伸縮全場景解讀（二）- HPA 的原理與演進

《Kubernetes彈性伸縮全場景解讀（五）

Kubernetes 彈性伸縮全場景解讀（五） - 定時伸縮元件釋出與開源

Kubernetes 彈性伸縮全場景解讀（五）

Kubernetes 彈性伸縮全場景解析（一）- 概念延伸與元件佈局

Kubernetes彈性伸縮全場景解析（三） - HPA實踐手冊

Kubernetes 彈性伸縮全場景解析（四）- 讓核心組件充滿彈性

Kubernetes 彈性伸縮全場景解析（一）：概念延伸與元件佈局

移動GPU全解讀（二）

DispNet中Caffe自定義層解讀（二）——DataAugmentation

Fragment全解析系列（二）：正確的使用姿勢

API網關Kong（二）：Kong與Kubernetes集成的方法

OSG場景漫遊（二）

Thrift解讀（二）——TNonblockingServer I/O執行緒

零基礎實現攝像頭的全平臺直播（二）公網直播的實現

Netty原始碼解讀（二）Netty中的buffer

log4j2非同步日誌解讀（二）AsyncLogger

Emoji開源專案解讀（二）自定義表情

VSCode外掛開發全攻略（二）HelloWord