1、名稱空間namespace
2、標籤
3、node節點選擇器
4、nodeSelector：
5、親和性
- 5.1 node節點親和性
  - 5.1.1 硬親和性
  - 5.1.2 軟親和性
- 5.2 Pod節點親和性
  - 5.2.1 pod節點親和性
  - 5.2.2 Pod節點反親和性
6、汙點、容忍度
- 6.1 管理節點汙點
7、Pod常見的狀態和重啟策略
- 7.1 常見的pod狀態
- 7.2 pod重啟策略
8、Pod生命週期

1、名稱空間namespace

1.1 什麼是名稱空間？

Kubernetes 支援多個虛擬叢集，它們底層依賴於同一個物理叢集。這些虛擬叢集被稱為名稱空間。

名稱空間namespace是k8s叢集級別的資源，可以給不同的使用者、租戶、環境或專案建立對應的名稱空間，例如，可以為test、devlopment、production環境分別建立各自的名稱空間。

1.2 namespace應用場景

名稱空間適用於存在很多跨多個團隊或專案的使用者的場景。對於只有幾到幾十個使用者的叢集，根本不需要建立或考慮名稱空間。

1、檢視名稱空間及其資源物件

k8s叢集預設提供了幾個名稱空間用於特定目的，例如，kube-system主要用於執行系統級資源，存放k8s一些元件的。而default則為那些未指定名稱空間的資源操作提供一個預設值。

使用kubectl get namespace可以檢視namespace資源，使用kubectl describe namespace $NAME可以檢視特定的名稱空間的詳細資訊。

2、管理namespace資源

namespace資源屬性較少，通常只需要指定名稱即可建立，如“kubectl create namespace qa”。namespace資源的名稱僅能由字母、數字、下劃線、連線線等字元組成。刪除namespace資源會級聯刪除其包含的所有其他資源物件。

1.3 namespacs常用指令

① 建立一個test名稱空間

# kubectl create ns test

② 切換名稱空間

# kubectl  config set-context --current --namespace=kube-system

#切換名稱空間後，kubectl get pods 如果不指定-n，檢視的就是kube-system名稱空間的資源了。

#檢視哪些資源屬於名稱空間級別的

1.4 namespace資源限額

namespace是名稱空間，裡面有很多資源，那麼我們可以對名稱空間資源做個限制，防止該名稱空間部署的資源超過限制。

如何對namespace資源做限額呢？

# vim namespace-quota.yaml

apiVersion: v1

kind: ResourceQuota

metadata:

  name: mem-cpu-quota

  namespace: test

spec:

  hard:

    requests.cpu: "2"

    requests.memory: 2Gi

    limits.cpu: "4"

    limits.memory: 4Gi

#建立的ResourceQuota物件將在test名字空間中新增以下限制：

  每個容器必須設定記憶體請求（memory request），記憶體限額（memory limit），cpu請求（cpu request）和cpu限額（cpu limit）。

    所有容器的記憶體請求總額不得超過2GiB。

    所有容器的記憶體限額總額不得超過4 GiB。

    所有容器的CPU請求總額不得超過2 CPU。

    所有容器的CPU限額總額不得超過4CPU。

#建立pod時候必須設定資源限額，否則建立失敗，如下：

# vim pod-test.yaml

apiVersion: v1

kind: Pod

metadata:

  name: pod-test

  namespace: test

  labels:

    app: tomcat-pod-test

spec:

  containers:

  - name:  tomcat-test

    ports:

    - containerPort: 8080

    image: hxu/tomcat-8.5-jre8:v1

    imagePullPolicy: IfNotPresent

[root@k8s-master1 ~]# kubectl apply -f pod-test.yaml

[root@k8s-master1 kubenetes-han]# kubectl get pod -n test

NAME       READY   STATUS    RESTARTS   AGE

pod-test   1/1     Running   0          67s

2、標籤

2.1 什麼是標籤？

標籤其實就一對 key/value ，被關聯到物件上，比如Pod,標籤的使用我們傾向於能夠表示物件的特殊特點，就是一眼就看出了這個Pod是幹什麼的，標籤可以用來劃分特定的物件（比如版本，服務型別等），標籤可以在建立一個物件的時候直接定義，也可以在後期隨時修改，每一個物件可以擁有多個標籤，但是，key值必須是唯一的。建立標籤之後也可以方便我們對資源進行分組管理。如果對pod打標籤，之後就可以使用標籤來檢視、刪除指定的pod。

在k8s中，大部分資源都可以打標籤。

2.2 如何給pod資源打標籤

顯示如下,顯示如下，說明標籤達成功了；

[root@k8s-master1 kubenetes-han]# kubectl get pods pod-test -n test --show-labels

NAME       READY   STATUS    RESTARTS   AGE     LABELS

pod-test   1/1     Running   0          3m55s   app=tomcat-pod-test

# 1、對已經存在的pod打標籤，release=v1

[root@k8s-master1 kubenetes-han]# kubectl label pods pod-test  release=v1 -n test

pod/pod-test labeled

# 2、檢視標籤是否打成功：

[root@k8s-master1 kubenetes-han]# kubectl get pods pod-test -n test --show-labels

NAME       READY   STATUS    RESTARTS   AGE     LABELS

pod-test   1/1     Running   0          4m40s   app=tomcat-pod-test,release=v1

2.3 檢視資源標籤

檢視預設名稱空間下所有pod資源的標籤

[root@k8s-master1 kubenetes-han]#  kubectl get pods --show-labels

NAME                          READY   STATUS    RESTARTS   AGE   LABELS

demo-pod                      1/1     Running   0          15d   app=myapp,env=dev

nginx-test-57f9f5b6d7-8zt7x   1/1     Running   0          38m   app=nginx,pod-template-hash=57f9f5b6d7

nginx-test-57f9f5b6d7-fxsw5   1/1     Running   0          8d    app=nginx,pod-template-hash=57f9f5b6d7

test-nginx-67b6d886b6-ccrvd   1/1     Running   0          13d   k8s-app=test-nginx,pod-template-hash=67b6d886b6

test-nginx-67b6d886b6-qgjdh   1/1     Running   0          13d   k8s-app=test-nginx,pod-template-hash=67b6d886b6

用法示例：

# 檢視預設名稱空間下指定pod具有的所有標籤

kubectl get pods pod-first --show-labels

# 列出預設名稱空間下標籤key是release的pod，不顯示標籤

kubectl get pods -l release

#列出預設名稱空間下標籤key是release、值是v1的pod，不顯示標籤

kubectl get pods -l release=v1

#列出預設名稱空間下標籤key是release的所有pod，並列印對應的標籤值

kubectl get pods -L release

#檢視所有名稱空間下的所有pod的標籤

kubectl get pods --all-namespaces --show-labels

kubectl get pods -l release=v1 -L release

3、node節點選擇器

我們在建立pod資源的時候，pod會根據schduler進行排程，那麼預設會排程到隨機的一個工作節點，如果我們想要pod排程到指定節點或者排程到一些具有相同特點的node節點，怎麼辦呢？

可以使用pod中的nodeName或者nodeSelector欄位指定要排程到的node節點

1、nodeName：

指定pod節點執行在哪個具體node上

先來編寫一個yaml檔案，指定排程節點為k8s-node1節點，我這裡只有一個虛擬機器所以看不出來效果，如有多個虛擬機器可以指定其他的node節點的主機名！

[root@k8s-master1 kubenetes-han]# cat pod-node.yaml

apiVersion: v1

kind: Pod

metadata:

  name: demo-pod

  namespace: default

  labels:

    app: myapp

    env: dev

spec:

  nodeName: k8s-node1  #此處指定排程到哪個節點，寫node的主機名

  containers:

  - name:  tomcat-pod-java

    ports:

    - containerPort: 8080

    image: tomcat:8.5-jre8-alpine

    imagePullPolicy: IfNotPresent

  - name: busybox

    image: busybox:latest

    command:

    - "/bin/sh"

    - "-c"

    - "sleep 3600"

# kubectl apply -f pod-node.yaml

檢視pod排程到哪個節點

[root@k8s-master1 kubenetes-han]# kubectl get pods  -o wide

NAME                          READY   STATUS    RESTARTS   AGE   IP            NODE        NOMINATED NODE   READINESS GATES

demo-pod                      2/2     Running   0          2m    10.244.1.21   k8s-node1   <none>           <none>

4、nodeSelector：

指定pod排程到具有哪些標籤的node節點上

給node節點打標籤，打個具有disk=ceph的標籤

# kubectl label nodes k8s-node2 disk=ceph

node/k8s-node2 labeled

# 定義pod的時候指定要排程到具有disk=ceph標籤的node上

編輯一個yaml檔案

[root@k8s-master1 kubenetes-han]# cat pod-1.yaml

apiVersion: v1

kind: Pod

metadata:

  name: demo-pod-1

  namespace: default

  labels:

    app: myapp

    env: dev

spec:

  nodeSelector:     # 加上nodeselector

    disk: ceph      # 値

  containers:

  - name:  tomcat-pod-java

    ports:

    - containerPort: 8080

    image: tomcat:8.5-jre8-alpine

    imagePullPolicy: IfNotPresent

讀取yaml檔案並建立pod

[root@k8s-master1 kubenetes-han]# kubectl apply -f pod-1.yaml

pod/demo-pod-1 created

[root@k8s-master1 kubenetes-han]# kubectl get pods  -o wide

NAME                          READY   STATUS              RESTARTS   AGE     IP            NODE        NOMINATED NODE   READINESS GATES

demo-pod                      2/2     Running             68         2d21h   10.244.1.21   k8s-node1   <none>           <none>

demo-pod-1                    0/1     ContainerCreating   0          3s      <none>        k8s-node2  # 排程到了node2上 <none>           <none>

nginx-test-57f9f5b6d7-8zt7x   1/1     Running             0          2d22h   10.244.1.19   k8s-node1   <none>           <none>

nginx-test-57f9f5b6d7-fxsw5   1/1     Running             0          11d     10.244.1.16   k8s-node1   <none>           <none>

test-nginx-67b6d886b6-ccrvd   1/1     Running             0          15d     10.244.1.8    k8s-node1   <none>           <none>

test-nginx-67b6d886b6-qgjdh   1/1     Running             0          15d     10.244.1.9    k8s-node1   <none>           <none>

5、親和性

5.1 node節點親和性

node節點親和性排程：nodeAffinity

# kubectl explain pods.spec.affinity

KIND:     Pod

VERSION:  v1

RESOURCE: affinity <Object>

DESCRIPTION:

     If specified, the pod's scheduling constraints

    Affinity is a group of affinity scheduling rules.

FIELDS:

   nodeAffinity	<Object>

   podAffinity	<Object>

   podAntiAffinity	<Object>

#  kubectl explain  pods.spec.affinity.nodeAffinity

KIND:     Pod

VERSION:  v1

RESOURCE: nodeAffinity <Object>

DESCRIPTION:

     Describes node affinity scheduling rules for the pod.

     Node affinity is a group of node affinity scheduling rules.

FIELDS:

   preferredDuringSchedulingIgnoredDuringExecution	<[]Object>

   requiredDuringSchedulingIgnoredDuringExecution	<Object>

prefered表示有節點儘量滿足這個位置定義的親和性，這不是一個必須的條件，軟親和性

require表示必須有節點滿足這個位置定義的親和性，這是個硬性條件，硬親和性

# kubectl explain pods.spec.affinity.nodeAffinity.requiredDuringSchedulingIgnoredDuringExecution

KIND:     Pod

VERSION:  v1

RESOURCE: requiredDuringSchedulingIgnoredDuringExecution <Object>

DESCRIPTION:

FIELDS:

   nodeSelectorTerms	<[]Object> -required-

     Required. A list of node selector terms. The terms are ORed.

# kubectl explain pods.spec.affinity.nodeAffinity.requiredDuringSchedulingIgnoredDuringExecution.nodeSelectorTerms

KIND:     Pod

VERSION:  v1

RESOURCE: nodeSelectorTerms <[]Object>

DESCRIPTION:

     Required. A list of node selector terms. The terms are ORed.

     A null or empty node selector term matches no objects. The requirements of

     them are ANDed. The TopologySelectorTerm type implements a subset of the

     NodeSelectorTerm.

FIELDS:

   matchExpressions	<[]Object>

   matchFields	<[]Object>

matchExpressions：匹配表示式的

matchFields： 匹配欄位的

# kubectl explain pods.spec.affinity.nodeAffinity.requiredDuringSchedulingIgnoredDuringExecution.nodeSelectorTerms.matchFields

KIND:     Pod

VERSION:  v1

RESOURCE: matchFields <[]Object>

DESCRIPTION:

FIELDS:

   key	<string> -required-

   values	<[]string>

# kubectl explain pods.spec.affinity.nodeAffinity.requiredDuringSchedulingIgnoredDuringExecution.nodeSelectorTerms.matchExpressions

KIND:     Pod

VERSION:  v1

RESOURCE: matchExpressions <[]Object>

DESCRIPTION:

FIELDS:

   key	<string> -required-

   operator	<string> -required-

   values	<[]string>

key：檢查label

operator：做等值選則還是不等值選則

values：給定值

5.1.1 硬親和性

例1：使用requiredDuringSchedulingIgnoredDuringExecution硬親和性

#把myapp-v1.tar.gz上傳到兩個node主機中並load -i

在master節點編輯yaml檔案

# cat pod-nodeaffinity-demo.yaml

apiVersion: v1

kind: Pod

metadata:

        name: pod-node-affinity-demo

        namespace: default

        labels:

            app: myapp

            tier: frontend

spec:

    containers:

    - name: myapp

      image: ikubernetes/myapp:v1

    affinity:

        nodeAffinity:

            requiredDuringSchedulingIgnoredDuringExecution:

                   nodeSelectorTerms:

                   - matchExpressions:

                     - key: zone

                       operator: In

                       values:

                       - foo

                       - bar

我們檢查當前節點中有任意一個節點擁有zone標籤的值是foo或者bar，就可以把pod排程到這個node節點的foo或者bar標籤上的節點上

[root@k8s-master1 kubenetes-han]# kubectl apply -f pod-nodeaffinity-demo.yaml

pod/pod-node-affinity-demo created

[root@k8s-master1 kubenetes-han]# kubectl get pods -o wide | grep pod-node

pod-node-affinity-demo        0/1     Pending   0          2s      <none>

status的狀態是pending，上面說明沒有完成排程，因為沒有一個擁有zone的標籤的值是foo或者bar，而且使用的是硬親和性，必須滿足條件才能完成排程

[root@k8s-master1 kubenetes-han]# kubectl label nodes k8s-node2  zone=foo

node/k8s-node2 labeled

[root@k8s-master1 kubenetes-han]# kubectl get pods -o wide | grep pod-node

pod-node-affinity-demo        1/1     Running   0          78s     10.244.2.3    k8s-node2

5.1.2 軟親和性

例2：使用preferredDuringSchedulingIgnoredDuringExecution軟親和性

# cat pod-nodeaffinity-demo-2.yaml

apiVersion: v1

kind: Pod

metadata:

        name: pod-node-affinity-demo-2

        namespace: default

        labels:

            app: myapp

            tier: frontend

spec:

    containers:

    - name: myapp

      image: ikubernetes/myapp:v1

    affinity:

        nodeAffinity:

            preferredDuringSchedulingIgnoredDuringExecution:

            - preference:

               matchExpressions:

               - key: zone1

                 operator: In

                 values:

                 - foo1

                 - bar1

              weight: 60

[root@k8s-master1 kubenetes-han]#  kubectl apply -f pod-nodeaffinity-demo-2.yaml

pod/pod-node-affinity-demo-2 created

[root@k8s-master1 kubenetes-han]#  kubectl get pods -o wide |grep demo-2

pod-node-affinity-demo-2      1/1     Running   0          2s      10.244.2.4    k8s-node2

上面說明軟親和性是可以執行這個pod的，儘管沒有執行這個pod的節點定義的zone1標籤

Node節點親和性針對的是pod和node的關係，Pod排程到node節點的時候匹配的條件

5.2 Pod節點親和性

pod自身的親和性排程有兩種表示形式

podaffinity：pod和pod更傾向膩在一起，把相近的pod結合到相近的位置，如同一區域，同一機架，這樣的話pod和pod之間更好通訊，比方說有兩個機房，這兩個機房部署的叢集有1000臺主機，那麼我們希望把nginx和tomcat都部署同一個地方的node節點上，可以提高通訊效率；

podunaffinity：pod和pod更傾向不膩在一起，如果部署兩套程式，那麼這兩套程式更傾向於反親和性，這樣相互之間不會有影響。

第一個pod隨機選則一個節點，做為評判後續的pod能否到達這個pod所在的節點上的執行方式，這就稱為pod親和性；我們怎麼判定哪些節點是相同位置的，哪些節點是不同位置的；我們在定義pod親和性時需要有一個前提，哪些pod在同一個位置，哪些pod不在同一個位置，這個位置是怎麼定義的，標準是什麼？以節點名稱為標準，這個節點名稱相同的表示是同一個位置，節點名稱不相同的表示不是一個位置。

幫助：

# kubectl explain pods.spec.affinity.podAffinity

KIND:     Pod

VERSION:  v1

RESOURCE: podAffinity <Object>

DESCRIPTION:

     Describes pod affinity scheduling rules (e.g. co-locate this pod in the

     same node, zone, etc. as some other pod(s)).

     Pod affinity is a group of inter pod affinity scheduling rules.

FIELDS:

   preferredDuringSchedulingIgnoredDuringExecution	<[]Object>

   requiredDuringSchedulingIgnoredDuringExecution	<[]Object>

requiredDuringSchedulingIgnoredDuringExecution： 硬親和性

preferredDuringSchedulingIgnoredDuringExecution：軟親和性

# kubectl explain pods.spec.affinity.podAffinity.requiredDuringSchedulingIgnoredDuringExecution

KIND:     Pod

VERSION:  v1

RESOURCE: requiredDuringSchedulingIgnoredDuringExecution <[]Object>

DESCRIPTION:

FIELDS:

   labelSelector	<Object>

   namespaces	<[]string>

   topologyKey	<string> -required-

topologyKey：

位置拓撲的鍵，這個是必須欄位

怎麼判斷是不是同一個位置：

rack=rack1

row=row1

使用rack的鍵是同一個位置

使用row的鍵是同一個位置

labelSelector：

我們要判斷pod跟別的pod親和，跟哪個pod親和，需要靠labelSelector，通過labelSelector選則一組能作為親和物件的pod資源

namespace：

labelSelector需要選則一組資源，那麼這組資源是在哪個名稱空間中呢，通過namespace指定，如果不指定namespaces，那麼就是當前建立pod的名稱空間

# kubectl explain pods.spec.affinity.podAffinity.requiredDuringSchedulingIgnoredDuringExecution.labelSelector

KIND:     Pod

VERSION:  v1

RESOURCE: labelSelector <Object>

DESCRIPTION:

     A label query over a set of resources, in this case pods.

     A label selector is a label query over a set of resources. The result of

     matchLabels and matchExpressions are ANDed. An empty label selector matches

     all objects. A null label selector matches no objects.

FIELDS:

   matchExpressions	<[]Object>

   matchLabels	<map[string]string>

5.2.1 pod節點親和性

例1：

定義兩個pod，第一個pod做為基準，第二個pod跟著它走

# cat pod-required-affinity-demo.yaml

apiVersion: v1

kind: Pod

metadata:

  name: pod-first

  labels:

    app2: myapp2

    tier: frontend

spec:

    containers:

    - name: myapp

      image: ikubernetes/myapp:v1

---

apiVersion: v1

kind: Pod

metadata:

  name: pod-second

  labels:

    app: backend

    tier: db

spec:

    containers:

    - name: busybox

      image: busybox:latest

      imagePullPolicy: IfNotPresent

      command: ["sh","-c","sleep 3600"]

    affinity:

      podAffinity:

         requiredDuringSchedulingIgnoredDuringExecution:

         - labelSelector:

              matchExpressions:

              - {key: app2, operator: In, values: ["myapp2"]}

           topologyKey: kubernetes.io/hostname

#上面表示建立的pod必須與擁有app=myapp標籤的pod在一個節點上

# kubectl apply -f pod-required-affinity-demo.yaml

kubectl get pods -o wide 顯示如下：

[root@k8s-master1 kubenetes-han]# kubectl get pods -o wide

NAME                          READY   STATUS    RESTARTS   AGE     IP            NODE        NOMINATED NODE   READINESS GATES

pod-first                     1/1     Running   0          24s     10.244.2.5    k8s-node2

pod-second                    1/1     Running   0          24s     10.244.2.6    k8s-node2

上面說明第一個pod排程到哪，第二個pod也排程到哪，這就是pod節點親和性

注意：檢視node節點的標籤可以使用--show-labels檢視

kubectl get nodes --show-labels

5.2.2 Pod節點反親和性

例2：

定義兩個pod，第一個pod做為基準，第二個pod跟它排程節點相反

在master節點編輯yaml檔案

# cat pod-required-anti-affinity-demo.yaml

apiVersion: v1

kind: Pod

metadata:

  name: pod-first

  labels:

    app1: myapp1

    tier: frontend

spec:

    containers:

    - name: myapp

      image: ikubernetes/myapp:v1

---

apiVersion: v1

kind: Pod

metadata:

  name: pod-second

  labels:

    app: backend

    tier: db

spec:

    containers:

    - name: busybox

      image: busybox:latest

      imagePullPolicy: IfNotPresent

      command: ["sh","-c","sleep 3600"]

    affinity:

      podAntiAffinity:

         requiredDuringSchedulingIgnoredDuringExecution:

         - labelSelector:

              matchExpressions:

              - {key: app1, operator: In, values: ["myapp1"]}

           topologyKey: kubernetes.io/hostname

# kubectl apply -f pod-required-anti-affinity-demo.yaml

# 顯示兩個pod不在一個node節點上，這就是pod節點反親和性

[root@k8s-master1 kubenetes-han]# kubectl get pods -o wide

pod-first                     1/1     Running   0          4s      10.244.2.7    k8s-node2

pod-second                    1/1     Running   0          4s      10.244.1.22   k8s-node1

# kubectl delete -f pod-required-anti-affinity-demo.yaml

例3：換一個topologykey

[root@k8s-master1 kubenetes-han]# kubectl label nodes k8s-node1  zone=foo

[root@k8s-master1 kubenetes-han]# kubectl label nodes k8s-node2  zone=foo --overwrite

# cat pod-first-required-anti-affinity-demo-1.yaml

apiVersion: v1

kind: Pod

metadata:

  name: pod-first

  labels:

    app3: myapp3

    tier: frontend

spec:

    containers:

    - name: myapp

      image: ikubernetes/myapp:v1

# cat pod-second-required-anti-affinity-demo-1.yaml

apiVersion: v1

kind: Pod

metadata:

  name: pod-second

  labels:

    app: backend

    tier: db

spec:

    containers:

    - name: busybox

      image: busybox:latest

      imagePullPolicy: IfNotPresent

      command: ["sh","-c","sleep 3600"]

    affinity:

      podAntiAffinity:

         requiredDuringSchedulingIgnoredDuringExecution:

         - labelSelector:

              matchExpressions:

              - {key: app3 ,operator: In, values: ["myapp3"]}

           topologyKey:  zone

[root@k8s-master1 kubenetes-han]# kubectl apply -f  pod-first-required-anti-affinity-demo-1.yaml

pod/pod-first created

[root@k8s-master1 kubenetes-han]# kubectl apply -f  pod-second-required-anti-affinity-demo-1.yaml

pod/pod-second created

[root@k8s-master1 kubenetes-han]# kubectl get pod -o wide顯示如下：

第二個pod現在是pending，因為兩個節點是同一個位置，現在沒有不是同一個位置的了，而且我們要求反親和性，所以就會處於pending狀態，如果在反親和性這個位置把required改成preferred，那麼也會執行。

podaffinity：pod節點親和性，pod傾向於哪個pod

nodeaffinity：node節點親和性，pod傾向於哪個node

6、汙點、容忍度

給了節點選則的主動權，我們給節點打一個汙點，不容忍的pod就執行不上來，汙點就是定義在節點上的鍵值屬性資料，可以定決定拒絕那些pod；

taints是鍵值資料，用在節點上，定義汙點；

tolerations是鍵值資料，用在pod上，定義容忍度，能容忍哪些汙點

pod親和性是pod屬性；但是汙點是節點的屬性，汙點定義在nodeSelector上

# kubectl describe nodes k8s-master1

Taints: node-role.kubernetes.io/master:NoSchedule

# kubectl explain node.spec.taints

KIND:     Node

VERSION:  v1

RESOURCE: taints <[]Object>

DESCRIPTION:

     If specified, the node's taints.

     The node this Taint is attached to has the "effect" on any pod that does

     not tolerate the Taint.

FIELDS:

   effect	<string> -required-

   key	<string> -required-

   timeAdded	<string>

   value	<string>

taints的effect用來定義對pod物件的排斥等級（效果）：

NoSchedule：

僅影響pod排程過程，當pod能容忍這個節點汙點，就可以排程到當前節點，後來這個節點的汙點改了，加了一個新的汙點，使得之前排程的pod不能容忍了，那這個pod會怎麼處理，對現存的pod物件不產生影響

NoExecute：

既影響排程過程，又影響現存的pod物件，如果現存的pod不能容忍節點後來加的汙點，這個pod就會被驅逐

PreferNoSchedule：

最好不，也可以，是NoSchedule的柔性版本

在pod物件定義容忍度的時候支援兩種操作：

1.等值金鑰：key和value上完全匹配

2.存在性判斷：key和effect必須同時匹配，value可以是空

在pod上定義的容忍度可能不止一個，在節點上定義的汙點可能多個，需要琢個檢查容忍度和汙點能否匹配，每一個汙點都能被容忍，才能完成排程，如果不能容忍怎麼辦，那就需要看pod的容忍度了

# kubectl describe nodes k8s-master1

檢視master這個節點是否有汙點，顯示如下：

上面可以看到master這個節點的汙點是Noschedule

所以我們建立的pod都不會排程到master上，因為我們建立的pod沒有容忍度

kubectl describe pods kube-apiserver-k8s-master1 -n kube-system

顯示如下

可以看到這個pod的容忍度是NoExecute，則可以排程到k8s-master1上

6.1 管理節點汙點

[root@k8s-master1]# kubectl taint –help

例1：把k8s-node2當成是生產環境專用的，其他node是測試的，先打個汙點

[root@k8s-master1 taint]# kubectl taint node k8s-node2 node-type=production:NoSchedule

node/k8s-node2 tainted

[root@k8s-master1 taint]# cat pod-taint.yaml

apiVersion: v1

kind: Pod

metadata:

  name: taint-pod

  namespace: default

  labels:

    tomcat:  tomcat-pod

spec:

  containers:

  - name:  taint-pod

    ports:

    - containerPort: 8080

    image: tomcat:8.5-jre8-alpine

    imagePullPolicy: IfNotPresent

檢視一下pod唄排程到哪個節點了

[root@k8s-master1 taint]# kubectl get pods -o wide

NAME                          READY   STATUS    RESTARTS   AGE     IP            NODE

taint-pod                     1/1     Running   0          20s     10.244.1.23   k8s-node1

可以看到都被排程到k8s-node1上了，因為k8s-node2這個節點打了汙點，而我們在建立pod的時候沒有容忍度，所以k8s-node2上不會有pod排程上去的

例2：給k8s-node1也打上汙點

[root@k8s-master1 taint]# kubectl taint node k8s-node1  node-type=dev:NoExecute

node/k8s-node1 tainted

[root@k8s-master1 taint]# kubectl get pods -o wide

如下圖，可以看到node1已經存在的pod節點都被攆走了

[root@k8s-master1 taint]# cat pod-demo-1.yaml

apiVersion: v1

kind: Pod

metadata:

  name: myapp-deploy

  namespace: default

  labels:

    app: myapp

    release: canary

spec:

      containers:

      - name: myapp

        image: ikubernetes/myapp:v1

        ports:

        - name: http

          containerPort: 80

      tolerations:

      - key: "node-type"

        operator: "Equal"

        value: "production"

        effect: "NoExecute"

        tolerationSeconds: 3600

myapp-deploy 1/1 Pending 0 11s k8s-node2

還是顯示pending，因為我們使用的是equal（等值匹配），所以key和value，effect必須和node節點定義的汙點完全匹配才可以，把上面配置effect: "NoExecute"變成

effect: "NoSchedule"成；

tolerationSeconds: 3600這行去掉

先delete掉上面建立的pod後在修改，修改後重新應用。

上面就可以排程到k8s-node2上了，因為在pod中定義的容忍度能容忍node節點上的汙點

例3：再次修改

修改如下部分：

tolerations:

- key: "node-type"

operator: "Exists"

value: ""

effect: "NoSchedule"

只要對應的鍵是存在的，exists，其值被自動定義成萬用字元

# kubectl delete -f pod-demo-1.yaml

# kubectl apply -f pod-demo-1.yaml

# kubectl get pods

發現還是排程到k8s-node2上

myapp-deploy 1/1 running 0 11s k8s-node2

最後刪除汙點：

[root@k8s-master1 taint]#kubectl taint nodes k8s-node1 node-type:NoExecute-

node/k8s-node1 untainted

[root@k8s-master1 taint]# kubectl taint nodes k8s-node2 node-type:NoSchedule-

node/k8s-node2 untainted

7、Pod常見的狀態和重啟策略

7.1 常見的pod狀態

Pod的status定義在PodStatus物件中，其中有一個phase欄位。它簡單描述了Pod在其生命週期的階段。熟悉Pod的各種狀態對我們理解如何設定Pod的排程策略、重啟策略是很有必要的。下面是 phase 可能的值，也就是pod常見的狀態：

掛起（Pending）：我們在請求建立pod時，條件不滿足，排程沒有完成，沒有任何一個節點能滿足排程條件，已經建立了pod但是沒有適合它執行的節點叫做掛起，排程沒有完成，處於pending的狀態會持續一段時間：包括排程Pod的時間和通過網路下載映象的時間。

執行中（Running）：Pod已經繫結到了一個節點上，Pod 中所有的容器都已被建立。至少有一個容器正在執行，或者正處於啟動或重啟狀態。

成功（Succeeded）：Pod 中的所有容器都被成功終止，並且不會再重啟。

失敗（Failed）：Pod 中的所有容器都已終止了，並且至少有一個容器是因為失敗終止。也就是說，容器以非0狀態退出或者被系統終止。

未知（Unknown）：未知狀態，所謂pod是什麼狀態是apiserver和執行在pod節點的kubelet進行通訊獲取狀態資訊的，如果節點之上的kubelet本身出故障，那麼apiserver就連不上kubelet，得不到資訊了，就會看Unknown

擴充套件：還有其他狀態，如下：

Evicted狀態：出現這種情況，多見於系統記憶體或硬碟資源不足，可df-h檢視docker儲存所在目錄的資源使用情況，如果百分比大於85%，就要及時清理下資源，尤其是一些大檔案、docker映象。

CrashLoopBackOff：容器曾經啟動了，但可能又異常退出了

Error 狀態：Pod 啟動過程中發生了錯誤

7.2 pod重啟策略

Pod的重啟策略（RestartPolicy）應用於Pod內的所有容器，並且僅在Pod所處的Node上由kubelet進行判斷和重啟操作。當某個容器異常退出或者健康檢查失敗時，kubelet將根據 RestartPolicy 的設定來進行相應的操作。

Pod的重啟策略包括 Always、OnFailure和Never，預設值為Always。

Always：當容器失敗時，由kubelet自動重啟該容器。

OnFailure：當容器終止執行且退出碼不為0時，由kubelet自動重啟該容器。

Never：不論容器執行狀態如何，kubelet都不會重啟該容器。

[root@k8s-master1 ~]# vim pod.yaml

apiVersion: v1

kind: Pod

metadata:

name: demo-pod

namespace: default

labels:

app: myapp

spec:

restartPolicy: Always

containers:

name: tomcat-pod-java

ports:
- containerPort: 8080
  
  image: tomcat:8.5-jre8-alpine
  
  imagePullPolicy: IfNotPresent

8、Pod生命週期

概念圖

8.1 Init容器

Pod 裡面可以有一個或者多個容器，部署應用的容器可以稱為主容器，在建立Pod時候，Pod 中可以有一個或多個先於主容器啟動的Init容器,這個init容器就可以成為初始化容器，初始化容器一旦執行完，它從啟動開始到初始化程式碼執行完就退出了，它不會一直存在，所以在主容器啟動之前執行初始化，初始化容器可以有多個，多個初始化容器是要序列執行的，先執行初始化容器1，在執行初始化容器2等，等初始化容器執行完初始化就退出了，然後再執行主容器，主容器一退出，pod就結束了，主容器退出的時間點就是pod的結束點，它倆時間軸是一致的；

Init容器就是做初始化工作的容器。可以有一個或多個，如果多個按照定義的順序依次執行，只有所有的初始化容器執行完後，主容器才啟動。由於一個Pod裡的儲存卷是共享的，所以Init Container裡產生的資料可以被主容器使用到，Init Container可以在多種K8S資源裡被使用到，如Deployment、DaemonSet, StatefulSet、Job等，但都是在Pod啟動時，在主容器啟動前執行，做初始化工作。

Init容器與普通的容器區別是:

1、Init 容器不支援 Readiness,因為它們必須在Pod就緒之前執行完成

2、每個Init容器必須執行成功,下一個才能夠執行

3、如果 Pod 的 Init 容器失敗,Kubernetes 會不斷地重啟該 Pod,直到 Init 容器成功為止，然而,如果Pod對應的restartPolicy值為 Never,它不會重新啟動。

初始化容器的官方地址：

https://kubernetes.io/docs/concepts/workloads/pods/init-containers/#init-containers-in-use

訪問官方文件

在本機也編輯一個yaml

[root@k8s-master1 init-pod]# cat init-pod.yaml

apiVersion: v1

kind: Pod

metadata:

  name: myapp-pod

  labels:

    app: myapp

spec:

  containers:

  - name: myapp-container

    image: busybox:1.28

    command: ['sh', '-c', 'echo The app is running! && sleep 3600']

  initContainers:

  - name: init-myservice

    image: busybox:1.28

    command: ['sh', '-c', "until nslookup myservice.$(cat /var/run/secrets/kubernetes.io/serviceaccount/namespace).svc.cluster.local; do echo waiting for myservice; sleep 2; done"]

  - name: init-mydb

    image: busybox:1.28

    command: ['sh', '-c', "until nslookup mydb.$(cat /var/run/secrets/kubernetes.io/serviceaccount/namespace).svc.cluster.local; do echo waiting for mydb; sleep 2; done"]

更新yaml檔案,此檔案一直處於初始化階段

[root@k8s-master1 init-pod]# kubectl get pod

NAME                          READY   STATUS             RESTARTS   AGE

myapp-pod                     0/1     Init:0/2           0          3m17s

可以通過kubectl describe pod myapp-pod檢視一下pod相關資訊

有兩個容器需要先進行初始化後才能繼續，

kubectl logs myapp-pod -c init-myservice # Inspect the first init container

kubectl logs myapp-pod -c init-mydb # Inspect the second init container

yaml檔案中定義的需要解析db的服務，因為我們還沒有建立所以一直卡在這，按著官網文件先進行建立一個

\---

apiVersion: v1

kind: Service

metadata:

  name: myservice

spec:

  ports:

  - protocol: TCP

    port: 80

    targetPort: 9376

\---

apiVersion: v1

kind: Service

metadata:

  name: mydb

spec:

  ports:

  - protocol: TCP

    port: 80

    targetPort: 9377

8.2 主容器

1、容器鉤子

初始化容器啟動之後，開始啟動主容器，在主容器啟動之前有一個post start hook（容器啟動後鉤子）和pre stop hook（容器結束前鉤子），無論啟動後還是結束前所做的事我們可以把它放兩個鉤子，這個鉤子就表示使用者可以用它來鉤住一些命令，來執行它，做開場前的預設，結束前的清理，如awk有begin，end，和這個效果類似；

postStart：該鉤子在容器被建立後立刻觸發，通知容器它已經被建立。如果該鉤子對應的hook handler執行失敗，則該容器會被殺死，並根據該容器的重啟策略決定是否要重啟該容器，這個鉤子不需要傳遞任何引數。

preStop：該鉤子在容器被刪除前觸發，其所對應的hook handler必須在刪除該容器的請求傳送給Docker daemon之前完成。在該鉤子對應的hook handler完成後不論執行的結果如何，Docker daemon會發送一個SGTERN訊號量給Docker daemon來刪除該容器，這個鉤子不需要傳遞任何引數。

在k8s中支援兩類對pod的檢測，第一類叫做livenessprobe（pod存活性探測）：

存活探針主要作用是，用指定的方式檢測pod中的容器應用是否正常執行，如果檢測失敗，則認為容器不健康，那麼Kubelet將根據Pod中設定的 restartPolicy來判斷Pod 是否要進行重啟操作，如果容器配置中沒有配置 livenessProbe，Kubelet 將認為存活探針探測一直為成功狀態。

第二類是狀態檢readinessprobe（pod就緒性探測）：用於判斷容器中應用是否啟動完成，當探測成功後才使Pod對外提供網路訪問，設定容器Ready狀態為true，如果探測失敗，則設定容器的Ready狀態為false。

8.3 建立pod需要經過哪些階段？

當用戶建立pod時，這個請求給apiserver，apiserver把建立請求的狀態儲存在etcd中；

接下來apiserver會請求scheduler來完成排程，如果排程成功，會把排程的結果（如排程到哪個節點上了，執行在哪個節點上了，把它更新到etcd的pod資源狀態中）儲存在etcd中，一旦存到etcd中並且完成更新以後，如排程到k8s-master1上，那麼k8s-master1節點上的kubelet通過apiserver當中的狀態變化知道有一些任務被執行了，所以此時此kubelet會拿到使用者建立時所提交的清單，這個清單會在當前節點上執行或者啟動這個pod，如果建立成功或者失敗會有一個當前狀態，當前這個狀態會發給apiserver，apiserver在存到etcd中；在這個過程中，etcd和apiserver一直在打交道，不停的互動，scheduler也參與其中，負責排程pod到合適的node節點上，這個就是pod的建立過程

pod在整個生命週期中有非常多的使用者行為：

1、初始化容器完成初始化

2、主容器啟動後可以做啟動後鉤子

3、主容器結束前可以做結束前鉤子

4、在主容器執行中可以做一些健康檢測，如liveness probe，readness probe

k8s核心資源之namespace與pod汙點容忍度生命週期進階篇(四)

k8s核心資源之namespace與pod汙點容忍度生命週期進階篇(四)

1、名稱空間namespace

1.1 什麼是名稱空間？

1.2 namespace應用場景

1.3 namespacs常用指令

1.4 namespace資源限額

2、標籤

2.1 什麼是標籤？

2.2 如何給pod資源打標籤

2.3 檢視資源標籤

3、node節點選擇器

4、nodeSelector：

5、親和性

5.1 node節點親和性

5.1.1 硬親和性

5.1.2 軟親和性

5.2 Pod節點親和性

5.2.1 pod節點親和性

5.2.2 Pod節點反親和性

6、汙點、容忍度

6.1 管理節點汙點

7、Pod常見的狀態和重啟策略

7.1 常見的pod狀態

7.2 pod重啟策略

8、Pod生命週期

8.1 Init容器

8.2 主容器

8.3 建立pod需要經過哪些階段？

k8s核心資源之namespace與pod汙點容忍度生命週期進階篇(四)

k8s核心資源之namespace與pod汙點容忍度生命週期進階篇(四)

1、名稱空間namespace

1.1 什麼是名稱空間？

1.2 namespace應用場景

1.3 namespacs常用指令

1.4 namespace資源限額

2、標籤

2.1 什麼是標籤？

2.2 如何給pod資源打標籤

2.3 檢視資源標籤

3、node節點選擇器

4、nodeSelector：

5、親和性

5.1 node節點親和性

5.1.1 硬親和性

5.1.2 軟親和性

5.2 Pod節點親和性

5.2.1 pod節點親和性

5.2.2 Pod節點反親和性

6、汙點、容忍度

6.1 管理節點汙點

7、Pod常見的狀態和重啟策略

7.1 常見的pod狀態

7.2 pod重啟策略

8、Pod生命週期

8.1 Init容器

8.2 主容器

8.3 建立pod需要經過哪些階段？

最新文章