Kubernetes - 实战(5)

20、Kubernetes - 实战：HPA部署（基于Metrics-Server监控CPU利用率的实现pod自动伸缩）

一、HPA简介

Horizontal Pod Autoscaler 可以根据CPU利用率自动伸缩 replication controller、deployment 或者 replica set 中的Pod数量（也可以基于其他应用程序提供的度量指标，目前这一功能处于 beta 版本）。

metrics-server 也需要部署到集群中，它可以通过 resource metrics API 对外提供度量数据，Horizontal Pod Autoscaler 正是根据此 API 来获取度量数据

二、HPA实例

运行 php-apache 服务器并暴露服务

为了演示 Horizontal Pod Autoscaler，我们将使用一个叫 hpa-example的基于php-apache定制 Docker 镜像。 Dockerfile 内容如下：

FROM php:5-apache
ADD index.php /var/www/html/index.php
RUN chmod a+rx index.php

它定义一个 index.php 页面来执行一些 CPU 密集型计算：

<?php
  $x = 0.0001;
  for ($i = 0; $i <= 1000000; $i++) {
   
     
    $x += sqrt($x);
  }
  echo "OK!";
?>

首先，我们先启动一个 deployment 来运行这个镜像并暴露一个服务:

[root@server1 hpa]# vim php-apache.yaml 
[root@server1 hpa]# cat php-apache.yaml 
apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-apache
spec:
  selector:
    matchLabels:
      run: php-apache
  replicas: 1
  template:
    metadata:
      labels:
        run: php-apache
    spec:
      containers:
      - name: php-apache
        image: hpa-example
        ports:
        - containerPort: 80
        resources:
          limits:
            cpu: 500m
          requests:
            cpu: 200m

---

apiVersion: v1
kind: Service
metadata:
  name: php-apache
  labels:
    run: php-apache
spec:
  ports:
  - port: 80
  selector:
    run: php-apache

其中需要的镜像hpa-example可以在docker hub拉取，先在运行这个部署文件：

[root@server1 hpa]# kubectl apply -f php-apache.yaml 
deployment.apps/php-apache created
service/php-apache created

查看状态，可以看出该部署文件创建了一个由deployment控制器维护的pod，以及一个service：

[root@server1 hpa]# kubectl get all
NAME                                          READY   STATUS    RESTARTS   AGE
pod/nfs-client-provisioner-6b66ddf664-rxw77   1/1     Running   0          15m
pod/php-apache-dfb6d784b-jvntc                1/1     Running   0          2m7s

NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGE
service/kubernetes   ClusterIP   10.96.0.1       <none>        443/TCP   23d
service/php-apache   ClusterIP   10.99.210.255   <none>        80/TCP    2m7s

NAME                                     READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/nfs-client-provisioner   1/1     1            1           4d1h
deployment.apps/php-apache               1/1     1            1           2m8s

NAME                                                DESIRED   CURRENT   READY   AGE
replicaset.apps/nfs-client-provisioner-6b66ddf664   1         1         1       4d1h
replicaset.apps/php-apache-dfb6d784b                1         1         1       2m8s

NAME                   READY   AGE
statefulset.apps/web   0/0     4d

创建 Horizontal Pod Autoscaler

现在，php-apache服务器已经运行，我们将通过 kubectl autoscale 命令创建 Horizontal Pod Autoscaler。以下命令将创建一个 Horizontal Pod Autoscaler 用于控制我们上一步骤中创建的 deployment，使 Pod 的副本数量在维持在1到10之间。大致来说，HPA 将通过增加或者减少 Pod 副本的数量（通过 Deployment ）以保持所有 Pod 的平均CPU利用率在50%以内（由于每个 Pod 通过 yaml文件申请了200 milli-cores CPU，所以50%的 CPU 利用率意味着平均 CPU 利用率为100 milli-cores）。

[root@server1 hpa]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
horizontalpodautoscaler.autoscaling/php-apache autoscaled
horizontalpodautoscaler.autoscaling/php-apache autoscaled

我们可以通过以下命令查看 autoscaler 的状态：

[root@server1 hpa]# kubectl get hpa
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        1          19s
kubectl get hpa

请注意在上面的命令输出中，当前的CPU利用率是0%，这是由于我们尚未发送任何请求到服务器（CURRENT 列显示了相应 deployment 所控制的所有 Pod 的平均 CPU 利用率）。

增加负载

现在，我们将看到 autoscaler 如何对增加负载作出反应。我们将启动一个容器，并通过一个循环向 php-apache 服务器发送无限的查询请求：

[root@server1 hpa]# kubectl get svc
NAME         TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1       <none>        443/TCP   23d
php-apache   ClusterIP   10.99.210.255   <none>        80/TCP    4m32s
[root@server1 hpa]# kubectl run test --image=busybox -it --rm --restart=Never
If you don't see a command prompt, try pressing enter.
/ while true; do wget -q -O- http://10.99.210.255; done

在几分钟时间内，通过以下命令，我们可以看到CPU负载升高了（在另一个终端查看）：

[root@server1 ~]# kubectl get hpa
NAME         REFERENCE               TARGETS    MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   250%/50%   1         10        1          4m22s

这时，由于请求增多，CPU利用率已经升至250%。可以看到，deployment 的副本数量已经增长到了5：

[root@server1 ~]# kubectl get hpa
NAME         REFERENCE               TARGETS    MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   250%/50%   1         10        5          5m1s

查看pod的资源使用情况：

[root@server1 ~]# kubectl top pod
NAME                                      CPU(cores)   MEMORY(bytes)   
nfs-client-provisioner-6b66ddf664-rxw77   1m           3Mi             
php-apache-dfb6d784b-jvntc                500m         14Mi            
test                                      5m           1Mi             
[root@server1 ~]# kubectl top pod
NAME                                      CPU(cores)   MEMORY(bytes)   
nfs-client-provisioner-6b66ddf664-rxw77   1m           7Mi             
php-apache-dfb6d784b-jvntc                147m         21Mi            
php-apache-dfb6d784b-lsfgp                150m         12Mi            
php-apache-dfb6d784b-vx8rn                134m         11Mi            
test                                      4m           1Mi             
[root@server1 ~]# kubectl top pod
NAME                                      CPU(cores)   MEMORY(bytes)   
nfs-client-provisioner-6b66ddf664-rxw77   1m           7Mi             
php-apache-dfb6d784b-7zb9t                0m           0Mi             
php-apache-dfb6d784b-jvntc                147m         21Mi            
php-apache-dfb6d784b-lsfgp                150m         12Mi            
php-apache-dfb6d784b-pprhd                0m           0Mi             
php-apache-dfb6d784b-vx8rn                134m         11Mi            
test                                      4m           1Mi

注意：有时最终副本的数量可能需要几分钟才能稳定下来。由于环境的差异，不同环境中最终的副本数量可能与本示例中的数量不同。

停止负载

我们将通过停止负载来结束我们的示例。

在我们创建 busybox 容器的终端中，输入 + C来终止负载的产生。

然后我们可以再次查看负载状态（等待几分钟时间）：

[root@server1 ~]# kubectl get hpa
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        1          13m

这时，CPU利用率已经降到0，所以 HPA 将自动缩减副本数量至1。

注意：自动伸缩完成副本数量的改变可能需要几分钟的时间。

三、HPA的伸缩过程

HPA伸缩过程

收集HPA控制下所有Pod最近的cpu使用情况（CPU utilization）
对比在扩容条件里记录的cpu限额（CPUUtilization）
调整实例数（必须要满足不超过最大/最小实例数）
每隔30s做一次自动扩容的判断

CPUutilization的计算方法是用cpu usage（最近一分钟的平均值，通过metrics可以直接获取到）除以cpu request（这里cpu request就是我们在创建容器时制定的cpu使用核心数）得到一个平均值，这个平均值可以理解为：平均每个Pod CPU核心的使用占比。

上例中我们的cpu request为200m（在部署文件中定义），在负载开始时我们的cpu usage为500m，因此上例的CPU utilization为500/200=2.5.
HPA进行伸缩算法

目标pod数量计算公式：TargetNumOfPods = ceil(sum(CurrentPodsCPUUtilization) / Target)

ceil()表示取大于或等于某数的最近一个整数。

为了保持集群的稳定，每次扩容后冷却3分钟才能再次进行扩容，而缩容则要等5分钟后。
当前Pod Cpu使用率与目标使用率接近时，不会触发扩容或缩容：
触发条件：avg(CurrentPodsConsumption) / Target >1.1 或 <0.9

上例中的target我们定义的是50%，因此TargetNumOfPods = ceil(2.5 /0.5)=5

因此目标pod数量应该为5,最后的结果也验证了我们的计算。

上例中在扩展pod数量时中间还有一个过程：

[root@server1 ~]# kubectl top pod
NAME                                      CPU(cores)   MEMORY(bytes)   
nfs-client-provisioner-6b66ddf664-rxw77   1m           7Mi             
php-apache-dfb6d784b-jvntc                147m         21Mi            
php-apache-dfb6d784b-lsfgp                150m         12Mi            
php-apache-dfb6d784b-vx8rn                134m         11Mi            
test                                      4m           1Mi

可以看出此时有三个pod，cpu利用率为147，150，134

这时avg(CurrentPodsConsumption)=（（147+150+134）/3）/200=0.718，触发条件为0.718/0.5=1.43 > 1.1,因此还会触发扩容，扩容的目标pod数量为（（147+150+134）/200）/0.5=4.31，取整为5，因此我们再次查看时副本数变成了5个。

四、引入其他度量指标

利用autoscaling/v2beta2API版本，您可以在自动伸缩 php-apache 这个 Deployment 时引入其他度量指标。

[root@server1 hpa]# vim hpav2.yaml 
[root@server1 hpa]# cat hpav2.yaml 
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
spec:
  maxReplicas: 10
  minReplicas: 1
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        averageUtilization: 60
        type: Utilization
  - type: Resource
    resource:
      name: memory
      target:
        averageValue: 50Mi
        type: AverageValue

[root@server1 hpa]# kubectl apply -f hpav2.yaml 
Warning: kubectl apply should be used on resource created by either kubectl create --save-config or kubectl apply
horizontalpodautoscaler.autoscaling/php-apache configured

[root@server1 hpa]# kubectl get hpa
NAME         REFERENCE               TARGETS                 MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   13824512/50Mi, 0%/60%   1         10        8          26m

查看hpa时可以看出已经有了cpu的指标，单位时字节。

这里就不进行演示。

实验后删除：

[root@server1 hpa]# kubectl delete -f php-apache.yaml 
deployment.apps "php-apache" deleted
service "php-apache" deleted
[root@server1 hpa]# kubectl delete -f hpav2.yaml
horizontalpodautoscaler.autoscaling "php-apache" deleted