【K8s】专题六（3）：Kubernetes 稳定性之自动扩缩容

以下内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发！欢迎扫码关注个人公众号！

公众号二维码

一、基本介绍

在 Kubernetes 中，自动扩缩容是一种动态调整集群资源，以灵活应对应用程序资源需求变化的机制。

自动扩缩容可以分为两个层面：

Node 层面：根据业务规模，实现集群节点的自动扩缩容
Pod 层面：根据业务规模，实现 Pod 副本的自动扩缩容

自动扩缩容提供了以下好处：

提高资源利用率：根据实际需求动态调整资源，避免资源浪费
提高应用稳定性和可用性：自动应对流量高峰，减少服务中断的风险
简化运维：减少手动干预，自动化资源管理，简化运维工作
成本效益：通过合理的资源分配，降低运营成本

本文将重点介绍几种常见的 Pod 层面自动扩缩容机制。

二、HPA 机制

Pod 水平自动伸缩（Horizontal Pod Autoscaler，HPA）是 Kubernetes 中最常见的自动扩缩容方式，它可以根据 Pod 实际的负载情况自动增加或减少 Pod 副本的数量。

HPA的工作原理如下：

度量指标：HPA 可以根据 CPU 利用率、内存利用率或其他自定义度量指标来触发扩缩容
目标利用率：设置目标利用率，例如 CPU 的 10%，HPA 会尝试维持这个利用率水平
限制 Pod 数量：可以设置最小和最大 Pod 数量的限制，防止在极端情况下资源的过度使用或不足
缩放策略：HPA 支持不同的缩放策略，如快速缩放、慢速缩放和标准缩放，以适应不同的业务场景

# 创建 HPA 对象
kubectl autoscale deployment demo-deployment --cpu-percent=10 --min=1 --max=10
🔔 --min：指定最小的 Pod 副本数为1
🔔 --max：指定最大的 Pod 副本数为10
🔔 --cpu-percent：指定 Pod 的 CPU 使用率保持在 10%# 查看 HPA 对象
kubectl get hpa# 删除 HPA 对象
kubectl delete hpa demo-deployment