K8s HPA的常用功能介绍

Kubernetes 的 Horizontal Pod Autoscaler (HPA) 是一种自动扩展功能,用于根据资源使用情况(如 CPU、内存等)或自定义指标,动态调整 Pod 的副本数量,从而保证应用的性能和资源利用率。

以下是 HPA 的常用功能介绍:


1. 自动伸缩 (Auto Scaling)

HPA 的核心功能是根据指标动态调整应用的 Pod 副本数。其伸缩规则基于设定的目标指标,自动增加或减少 Pod 数量,从而满足应用负载的变化需求。

  • 扩容:当资源使用量超出设定的目标时,HPA 增加 Pod 副本数。
  • 缩容:当资源使用量低于目标时,HPA 减少 Pod 副本数,节省资源。

2. 基于 CPU/内存的扩缩容

HPA 最常见的应用场景是基于 CPU 或内存的使用率:

  • CPU 使用率:例如,将目标 CPU 使用率设为 50%,当实际使用率超过 50% 时,HPA 会扩容,直到使用率恢复到目标值以下。
  • 内存使用率:类似的,基于内存使用率调整 Pod 的副本数。

配置示例:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:name: my-app-hpa
spec:scaleTargetRef:apiVersion: apps/v1kind: Deploymentname: my-appminReplicas: 2maxReplicas: 10metrics:- type: Resourceresource:name: cputarget:type: UtilizationaverageUtilization: 50

3. 基于自定义指标 (Custom Metrics)

除了 CPU 和内存,HPA 还可以使用自定义指标(Custom Metrics)作为扩缩容的依据。例如:

  • 请求速率(如 QPS 或 RPS)。
  • 消息队列长度(如 Kafka、RabbitMQ 中的未处理消息数)。
  • 业务指标(如订单数量、活跃用户数)。

配置示例:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:name: custom-metrics-hpa
spec:scaleTargetRef:apiVersion: apps/v1kind: Deploymentname: custom-appminReplicas: 3maxReplicas: 15metrics:- type: Podspods:metric:name: custom_metric_requeststarget:type: AverageValueaverageValue: 100

要实现自定义指标,需要使用 Kubernetes 的 Custom Metrics API,并配置监控工具(如 Prometheus + Adapter)。


4. 多指标扩缩容 (Multiple Metrics)

HPA 支持使用多个指标进行扩缩容决策。例如,基于 CPU 和自定义业务指标同时监控,满足任何一个条件都会触发扩缩容。

配置示例:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:name: multi-metrics-hpa
spec:scaleTargetRef:apiVersion: apps/v1kind: Deploymentname: multi-appminReplicas: 1maxReplicas: 20metrics:- type: Resourceresource:name: cputarget:type: UtilizationaverageUtilization: 60- type: Podspods:metric:name: custom_metric_latencytarget:type: AverageValueaverageValue: 200

5. 动态最小/最大副本数

HPA 支持根据负载动态调整副本数,但需要明确设定:

  • 最小副本数 (minReplicas):保证服务在负载低时不会缩容到 0,确保高可用。
  • 最大副本数 (maxReplicas):防止因负载异常导致的过度扩容,保护集群资源。

6. 支持 VPA 与 HPA 的组合使用

虽然 HPA 负责横向扩展(调整 Pod 数量),但 Kubernetes 还提供 Vertical Pod Autoscaler (VPA),用于纵向扩展(调整单个 Pod 的资源限制)。两者可以结合使用:

  • HPA 动态调整 Pod 数量。
  • VPA 动态调整 Pod 的资源分配(如 CPU 和内存限制)。

7. 适配不同的工作负载

HPA 可以应用于多种工作负载类型,包括:

  • Deployment(常见应用工作负载)。
  • ReplicaSet(控制特定版本的副本数)。
  • StatefulSet(有状态应用)。
  • Job 和 CronJob(扩缩容运行的任务)。

8. 冷却时间 (Cooldown Time)

HPA 通过 --horizontal-pod-autoscaler-downscale-stabilization 和其他参数,设置扩容和缩容的稳定时间,避免频繁扩缩容导致的不稳定。


9. 与监控工具集成

HPA 通常依赖监控系统提供指标数据,例如:

  • Kubernetes Metrics Server(默认支持 CPU 和内存)。
  • Prometheus(结合 Prometheus Adapter 支持自定义指标)。
  • Datadog、New Relic 等云监控工具

10. HPA 限制和注意事项

  • 指标延迟:采集和响应指标存在一定延迟。
  • 最低副本数:HPA 不支持将 minReplicas 设置为 0,需结合 Kubernetes 的 CronJob 或 Knative 实现零实例。
  • 资源预留:确保节点有足够的资源分配新 Pod,避免扩容失败。

总结

HPA 是 Kubernetes 集群中高效、灵活的扩展机制,通过动态调整 Pod 副本数来应对负载变化,保障应用性能。结合自定义指标、监控工具和资源管理,HPA 能帮助开发团队实现更高效的资源利用和服务稳定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/494279.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++读写.xlsx文件】OpenXLSX开源库在 Ubuntu 18.04 的编译、交叉编译与使用教程

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 ⏰发布时间⏰: 2024-12-17 …

大数据、人工智能、云计算、物联网、区块链序言【大数据导论】

这里是阿川的博客,祝您变得更强 ✨ 个人主页:在线OJ的阿川 💖文章专栏:大数据入门到进阶 🌏代码仓库: 写在开头 现在您看到的是我的结论或想法,但在这背后凝结了大量的思考、经验和讨论 这是目…

ffmpeg翻页转场动效的安装及使用

文章目录 前言一、背景二、选型分析2.1 ffmpeg自带的xfade滤镜2.2 ffmpeg使用GL Transition库2.3 xfade-easing项目三、安装3.1、安装依赖([参考](https://trac.ffmpeg.org/wiki/CompilationGuide/macOS#InstallingdependencieswithHomebrew))3.2、获取ffmpeg源码3.3、融合xf…

什么是3DEXPERIENCE SOLIDWORKS,它有哪些角色和功能?

将业界领先的 SOLIDWORKS 3D CAD 解决方案连接到基于单一云端产品开发环境 3DEXPERIENCE 平台。您的团队、数据和流程全部连接到一个平台进行高效的协作工作,从而能快速的做出更好的决策。 目 录: ★ 1 什么是3DEXPERIENCE SOLIDWORKS ★ 2 3DEXPERIE…

如何正确计算显示器带宽需求

1. 对显示器的基本认识 一个显示器的参数主要有这些: 分辨率:显示器屏幕上像素点的总数,通常用横向像素和纵向像素的数量来表示,比如19201080(即1080p)。 刷新率:显示器每秒钟画面更新的次数&…

leetcode212. 单词搜索 II

给定一个 m x n 二维字符网格 board 和一个单词(字符串)列表 words, 返回所有二维网格上的单词 。 单词必须按照字母顺序,通过 相邻的单元格 内的字母构成,其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一…

CTFHUB 历年真题 afr-1

发现传参为 ?phello,尝试 ?pflag 发现都是 no 尝试假设它是个PHP文件,利用php伪协议 ?pphp://filter/readconvert.base64-encode/resourceflag 得到 base64 编码再解码发现了本题的 flag n1book{afr_1_solved}

重拾设计模式--备忘录模式

文章目录 备忘录模式(Memento Pattern)概述定义: 作用:实现状态的保存与恢复支持撤销 / 恢复操作 备忘录模式UML图备忘录模式的结构原发器(Originator):备忘录(Memento)&…

5G -- 5G网络架构

5G组网场景 从4G到5G的网络演进: 1、UE -> 4G基站 -> 4G核心网 * 部署初中期,利用存量网络,引入5G基站,4G与5G基站并存 2、UE -> (4G基站、5G基站) -> 4G核心网 * 部署中后期,引入5G核心网&am…

前端开放性技术面试—面试题

1. 上线出现问题如何解决? 步骤: 立即响应:迅速确认问题的存在和影响范围。回滚:如果问题严重影响用户,考虑立即回滚到上一个稳定版本。日志分析:查看服务器日志、应用日志和前端日志,定位问题…

详细ECharts图例3添加鼠标单击事件的柱状图

<!DOCTYPE html><html><head><meta charset"UTF-8"><script src"js/echarts.js"></script> <!-- 确保路径正确 --><title>添加鼠标单击事件的柱状图</title></head><body><div id&q…

R 语言 | 绘图的文字格式(绘制上标、下标、斜体、文字标注等)

1. 上下标 # 注意y轴标签文字 library(ggplot2) ggplot(mtcars, aes(mpg, cyl))geom_point()ylab(label bquote(O[3]~(ug / m^3)))2. 希腊字母&#xff0c;如alpha ggplot(mtcars, aes(mpg, cyl))geom_point()ylab(label bquote(O[3]~(ug / m^3)))ggtitle(expression(alpha))…

精通Redis

目录 1.NoSQL 非关系型数据库 2.Redis 3.Redis的java客户端 4.Jedis 4.1Jedis快速入门 4.2Jedis连接池及使用 5.SpringDataRedis和RedisTemplate 6.SpringDataRedis快速入门 7.RedisSerializer 1.NoSQL 非关系型数据库 基础篇-02.初始Redis-认识NoSQL_哔哩哔哩_bilib…

VR线上展厅的色彩管理如何影响用户情绪?

VR线上展厅的色彩管理对用户情绪的影响是多方面的&#xff0c;以下是专业从事VR线上展厅制作的圆桌3D云展厅平台为大家介绍的一些关键点&#xff1a; 情感共鸣&#xff1a;色彩能够激发特定的情感反应。例如&#xff0c;暖色调&#xff08;如红色、橙色&#xff09;通常与活力和…

上传文件(vue3)

使用el-upload 先上传到文件服务器&#xff0c;生成url 然后点击确定按钮&#xff1a; 保存数据 <template><el-dialog top"48px" width"500" title"新增协议" :modelValue"visible" close"handleClose()">…

GM_T 0039《密码模块安全检测要求》题目

单项选择题 根据GM/T 0039《密码模块安全检测要求》,送检单位的密码模块应包括()密码主管角色。 A.一个 B.两个 C.至少一个 D.至少两个 正确答案:C 多项选择题 根据GM/T 0039《密码模块安全检测要求》,关于非入侵式安全,以下属于安全三级密码模块要求的是()。 …

AI的进阶之路:从机器学习到深度学习的演变(四)

AI的进阶之路&#xff1a;从机器学习到深度学习的演变&#xff08;三&#xff09; 五、深度学习的应用领域 深度学习的应用领域广泛&#xff0c;涵盖了计算机视觉、自然语言处理、语音识别和推荐系统等多个方面。以下将详细探讨这些关键应用领域&#xff0c;展示深度学习在不同…

mysql-主从同步与读写分离

一、mysql主从同步原理 mysql主从是用于数据灾备。也可以缓解服务器压力(读写分离)&#xff0c;即为主数据库服务器增加一个备服务器&#xff0c; 两个服务器之间通过mysql主从复制进行同步&#xff0c;这样一台服务器有问题的情况下可以切换到另一台服务器继续使用。 如何想实…

【工具】通过js获取chrome浏览器扩展程序列表id及名称等

【工具】通过js获取chrome浏览器扩展程序列表id及名称等 第一步 打开扩展程序页面 chrome://extensions/ 第二部 注入js获取 let 扩展字典 {} document.querySelector("body > extensions-manager").shadowRoot.querySelector("#items-list").shadow…

GO--堆(have TODO)

堆 堆&#xff08;Heap&#xff09;是一种特殊的数据结构。它是一棵完全二叉树&#xff08;完全二叉树是指除了最后一层外&#xff0c;每一层上的节点数都是满的&#xff0c;并且最后一层的节点都集中在左边&#xff09;&#xff0c;结放在数组&#xff08;切片&#xff09;中…