25.2 采集端高基数的现象和原因

本节重点介绍 :

  • 什么是高基数
  • 采集端高基数的原因
    • 标签的值过多
  • 获取采集端的高基数metrics
    • tsdb-status页面介绍
    • 统计原理讲解:是基于内存中的倒排索引 算最大堆取 top10
    • 通过接口获取metrics name top10

什么是高基数

  • 通俗的说就是返回的series或者查询到的series数量过多
  • 查询表现出来返回时间较长,对应调用服务端资源较多的查询
  • 数量多少算多 10w~100w

采集端高基数的现象

  • apiserver_request_duration_seconds_bucket
  • high01.png

采集端高基数的原因

  • 标签的值过多

举例histogram 标签过多

  • 我们定义了一个名为 test_histogram_01 的histogram型metrics
  • bucket总数为20个,也就是le这个标签的选项有20个
  • 还定义了三个标签 “path”, “resource”, “scope”
  • 假设这三个标签每个都有100选项
  • 那么这个metric_name中不同标签的选项为100*100*100*20=2kw
  • 也就是可以达到惊人的2千万的级别
  • 当时实际中不大可能所有的标签都达到100个数量,但是个别的标签达到100是没问题的
	TestHistogram01 = prometheus.NewHistogramVec(prometheus.HistogramOpts{Name: "test_histogram_01",Help: "RPC latency distributions.",// histogram 需要传入 bucket的start 和width参数Buckets: prometheus.LinearBuckets(0.1, 0.2, 20),}, []string{"path", "resource", "scope"})
)

获取采集端的高基数metrics

tsdb页面解析

  • Top 10 label names with value count: 标签中value最多的10个
  • Top 10 series count by metric names: metric_name匹配的series最多的10个
  • Top 10 label names with high memory usage: 标签消耗内存最多的10个
  • Top 10 series count by label value pairs: 标签对数量最多的10个

统计原理解析

  • 是基于内存中的倒排索引 算最大堆取 top10
  • 代码位置 D:\go_path\src\github.com\prometheus\prometheus\web\api\v1\api.go
func (api *API) serveTSDBStatus(*http.Request) apiFuncResult {s, err := api.db.Stats("__name__")if err != nil {return apiFuncResult{nil, &apiError{errorInternal, err}, nil, nil}}metrics, err := api.gatherer.Gather()if err != nil {return apiFuncResult{nil, &apiError{errorInternal, fmt.Errorf("error gathering runtime status: %s", err)}, nil, nil}}chunkCount := int64(math.NaN())for _, mF := range metrics {if *mF.Name == "prometheus_tsdb_head_chunks" {m := *mF.Metric[0]if m.Gauge != nil {chunkCount = int64(m.Gauge.GetValue())break}}}return apiFuncResult{tsdbStatus{HeadStats: HeadStats{NumSeries:     s.NumSeries,ChunkCount:    chunkCount,MinTime:       s.MinTime,MaxTime:       s.MaxTime,NumLabelPairs: s.IndexPostingStats.NumLabelPairs,},SeriesCountByMetricName:     convertStats(s.IndexPostingStats.CardinalityMetricsStats),LabelValueCountByLabelName:  convertStats(s.IndexPostingStats.CardinalityLabelStats),MemoryInBytesByLabelName:    convertStats(s.IndexPostingStats.LabelValueStats),SeriesCountByLabelValuePair: convertStats(s.IndexPostingStats.LabelValuePairsStats),}, nil, nil, nil}
}

api接口

  • python代码
import requestsdef label_names(host, ):uri = 'http://{}/api/v1/status/tsdb'.format(host)res = requests.get(uri)data = res.json().get("data")if not data:returnseriesCountByMetricName = data.get("seriesCountByMetricName")for i in seriesCountByMetricName:print(i)if __name__ == '__main__':label_names("172.20.70.215:8091")
  • seriesCountByMetricName结果
{'name': 'apiserver_request_duration_seconds_bucket', 'value': 11476}
{'name': 'etcd_request_duration_seconds_bucket', 'value': 9430}
{'name': 'rest_client_request_duration_seconds_bucket', 'value': 2266}
{'name': 'apiserver_response_sizes_bucket', 'value': 1440}
{'name': 'workqueue_work_duration_seconds_bucket', 'value': 737}
{'name': 'workqueue_queue_duration_seconds_bucket', 'value': 737}
{'name': 'grpc_server_handled_total', 'value': 697}
{'name': 'apiserver_request_total', 'value': 472}
{'name': 'apiserver_request_duration_seconds_count', 'value': 302}
{'name': 'apiserver_request_duration_seconds_sum', 'value': 302}

本节重点总结 :

  • 什么是高基数
  • 采集端高基数的原因
    • 标签的值过多
  • 获取采集端的高基数metrics
    • tsdb-status页面介绍
    • 统计原理讲解:是基于内存中的倒排索引 算最大堆取 top10
    • 通过接口获取metrics name top10

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/447125.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring boot itext7 修改生成文档的作者、制作者、标题,并且读取相关的信息。

1、官方的example文件:iText GitHub itext-java-7.2.5\kernel\src\test\java\com\itextpdf\kernel\pdf\PdfStampingTest.java 2、修改代码: Testpublic void stamping1() throws IOException {String filename1 destinationFolder "stamping1_…

【安装教程】Windows10环境下Pytorch(GPU版)的安装与配置

目录 Pytorch的概念安装前要求一、NVIDIA驱动查看二、Anaconda的安装2.1 Anaconda的安装2.2 创建虚拟环境2.3 激活虚拟环境 三、CUDA ToolKit的安装(选做,CPU版本可跳过)3.1 CUDA安装包的下载(以CUDA11.6.0为例)3.2 CU…

【兼容多端】UNIAPP popper气泡弹层vue3+typescript unibest

最近要实习一个泡泡弹层。看了下市场的代码,要么写的不怎么好,要么过于复杂。于是拿个轮子自己加工。200行代码撸了个弹出层组件。兼容H5和APP和小程序。 功能: 1)只支持上下左右4个方向的弹层不支持侧边靠齐 2)不对屏幕边界适配 3)支持弹层…

EmEditor传奇脚本编辑器

主程序:EmEditor.exe 目前已有功能 可以自己指定一个快捷键 实现以下功能(默认快捷键为:F1) 以下全功能 都是鼠标所在行 按快捷键 (默认快捷键:F1) 1.在Merchant.txt中 一键打开NPC 没有…

注册安全分析报告:惠农网

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

C语言 | Leetcode C语言题解之第462题最小操作次数使数组元素相等II

题目&#xff1a; 题解&#xff1a; static inline void swap(int *a, int *b) {int c *a;*a *b;*b c; }static inline int partition(int *nums, int left, int right) {int x nums[right], i left - 1;for (int j left; j < right; j) {if (nums[j] < x) {swap(…

前端的AI工具:ChatGPT Canvas与Claude Artifacts对比 -仅仅是OpenAI一个迟来的追赶吗?- 贺星舰五飞试验成功

如果你对OpenAI的ChatGPT Canvas和Anthropic的Claude Artifacts有所耳闻&#xff0c;可能会想知道这两个工具有何不同&#xff0c;以及哪个能让你的工作流程更加顺畅。这两个工具旨在提升生产力&#xff0c;但侧重点各异——编码、写作、创意和实时反馈。 本文将深入探讨ChatG…

面腾讯后台开发,二面挂掉了,,,

随着各厂秋招的开启&#xff0c;收到面试邀请的同学也越来越多。在当年和我一起找实习的同学里面&#xff0c;有实力较强的同学收到了腾讯后台开发的校招面试邀请。但面试不止是实力的竞争&#xff0c;也有很重要的运气的因素。 虽然我的同学在腾讯后台开发的二面中挂掉了&…

76.最小覆盖子串

题目:76. 最小覆盖子串 - 力扣&#xff08;LeetCode&#xff09; 代码思路: (滑动窗口) O(n) 这道题要求我们返回字符串 s中包含字符串 t 的全部字符的最小窗口&#xff0c;我们利用滑动窗口的思想解决这个问题。因此我们需要两个哈希表&#xff0c;hs哈希表维护的是s字符串中…

QT:“提升为“使用(自定义控件)

目录 一.步骤与作用 1.步骤 2.作用 二.使用 1.mainwindow.ui ->拖一个 Push Button 控件到画布->右击Push Button弹出对话框->单击"提升为" 2.输入提升类名称MyButton->点击添加 3.选择基类名称为QPushButton,点击提升 4.新建MyButton文件 5.在…

初等数学几百年重大错误:将根本不是无穷集的真子集误为其真子集

黄小宁 【摘要】长为1的直线段形橡皮筋A拉长为长为2的橡皮筋B&#xff08;可二等分&#xff09;&#xff0c;去掉拉力使B缩短成原来的A&#xff0c;A不是B的一半。同样可证直线段L均匀压缩变短为直线段D&#xff5e;L不能成为L的一部分。数学一直误以为D是L的一部分使康脱推出…

《RabbitMQ篇》消费者轮询消费消息

当有多个消费者都在同一个队列中拿取消息时&#xff0c;会轮询从队列中拿取消息消费。 RabbitMQUtil类为工具类&#xff0c;获取Channel。 import com.rabbitmq.client.Channel; import com.rabbitmq.client.Connection; import com.rabbitmq.client.ConnectionFactory;public…

HBuilder X 下载vue-router时 发生异常:npm ERR! code EPERM

一、异常 PS C:\Users\GL\Documents\HBuilderProjects\vj1> npm i vue-router3.6.5 npm ERR! code EPERM npm ERR! syscall mkdir npm ERR! path C:\Program Files\nodejs\node_cache\_cacache npm ERR! errno EPERM npm ERR! FetchError: Invalid response body while tr…

【Linux】来查看当前系统的架构

使用 uname 命令 uname -m 使用 arch 命令 arch 查看 /proc/cpuinfo 文件 查找 model name 或 Processor 字段。 cat /proc/cpuinfo 使用 lscpu 命令 lscpu

一些NLP代表性模型

&#xff08;一&#xff09;BERT 由Bidirectional Encoder Representations from Transformers的首字母组成&#xff0c;是encoder-only结构类型的代表。 模型分预训练和微调两步&#xff0c;预训练任务有两类&#xff1a;masked language model(MLM)、next sentence predict…

构造函数

引入&#xff1a;构造函数的由来 对于以下Date类&#xff1a; class Date { public:void Init(int year, int month, int day){year year;_month month;_day day;}void Print(){cout << _year << "-" << _month << "-" <&…

《自然语言处理NLP》—— 词嵌入(Word Embedding)及 Word2Vec 词嵌入方法

文章目录 一、词嵌入介绍1.示例介绍2.词嵌入的主要特点3.常见的词嵌入方法3.词嵌入的应用 二、Word2Vec 词嵌入方法1. 连续词袋模型&#xff08;CBOW&#xff09;2. Skip-gram模型3.Word2Vec方法的应用 在了解词嵌入之前需要了解什么是 独热编码&#xff08;One-Hot Encoding&…

【Spring相关技术】spring进阶-自定义请求报文转对象HttpMessageConverter

文章目录 类继承体系核心类与接口说明底层调用链完整示例步骤 1: 创建自定义的HttpMessageConverter步骤 2: 配置Spring MVC使用自定义转换器步骤 3: 使用自定义转换器 相关文献 类继承体系 默认转换器即springmvc默认的转换器&#xff0c; 用的比较多的是以下两种&#xff0c;…

18063 圈中的游戏

### 思路 这个问题是经典的约瑟夫环问题。我们可以使用链表来模拟这个过程。具体步骤如下&#xff1a; 1. 创建一个循环链表&#xff0c;表示所有人。 2. 从第一个人开始&#xff0c;依次报数。 3. 每报到3的人退出圈子&#xff0c;直到只剩下一个人。 ### 伪代码 function j…

TuyaOS开发学习笔记(4)——BLE开发搭建环境、编译烧写(NRF52832)

一、搭建环境 1.1 官方资料 TuyaOS 1.2 安装Visual Studio Code 官网下载&#xff1a;https://code.visualstudio.com 百度网盘&#xff1a;https://pan.baidu.com/s/1R62HT0PVmVzMwOXtCmIQwA 提取码&#xff1a;g9fb 1.3 安装Tuya Wind IDE 启动 Visual Studio Code 后&am…