VictoriaLogs：一款超低占用的 ElasticSearch 替代方案

news/2024/12/25 0:16:52/文章来源:https://blog.csdn.net/qq_18661793/article/details/132505423

image.png

背景

前段时间我们想实现 Pulsar 消息的追踪流程，追踪实现的效果图如下：

实现其实比较简单，其中最重要的就是如何存储消息。

消息的读取我们是通过 Pulsar 自带的 BrokerInterceptor 实现的，对这个感兴趣的朋友后面会单独做一个分享。

根据这里的显示内容我们大概需要存储这些信息：

客户端地址
消息发布时间
分发消费者、订阅者名称
ACK 消费者、订阅者名称
消息 ID 最终捋了下：

都以两个 consumer 计算：
一条消息占用内存：140+ 535*2 + 536*2 =2282byte存储三天：TPS * 86400 * 3=TPS*259200 条
总存储：2282*TPS*259200≈ 百GB

根据我们的 TPS 计算，三天的大概会使用到上百 G 的存储，这样首先就排除了 Redis 这种内存型数据库。

同样的换成 MySQL 存储也不划算，因为其实这些数据并不算那么重要。

做了几个技术选型都不太满意，不是资源开销太大就是没有相关的运维经验。

后面在领导的提醒下，我们使用的 VictoriaMetrics 开源了一个 VictoriaLogs，虽然当时的版本还是 0.1.0，使用过他们家 Metrics 的应该都会比较信任他们的技术能力，所以就调研了一下。

具体的信息可以查看官方文档：https://docs.victoriametrics.com/VictoriaLogs/

image.png

简单来说就是它也是一个日志存储数据库，并且有着极低的资源占有率，相对于 ElasticSearch 来说内存、磁盘、CPU 都是几十倍的下降率。

image.png

通过官方的压测对比图会发现确实在各方面对 ES 都是碾压。

官方宣传的第一反应是不能全信，于是我自己压测了一下，果然 CPU 内存磁盘的占用都是极低的。

同时也发现运维部署确实简单，直接一个 helm install 就搞定，就是一个二进制文件，不会依赖第二个组件。

按照刚才同样的数据存储三天，只需要不到 6G 的磁盘空间，我们生产环境已经平稳运行一段时间了。因为我们是批量写入数据的，所以在最高峰 20K 的 TPS 下 CPU 使用不到 0.1 核，内存使用最高 120M，这点确实是对 ES 碾压了。

磁盘占用也是非常少。

这些有点得归功于它有些的压缩、编解码算法，以及 Golang 带来的相对于 Java 的极低资源占用。

还存在的问题

如果一切都这么完美的话那 VictoriaLogs 确实也太变态了，自然他也有一些不太完美的地方。

分词功能有限

首先第一个是分词功能有限，只能做简单的搜索，无法做到类似于 ES 的各种分词，插件当然也别想了。

不支持集群

当前版本不支持集群部署，也就是无法横向扩展了；不过幸好他的的单机性能已经非常强了。

这也是目前阶段部署简单的原因。

过期时间无法混用

VictoriaLogs 支持为数据配置过期时间自动删除，有点类似于 Redis，它会在后台启动一个协程定期判断数据是否过期，但只能对所有数据统一设置。

比如我想在 VictoriaLogs 中存放两种不同类型的数据，同时他们的过期删除时间也不相同；比如一个是三天删除，一个是三月后删除。

这样的需求目前是无法实现的，只能部署两个 VictoriaLogs.

默认无法查询所有字段

image.png

由于 VictoriaLogs 可以存储非结构化数据，默认情况下只能查询内置的三个字段，我们自定义的字段目前没法自动查询，需要我们手动指定。

这个倒不是致命问题，只是使用起来稍微麻烦一些；社区也有一些反馈，相信不久就会优化该功能。

https://github.com/VictoriaMetrics/VictoriaMetrics/issues/4780
https://github.com/VictoriaMetrics/VictoriaMetrics/issues/4513

没有官方 SDK

image.png

这也是个有了更好的一个功能，目前只能根据 REST API 自己编写。

总结

当前我们只用来存储 Pulsar 链路追踪数据，目前看来非常稳定，各方面资源占用极少；所以后续我们会陆续讲一些日志类型的数据迁移过来，比如审计日志啥的。

之后再逐步完善功能后，甚至可以将所有应用存放在 ElasticSeach 中的日志也迁移过来，这样确实能省下不少资源。

总得来说 VictoriaLogs 资源占用极少，如果只是拿来存储日志相关的数据，没有很强的分词需求那它将非常合适。

截止到目前最新版也才 0.3.0 还有很大的进步空间，有类似需求的可以持续关注。

往期推荐

k8s 常见面试题

新手如何快速参与开源项目

从 Pulsar Client 的原理到它的监控面板

使用 ChatGPT 碰到的坑

点分享

点收藏

点点赞

点在看

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/107113.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

用大白话来讲讲多线程的知识架构

用大白话来讲讲多线程的知识架构

感觉多线程的知识又多又杂，自从接触java，就在一遍一遍捋脉络和深入学习。现在将这次的学习成果展示如下。什么是多线程？ 操作系统运行一个程序，就是一个线程。同时运行多个程序，就是多线程。即在同一时间&#xff0…

阅读更多...

python爬虫的js逆向入门到进阶教程文章分享汇总~持续更新

python爬虫的js逆向入门到进阶教程文章分享汇总~持续更新

目录一、内容介绍二、专栏内容-持续更新1、JS逆向入门2、Js逆向进阶3、爬虫基础知识4、工具与安装5、漫星内容分享三、星球使用四、b站up主视频推荐一、内容介绍二、专栏内容-持续更新 1、JS逆向入门 2023-08-25》11.常见加密>xx音乐RSA加密 https://articles.zsxq.c…

阅读更多...

项目进度管理（4-1）关键链法

项目进度管理（4-1）关键链法

1 关键链法产生的背景关键链法（Critical Chain Method，CCM）起源于20世纪80年代，是由Eliyahu M. Goldratt在他的著作《关键链》（"Critical Chain"）中首次提出和阐述的。Eliyahu M. Goldratt是以…

阅读更多...

玩转git第7章节，本地git的用户名和密码的修改

玩转git第7章节，本地git的用户名和密码的修改

一本地git的用户名和密码 1.1 本地用户名和密码修改 1.本地用户名修改 2.凭据管理 3.进行修改密码 1.2 代码提交操作

阅读更多...

ChatGPT在医疗系统的应用探索动态

ChatGPT在医疗系统的应用探索动态

注意：本信息仅供参考，发布该内容旨在传递更多信息的目的，并不意味着赞同其观点或证实其说法。生成式人工智能，如OpenAI开发的ChatGPT，被认为是可以颠覆医疗行业的工具。尽管该技术刚刚起步，但已有许多医…

阅读更多...

接口测试总结分享（http与rpc）

接口测试总结分享（http与rpc）

接口测试是测试系统组件间接口的一种测试。接口测试主要用于检测外部系统与系统之间以及内部各个子系统之间的交互点。测试的重点是要检查数据的交换，传递和控制管理过程，以及系统间的相互逻辑依赖关系等。一、了解一下HTTP与RPC 1. HTTP（H…

阅读更多...

SpringCloud超详细教程

SpringCloud超详细教程

1.认识微服务随着互联网行业的发展，对服务的要求也越来越高，服务架构也从单体架构逐渐演变为现在流行的微服务架构。这些架构之间有怎样的差别呢？ 1.0.学习目标了解微服务架构的优缺点 1.1.单体架构单体架构：将业务的所有…

阅读更多...

C语言(第三十二天)

C语言(第三十二天)

1. 递归是什么？ 递归是学习C语言函数绕不开的一个话题，那什么是递归呢？ 递归其实是一种解决问题的方法，在C语言中，递归就是函数自己调用自己。写一个史上最简单的C语言递归代码： #include <stdio.h>…

阅读更多...

二、前端监控之方案调研

二、前端监控之方案调研

前端监控体系一个完整的前端监控体系包括了日志采集、日志上报、日志存储、日志切分&计算、数据分析、告警等流程。对于一名前端开发工程师来说，也就意味着工作不再局限于前端业务的开发工作，需要有Nginx服务运维能力、实时/离线分析能力、Node应…

阅读更多...

常见的时序数据库

常见的时序数据库

1.概念时序数据库全称为时间序列数据库。时间序列数据库指主要用于处理带时间标签（按照时间的顺序变化，即时间序列化）的数据，带时间标签的数据也称为时间序列数据。时间序列数据主要由电力行业、化工行业、气象行业、地理信息…

阅读更多...

Redis通信协议

Redis通信协议

文章目录 Redis通信协议RESP协议数据类型模拟Redis客户端 Redis通信协议 RESP协议 Redis是一个CS架构的软件，通信一般分为两步(不包含pipeline和PubSub)： 客户端(client)向服务端(server)发送一条命令。服务器解析并执行命令，返回响应结果…

阅读更多...

远程调试环境配置

远程调试环境配置

远程调试环境配置前期准备ssh连接前期准备安装vscode中的两个扩展包php-debug和remote-ssh 然后安装与PHP版本对应的xdebug 访问xdebug的官方网页，复制自己的phpinfo源码到方框中，再点击Analyse ssh连接输入，你想要远程连接的主机i…

阅读更多...

Unity中的数学基础——贝塞尔曲线

Unity中的数学基础——贝塞尔曲线

一：前言一条贝塞尔曲线是由一组定义的控制点P0到 Pn，n1为线性，n2为二次......第一个和最后一个控制点称为起点和终点，中间的控制点一般不会位于曲线上获取两个点之间的点就是通过线性插值（ Mathf.Lerp&#xff09…

阅读更多...

分布式 - 服务器Nginx：一小时入门系列之TCP反向代理和负载均衡

分布式 - 服务器Nginx：一小时入门系列之TCP反向代理和负载均衡

文章目录 1. HTTP反向代理和TCP反向代理2. http 块和 stream 块3. TCP反向代理配置4. TCP 负载均衡 1. HTTP反向代理和TCP反向代理 Nginx可以作为HTTP反向代理和TCP反向代理。 HTTP反向代理是指Nginx作为Web服务器的代理服务器，接收客户端的HTTP请求，然…

阅读更多...

计算机竞赛基于大数据的社交平台数据爬虫舆情分析可视化系统

计算机竞赛基于大数据的社交平台数据爬虫舆情分析可视化系统

文章目录 0 前言1 课题背景2 实现效果**实现功能****可视化统计****web模块界面展示**3 LDA模型 4 情感分析方法**预处理**特征提取特征选择分类器选择实验 5 部分核心代码6 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 基于大数据…

阅读更多...

C语言练习4（巩固提升）

C语言练习4（巩固提升）

C语言练习4 选择题前言面对复杂变化的世界，人类社会向何处去？亚洲前途在哪里？我认为，回答这些时代之问，我们要不畏浮云遮望眼，善于拨云见日，把握历史规律，认清世界大势。选择题 …

阅读更多...

新型数据中心网络安全体系研究

新型数据中心网络安全体系研究

当前，新型基础设施建设已上升至国家战略，被赋予了数字化、智能化的新意义。作为算力基础设施，新型数据中心是信息基础设施中的重要内容，是数字政府、数字经济的“信息底座”，是未来引领数字经济发展的关键载体和支柱&a…

阅读更多...

java八股文面试[多线程]——sleep wait join yield

java八股文面试[多线程]——sleep wait join yield

sleep和wait有什么区别 sleep 方法和 wait 方法都是用来将线程进入阻塞状态的，并且 sleep 和 wait 方法都可以响应 interrupt 中断，也就是线程在休眠的过程中，如果收到中断信号，都可以进行响应并中断，且都可以抛出 In…

阅读更多...

npm常用命令 + 前端常用的包管理工具以及 npm淘宝镜像配置等

npm常用命令 + 前端常用的包管理工具以及 npm淘宝镜像配置等

npm常用命令前端常用的包管理工具以及 npm淘宝镜像配置等 1. 前言1.1 NodeJs的下载安装1.2 windows上1.3 常用包管理工具 2. npm2.1 npm 的安装2.2 npm初始化包2.3 npm 安装、卸载包2.3.1 非全局安装2.3.1.1 单个包的安装2.3.1.1.1 默认版本安装2.3.1.1.2 指定版本安装 2.3.…

阅读更多...

2022年03月 C/C++（四级）真题解析#中国电子学会#全国青少年软件编程等级考试

2022年03月 C/C++（四级）真题解析#中国电子学会#全国青少年软件编程等级考试

第1题：拦截导弹某国为了防御敌国的导弹袭击， 发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷： 虽然它的第一发炮弹能够到达任意的高度，但是以后每一发炮弹都不能高于前一发的高度。某天， 雷达捕捉到敌国的…

阅读更多...

最新文章

推荐文章