kafka压缩

kafka压缩

news/2025/3/22 14:39:38/文章来源:https://blog.csdn.net/weixin_45249411/article/details/145737737

最近有幸公司参与kafka消息压缩，背景是日志消息量比较大。kafka版本2.4.1

一、确认压缩算法

根据场景不同选择不同。如果是带宽敏感患者推荐高压缩比的zstd，如果是cpu敏感患者推荐lz4

lz4和zstd底层都使用的是lz77算法，具体实现逻辑不同，根据我们现有日志消息计算最高压缩比。

最终结合我们生产环境最终是确认了使用lz4压缩算法。

二、压缩相关的参数

除了这几个基本的参数外，还需要相应的调整kafka的参数。

参数	作用范围	描述	默认值	关键依赖关系	场景/注意事项
`message.max.bytes`	Broker	Broker 允许接收的单个消息最大大小（含消息头、键、值）。	`1048588` (1MB)	生产者需设置 `max.request.size` ≤ 此值；消费者需设置 `max.partition.fetch.bytes` ≥ 此值	若消息超过此值，生产者会被 Broker 拒绝。需与生产者和消费者参数协同配置。
`replica.fetch.max.bytes`	副本同步（Broker）	副本从 Leader 分区单次拉取数据的最大字节数。	`1048576` (1MB)	必须 ≥ `message.max.bytes`，否则副本无法同步大消息	若设置过小，可能导致副本频繁掉出 ISR 列表。
`fetch.message.max.bytes`	消费者（旧版本）	已弃用，替代参数为 `max.partition.fetch.bytes`。	旧版本默认同 `max.partition.fetch.bytes`	无（建议使用新参数）	旧版本兼容性参数，新版本无需关注。
`max.partition.fetch.bytes`	消费者	消费者从单个分区单次拉取数据的最大字节数。	`1048576` (1MB)	必须 ≥ `message.max.bytes`，否则无法消费大消息	若分区中某条消息大小超过此值，消费者会抛出异常。
`num.replica.fetchers`	副本同步（Broker）	Broker 用于副本同步的线程数。增加此值可提升副本同步并行度。	`1`	无直接依赖，但需根据集群负载调整	分区数多或吞吐量高时，增大此值可加速副本同步。
`replica.lag.time.max.ms`	副本同步（Broker）	副本若在此时间内未向 Leader 同步数据，则被标记为不同步（移出 ISR）。	`30000` (30秒)	无直接依赖	设置过短可能导致副本频繁移出 ISR；过长可能容忍滞后副本（影响可靠性）。

接着就是根据prometheus图不断调整参数找到最适合的参数

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/37627.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Java EE(14)——网络原理——UDPTCP数据报的结构

Java EE(14)——网络原理——UDPTCP数据报的结构

前言本文主要介绍传输层的两个知名协议——UDP&TCP（想了解其他层协议请移步Java EE(12)——初始网络） 一.传输层的作用传输层主要实现端对端的数据传输，在传输层的数据报中会包含源端口/目的端口的信息。端口的作用就是标识主机中的…

阅读更多...

ccfcsp2701如此编码

ccfcsp2701如此编码

//如此编码 #include<iostream> using namespace std; int main(){int n,m;cin>>n>>m;int a[21],b[21],c[21];for(int i1;i<n;i){cin>>a[i];}c[0]1;for(int i1;i<n;i){c[i]c[i-1]*a[i];}b[1](m%c[1])/c[0];int s1,s20;for(int i2;i<n;i){s2s2…

阅读更多...

麒麟操作系统安装人大金仓数据库

麒麟操作系统安装人大金仓数据库

如果你想拥有你从未拥有过的东西，那么你必须去做你从未做过的事情在当前数字化转型和信息安全备受重视的背景下，众多公司积极推进国产化改造进程。在操作系统领域，统信、open 欧拉、中标麒麟、银河麒麟等国产操作系统崭露头角，逐…

阅读更多...

【工具变量】全国地级市地方ZF债务数据集（2014-2023年）

【工具变量】全国地级市地方ZF债务数据集（2014-2023年）

地方ZF债务是地方财政运作的重要组成部分，主要用于基础设施建设、公共服务及经济发展，是衡量地方财政健康状况的重要指标。近年来，我国地级市的地方ZF债务规模不断变化，涉及一般债务和专项债务等多个方面，对金融市场、…

阅读更多...

vlan实验

vlan实验

一、实验拓扑及要求： 二、实验步骤-思路： 实验需求解读： 首先PC1和PC3所在接口为access接口，属于VLAN 2，那么首先需求在SW1和SW2创建VLAN2，并且配置对应连接PC的接口链路类型为Access并放通VLAN 2PC2/4/5…

阅读更多...

[samba配置]宿主机访问虚拟机目录

[samba配置]宿主机访问虚拟机目录

[samba配置]宿主机访问虚拟机目录 1、安装和启动Samba服务 sudo apt update sudo apt install samba2、查看samba服务是否正在运行 sudo systemctl status smbd sudo systemctl status nmbd3、配置samba服务设置为开机启动。 sudo systemctl enable smbd nmbd4、创建一个共…

阅读更多...

PDF文件转Markdown，基于开源项目marker

PDF文件转Markdown，基于开源项目marker

首先我们来问下deepseek 为啥要选marker呢基于深度学习，一看就逼格拉满。搞科研必备，效果应该不会太差。跟其他的阿猫阿狗工具没法比。看下官网 https://github.com/VikParuchuri/marker 一看头像是个印度佬，自吹——又快又好。…

阅读更多...

【深度学习与大模型基础】第6章-对角矩阵，对称矩阵，正交矩阵

【深度学习与大模型基础】第6章-对角矩阵，对称矩阵，正交矩阵

一、对角矩阵对角矩阵（Diagonal Matrix）是一种特殊的方阵，其非对角线上的元素均为零，只有对角线上的元素可能非零。具体来说，对于一个 nn的矩阵 A[]，如果满足则 AA 称为对角矩阵。对角矩阵通常表示为&am…

阅读更多...

C语言数据结构【动态顺序表】详解

C语言数据结构【动态顺序表】详解

引言详细介绍了顺序表中各个接口的实现，一定要亲自动手敲一遍，要能想象出具体的图像第一次敲可能不能完全靠自己敲出来（很正常），过一段时间可以根据顺序表的原理敲第二遍孰能生巧一、线性表在介绍顺序表之前先…

阅读更多...

人脸表情识别系统分享（基于深度学习+OpenCV+PyQt5）

人脸表情识别系统分享（基于深度学习+OpenCV+PyQt5）

最近终于把毕业大论文忙完了，众所周知硕士大论文需要有三个工作点，表情识别领域的第三个工作点一般是做一个表情识别系统出来，如下图所示。这里分享一下这个表情识别系统： 采用深度学习OpenCVPyQt5 构建，主要功能包…

阅读更多...

集成学习（下）：Stacking集成方法

集成学习（下）：Stacking集成方法

一、Stacking的元学习革命 1.1 概念 Stacking（堆叠法） 是一种集成学习技术，通过组合多个基学习器（base learner）的预测结果，并利用一个元模型（meta-model）进行二次训练&#xff0c…

阅读更多...

tcping 命令的使用，ping IP 和端口

tcping 命令的使用，ping IP 和端口

1. ‌Windows系统安装‌ ‌下载tcping工具‌：根据系统位数（32位或64位）下载对应的tcping.exe文件。‌安装步骤‌： 将下载的tcping.exe文件复制到C:\Windows\System32目录下。如果下载的是64位版本，需将文件名改为tcpi…

阅读更多...

浅谈跨平台框架的演变（H5混合开发-＞RN-＞Flutter）

浅谈跨平台框架的演变（H5混合开发-＞RN-＞Flutter）

引言这里分为四个阶段： 第一阶段 ： 原生开发第二阶段 ： H5混合开发第三阶段： 跨平台RN 第四阶段： 跨平台Flutter 正文第一阶段： 原生开发开发成本比较大 ： 需要Android 和ios 开发两…

阅读更多...

《TCP/IP网络编程》学习笔记 | Chapter 20：Windows 中的线程同步

《TCP/IP网络编程》学习笔记 | Chapter 20：Windows 中的线程同步

《TCP/IP网络编程》学习笔记 | Chapter 20：Windows 中的线程同步《TCP/IP网络编程》学习笔记 | Chapter 20：Windows 中的线程同步用户模式和内核模式用户模式同步内核模式同步基于 CRITICAL_SECTION 的同步内核模式的同步方法基于互斥量对象的同步基于…

阅读更多...

力扣45.跳跃游戏

力扣45.跳跃游戏

45. 跳跃游戏 II - 力扣（LeetCode） 代码区： #include<vector> class Solution {public:int jump(vector<int>& nums) {int ans[10005] ;memset(ans,1e4,sizeof(ans));ans[0]0;for(int i0;i<nums.size();i){for(int j1;j…

阅读更多...

深入理解 Collections.emptyList()：优雅处理空列表的利器！！！

深入理解 Collections.emptyList()：优雅处理空列表的利器！！！

🚀 深入理解 Collections.emptyList()：优雅处理空列表的利器！🔧 大家好！👋 今天我们来聊聊 Java 中一个非常实用但容易被忽视的小工具——Collections.emptyList()。🎉 如果你经常需要返回一个…

阅读更多...

SpringBoot教程（十四） SpringBoot之集成Redis

SpringBoot教程（十四） SpringBoot之集成Redis

SpringBoot教程（十四） | SpringBoot之集成Redis 一、Redis集成简介二、集成步骤 2.1 添加依赖2.2 添加配置2.3 项目中使用之简单使用 （举例讲解）2.4 项目中使用之工具类封装 （正式用这个）2.5 序列化 &…

阅读更多...

VC6.0图文安装教程

VC6.0图文安装教程

VC6.0图文安装教程 1、首先，右击安装包，以管理员身份运行 2、点击下一步 3、点击下一步 4、选择安装路径，点击下一步 5、点击下一步 6、点击安装 7、安装ing 8、点击完成至此，安装完成！

阅读更多...

用户说 | 零基础用通义灵码 AI 程序员开发个人笔记网站

用户说 | 零基础用通义灵码 AI 程序员开发个人笔记网站

作者：宋镇江，安阳幼儿师范高等专科学校数字媒体技术专业教师通义灵码是一款基于通义大模型的智能编码辅助工具，支持自然语言生成代码、单元测试生成、代码注释生成等功能，兼容多种主流IDE和编程语言。对于零基础用户&#xff0c…

阅读更多...

试验一 mybatis 入门操作

试验一 mybatis 入门操作

试验一 mybatis 入门操作一实验目的 1.掌握mybatis基础操作，包括如何在maven工程中引入依赖，创建mapper文件，核心配置文件，映射文件，并测试对数据库表基本的的CRUD操作； 2.掌握核心配置文件中几个重要标…

阅读更多...

最新文章

推荐文章