Kafka重要配置参数全面解读(重要)

Kafka重要配置参数全面解读(重要)

news/2024/12/24 3:50:42/文章来源:https://blog.csdn.net/Mrxiao_bo/article/details/136765046

欢迎来到我的博客，代码的世界里，每一行都是一个故事

在这里插入图片描述

在这里插入图片描述

Kafka重要配置参数全面解读(重要

- 前言
- auto.create.topics.enable
- auto.leader.rebalance.enable
- log.retention.{hour|minutes|ms}
- offsets.topic.num.partitions 和 offsets.topic.replication.factor
- log.retention.bytes和message.max.bytes
- auto.offset.reset
- unclean.leader.election.enable
- replication.factor
- min.insync.replicas
- enable.auto.commit
- retention.ms
- retention.bytes
- max.message.bytes
- unlimit -n
- session.timeout.ms
- heartbeat.interval.ms

)

前言

在数据处理的世界里，Kafka就像是一条快速的数据管道，负责传输海量的数据。但是，想要让这条管道运行得更加顺畅，就需要对其进行一些调整和优化。就像是调整一辆跑车的引擎一样，每一个配置参数都是关键。本文将带你进入Kafka的配置世界，解锁其中的秘密，让你的数据流畅如风。

auto.create.topics.enable

作用： 控制是否允许自动创建主题。如果设置为 true，当生产者发送消息到一个不存在的主题时，Kafka 会自动创建该主题。
生产环境配置： 通常建议关闭自动创建主题，以防止意外创建主题带来的不可预测性。主题应该由管理员预先创建和配置，确保主题的设置满足生产需求。显示设置为false
可能的异常： 如果允许自动创建主题，可能会导致主题名称拼写错误、主题配置不一致等问题，影响数据的稳定性和一致性。

auto.leader.rebalance.enable

作用： 控制是否启用自动领导者平衡。当 Kafka 集群中的某个节点宕机或加入集群时，自动领导者平衡会自动将分区的领导者重新分配到其他存活节点上。
生产环境配置： 建议设置为false，以确保集群的负载均衡和高可用性。在某些情况下，可能会考虑手动进行领导者平衡以避免频繁的重新平衡造成的性能损失。
可能的异常： 如果关闭自动领导者平衡，可能会导致集群中部分节点负载过高，影响系统的稳定性和性能。

log.retention.{hour|minutes|ms}

作用： 控制日志文件的保留时间。指定日志文件保留的时间长度。
生产环境配置： 根据业务需求和数据存储需求，合理设置日志文件的保留时间。通常建议根据数据的重要性和存储成本来设置。
可能的异常： 如果设置的保留时间过长，可能会导致存储空间不足，影响系统的正常运行；如果设置过短，可能会导致重要数据被删除，影响数据的完整性和可用性。

offsets.topic.num.partitions 和 offsets.topic.replication.factor

作用： 控制偏移量存储的主题分区数和复制因子。offsets.topic.num.partitions 指定了偏移量主题的分区数，offsets.topic.replication.factor 指定了偏移量主题的副本数。默认为50和3
生产环境配置： 偏移量主题在 Kafka 集群中非常重要，需要确保其分区数和复制因子足够大，以保证数据的可靠性和高可用性。
可能的异常： 如果偏移量主题的分区数和复制因子设置不合理，可能会导致偏移量丢失或不一致，影响消息的消费和数据的准确性。

log.retention.bytes和message.max.bytes

作用： log.retention.bytes 控制日志文件的最大大小，message.max.bytes 控制单个消息的最大大小。
生产环境配置： 根据业务需求和存储资源限制，合理设置日志文件和消息的最大大小，以避免存储空间不足或单个消息过大而导致的性能问题。默认是1000012，不到1M，设置大一点不会耗费什么磁盘空间
可能的异常： 如果设置的日志文件最大大小过小，可能会导致频繁的日志文件切换，影响性能；如果单个消息超过最大大小限制，可能会导致消息被拒绝或截断，影响数据的完整性。

auto.offset.reset

作用： 控制消费者在没有初始偏移量或偏移量无效的情况下的起始位置。可以设置为 earliest（从最早的可用消息开始消费）或 latest（从最新的消息开始消费）。
- 生产环境配置： 根据业务需求和消费者行为，选择合适的起始位置。如果需要消费历史数据，可以设置为 earliest；如果只关注最新数据，可以设置为 latest。
- 可能的异常： 如果起始位置设置不合理，可能会导致消费者无法正常消费消息或消费到过期或重复的消息，影响数据的准确性和完整性。

unclean.leader.election.enable

作用： 控制是否允许非干净的领导者选举。当 Kafka 集群中的某个分区的领导者节点宕机或不可用时，如果设置为 false，则只有那些已经同步到最新数据的副本节点才有资格成为新的领导者。
生产环境配置： 建议设置为 false，以确保领导者选举只会选举同步到最新数据的副本节点，避免因选举了未同步数据的节点作为领导者而导致数据不一致或消息丢失的情况。
可能的异常： 如果设置为 true，可能会导致选举非干净的领导者，从而可能会产生数据不一致或消息丢失的问题。

replication.factor

作用： 控制分区的副本数量。replication.factor 参数指定了每个分区的副本数，即每个分区的数据将被复制到多少个节点上。
生产环境配置： 建议设置为大于等于 3，以确保数据的可靠性和高可用性。在生产环境中，通常需要至少三个副本来保证数据的完整性和可用性。
可能的异常： 如果副本数量设置过少，可能会导致数据丢失或不一致的风险增加，特别是在节点故障或网络分区的情况下。

min.insync.replicas

作用： 控制要求参与写入操作的最小副本数。min.insync.replicas 参数指定了至少要有多少个副本参与到写入操作中，确保数据被写入到足够多的节点上。
生产环境配置： 建议设置为大于 1，以确保至少有多个节点接收到写入操作并进行复制，从而增加数据的可靠性和一致性。设置>1
可能的异常： 如果设置为 1 或更低，可能会导致数据不一致或丢失的风险增加，特别是在节点故障或网络分区的情况下。

enable.auto.commit

作用： 控制是否启用自动提交位移。如果设置为 false，消费者将不会自动提交消费位移，而需要手动调用 commitSync() 或 commitAsync() 方法来提交位移。
生产环境配置： 建议设置为 false，以避免因自动提交位移而导致的位移提交不及时或不准确的问题，从而增加消息丢失或重复消费的风险。设置为false
可能的异常： 如果设置为 true，可能会导致位移提交不及时或不准确，从而可能会导致消息重复消费或丢失的问题。

retention.ms

作用： 控制消息在日志中保留的时间。此参数表示消息在日志中保留的最长时间，以毫秒为单位。
生产环境配置： 适当设置消息的保留时间，以满足业务需求和法规合规要求。根据数据的重要性和存储资源的限制，设置合适的保留时间。这个一旦设置了会覆盖Broker的全局参数
可能的异常： 如果保留时间设置不当，可能会导致存储空间不足或数据被过早删除，影响数据的完整性和可用性。

retention.bytes

作用： 控制日志段文件的最大大小。此参数表示日志段文件的最大字节数。
生产环境配置： 根据存储资源的限制和数据的重要性，设置合适的日志段文件最大大小。确保设置的值不会导致存储空间不足或日志文件切换过于频繁。默认-1
可能的异常： 如果设置的日志段文件最大大小过小，可能会导致频繁的日志文件切换，影响性能；如果设置过大，可能会导致存储空间浪费或日志文件过于庞大，难以管理。

max.message.bytes

作用： 控制单个消息的最大大小。此参数表示单个消息的最大字节数。
生产环境配置： 根据业务需求和网络传输限制，设置合适的单个消息最大大小。避免设置过大的值导致网络传输问题或消费者内存溢出。太小会报错，我认为直接给一个大一点的值，默认值好像是1m
可能的异常： 如果设置的单个消息最大大小过小，可能会导致消息被拒绝或截断，影响数据的完整性；如果设置过大，可能会导致网络传输问题或消费者内存溢出，影响系统的稳定性。

unlimit -n

作用： 控制一个用户可打开的最大文件描述符数量。
生产环境配置： 根据 Kafka 集群的规模和并发连接数，设置合适的最大文件描述符数量。确保设置的值不会限制 Kafka 的正常运行和扩展性。直接给一个很大的数就好
可能的异常： 如果设置的最大文件描述符数量不足，可能会导致 Kafka 无法处理更多的连接请求或文件操作，影响系统的性能和可用性。

session.timeout.ms

作用： 它定义了消费者与集群之间的会话超时时间，以毫秒为单位。如果消费者在此超时时间内没有向服务器发送心跳，那么服务器将视为该消费者已经死亡，并将其分区重新分配给其他消费者。
生产环境配置： 这个参数的设置取决于网络延迟、消费者负载和集群的负载等因素。一般来说，它应该设置为超过 heartbeat.interval.ms 的两倍，以确保在心跳检测失败之前有足够的时间来处理网络延迟和其他因素引起的延迟。无脑设置为6s
可能的异常： 如果将 session.timeout.ms 设置得过小，可能会导致频繁的消费者重新分配和分区再均衡，影响性能和稳定性。而如果设置得过大，可能会延长故障检测时间，导致消息消费者的故障无法及时检测和处理。

heartbeat.interval.ms

作用： 它定义了消费者发送心跳到群组协调器的频率，以毫秒为单位。心跳用于告知群组协调器消费者仍然活跃，同时也用于触发重新分配分区的过程。
生产环境配置： 这个参数的设置也受到网络延迟、消费者负载和集群的负载等因素的影响。通常建议将它设置为 session.timeout.ms 的三分之一，以确保足够频繁地发送心跳，避免被误认为是死亡消费者。无脑设置为2s
可能的异常： 如果将 heartbeat.interval.ms 设置得过小，可能会导致频繁的心跳发送，增加了网络负载并可能引起性能问题。而如果设置得过大，可能会延长检测到故障的时间，导致消费者在故障时无法及时重新分配分区并接管消息处理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/290227.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Mapper4一键生成

Mapper4一键生成

新建一个Maven工程作为父工程 1、新建一个Maven项目 JDK版本：17 Maven版本：3.6.3 2、总父工程 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"…

阅读更多...

免费翻译pdf格式论文

免费翻译pdf格式论文

进入谷歌翻译网址https://translate.google.com/?slauto&tlzh-CN&opdocs 将需要全文翻译的pdf放进去选择英文到中文，然后点击翻译可以选择打开译文或者下载译文，下载译文会下载到电脑上，打开译文会在浏览器打开。

阅读更多...

docker部署ubuntu

docker部署ubuntu

仓库： https://hub.docker.com/search?qUbuntu 拉一个Ubuntu镜像 docker pull ubuntu:18.04 查看本地镜像： docker images 运行容器 docker run -itd --name ubuntu-18-001 ubuntu:18.04 通过ps命令可以查看正在运行的容器信息 docker ps 进入容器最…

阅读更多...

Redis中的事件(一)

Redis中的事件(一)

事件概述 Redis服务器是一个事件驱动程序:服务器需要处理以下两类事件: 1.文件事件(file event):Redis服务器通过套接字与客户端(或者其他Redis服务器)进行连接，而文件事件就是服务器对套接字操作的抽象。服务器与客户端(或者其他服务器)的通信会产生相应的文件…

阅读更多...

【VMware Workstation】公司所有主机和虚拟机ip互通，以及虚拟机目录迁移

【VMware Workstation】公司所有主机和虚拟机ip互通，以及虚拟机目录迁移

文章目录 1、场景2、环境3、实战3.1、所有主机和虚拟机ip互通Stage 1 : 【虚拟机】设置为桥接模式Stage 2 : 【虚拟机】设置ipStage 3 : 【路由器】ARP 静态绑定MACStage 3-1 ping 路由器 ipStage 3-2 【静态绑定】虚拟机查看mac地址Stage 3-3 【静态绑定】路由器ARP 静态绑定 …

阅读更多...

Apache HBase(二)

Apache HBase(二)

目录一、Apache HBase 1、HBase Shell操作 1.1、DDL创建修改表格 1、创建命名空间和表格 2、查看表格 3、修改表 4、删除表 1.2、DML写入读取数据 1、写入数据 2、读取数据 3、删除数据 2、大数据软件启动一、Apache HBase 1、HBase Shell操作先启动HBase。再…

阅读更多...

buy me a btc 使用数字货币进行打赏赞助

buy me a btc 使用数字货币进行打赏赞助

最近在调研使用加密货币打赏的平台，发现idatariver平台 https://idatariver.com 推出的buymeabtc功能刚好符合使用场景，下图为平台的演示项目, 演示项目入口 https://buymeabtc.com/idatariver 特点不少人都听说过buymeacoffee，可以在上面发…

阅读更多...

跑通飞浆平台的MTMCT 跨镜跟踪示例

跑通飞浆平台的MTMCT 跨镜跟踪示例

想跑通飞浆平台的MTMCT跨镜跟踪示例，真的是难上加难啊！ 改了几处代码，可以顺利跑通了，特此记录： 第一处：不要拉主线的代码，改成 !git clone https://gitee.com/paddlepaddle/PaddleDetection…

阅读更多...

【1】网络协议基础概念

【1】网络协议基础概念

【1】网络协议基础知识 1、互联网2、为什么要学习网络协议3、学习中需要搭建的环境4、客户端-服务器5、Java 的跨平台原理6、C/C的跨平台原理7、一个简单的SpringBoot项目(1) pom.xml(2) application.yml(3) NetworkStudyApp.java(4) SwaggerConfig.java(5) HelloWorldControll…

阅读更多...

PythonGUI应用：模拟航空订票小程序

PythonGUI应用：模拟航空订票小程序

在本教程中，我们将创建一个基本的航空订票管理系统GUI应用，用户可以通过图形界面执行各种操作。我们将使用Python编程语言和Tkinter库来实现此应用。功能概述： 航班管理： 用户可以添加新的航班，输入航班号、起始地、目…

阅读更多...

x86架构中的寄存器和常用指令

x86架构中的寄存器和常用指令

寄存器这些寄存器可以用于多种操作，如算术运算、数据传输等。在 x86 架构中，这些包括： 通用这些寄存器可以用于多种操作，如算术运算、数据传输等 AX/EAX/RAX：累加器，用于算术运算。通常用于存储函数调…

阅读更多...

Java中有哪些容器(集合类)？

Java中有哪些容器(集合类)？

Java中的集合类主要由Collection和Map这两个接口派生而出，其中Collection接口又派生出三个子接口，分别是Set、List、Queue。所有的Java集合类，都是Set、List、Queue、Map这四个接口的实现类，这四个接口将集合分成了四大类&#…

阅读更多...

从姿态估计到3D动画

从姿态估计到3D动画

在本文中，我们将尝试通过跟踪 2D 视频中的动作来渲染人物的 3D 动画。在 3D 图形中制作人物动画需要大量的运动跟踪器来跟踪人物的动作，并且还需要时间手动制作每个肢体的动画。我们的目标是提供一种节省时间的方法来完成同样的任务。我们对这个问题…

阅读更多...

YOLOv9 实现多目标跟踪

YOLOv9 实现多目标跟踪

YOLOv9项目结合了YOLOv9的快速目标检测能力和DeepSORT的稳定跟踪能力，实现了对视频流中多个对象的实时、准确检测和跟踪。在具体应用中，该项目能够对视频中的行人、车辆或其他物体进行实时定位、识别和持续跟踪，即使在复杂环境、对象互相遮挡…

阅读更多...

Unity照片墙简易圆形交互效果总结

Unity照片墙简易圆形交互效果总结

还要很多可以优化的点地方，有兴趣的可以做比如对象的销毁和生成可以做成对象池，走到最左边后再移动到最右边循环利用分析过程文件，采用Blender，资源已上传，可以播放动画看效果，下面截个图： …

阅读更多...

如何使用 ArcGIS Pro 制作三维建筑

如何使用 ArcGIS Pro 制作三维建筑

三维地图已经逐渐成为未来地图的趋势，对于大范围应用，只需要普通的建筑体块就行，如果有高程数据，还可以结合地形进行显示，这里为大家介绍一下 ArcGIS Pro 制作三维建筑的方法，希望能对你有所帮助。数据来…

阅读更多...

单片机之串口通信

单片机之串口通信

目录串口介绍通信的基本概念并行通信和串行通信同步通信和异步通信串行异步通信方式串行同步通信方式通信协议单片机常见通信接口串行通信三种模式串口参数传输速度串口的连接电平标准串行口的组成串口数据缓冲寄存器串行口控制寄存器串口…

阅读更多...

HackTheBox-Machines--Legacy

HackTheBox-Machines--Legacy

文章目录 1 端口扫描2 测试思路3 445端口漏洞测试4 flag Legacy 测试过程 1 端口扫描 nmap -sC -sV 10.129.227.1812 测试思路目标开启了135、139、445端口，445 SMB服务存在很多可利用漏洞，所以测试点先从445端口开始。而且在Nmap扫描结果中&#xff0c…

阅读更多...

深入Facebook的世界：探索数字化社交的无限可能性

深入Facebook的世界：探索数字化社交的无限可能性

引言随着数字化时代的到来，社交媒体平台已经成为了人们日常生活中不可或缺的一部分，而其中最为突出的代表之一便是Facebook。作为全球最大的社交媒体平台之一，Facebook不仅仅是一个社交网络，更是一个数字化社交的生态系统&#…

阅读更多...

蓝桥杯 2022 省A 选数异或

蓝桥杯 2022 省A 选数异或

一种比较无脑暴力点的方法，时间复杂度是(nm)。 (注意的优先级比^高，记得加括号(a[i]^a[j])x） #include <iostream> #include <vector> #include <bits/stdc.h> // 包含一些 C 标准库中未包含的特定实现的函数的头文件 usi…

阅读更多...

最新文章

推荐文章