四、Kafka Broker

四、Kafka Broker

news/2024/12/23 19:01:49/文章来源:https://blog.csdn.net/hc1285653662/article/details/132418534

4.1.1 Zookeeper 存储的 Kafka 信息
在这里插入图片描述

4.1.2 Kafka Broker 总体工作流程

4.2 生产经验 - 节点的服役和退役

自己的理解：其实就是将kafka的分区，负载到集群中的各个节点上。

1、服役新节点

2、退役旧节点

4.3 kafka副本

1、副本的作用

2、Leader的选举流程

选举规则：在isr中存活为前提，按照AR中排在前面的优先。例如ar[1,0,2], isr [1，0，2]，那么leader就会按照1，0，2的顺序轮询。

3、 Leader 和 Follower 故障处理细节

两个概念：

LEO（Log End Offset）：每个副本的最后一个offset，LEO其实就是最新的offset + 1
HW（High Watermark）：所有副本中最小的LEO

4、分区副本分配

5、手动分配分区副本

`6、Leader Partition 负载平衡`

正常情况下，Kafka本身会自动把Leader Partition均匀分散在各个机器上，来保证每台机器的读写吞吐量都是均匀的。但是如果某些broker宕机，会导致Leader Partition过于集中在其他少部分几台broker上，这会导致少数几台broker的读写请求压力过高，其他宕机的broker重启之后都是follower partition，读写请求很低，造成集群负载不均衡

·最好不要设置集群自动再平衡，因为它浪费集群大量的性能·

7、生产经验——增加副本因子

在生产环境当中，由于某个主题的重要等级需要提升，我们考虑增加副本。副本数的增加需要先制定计划，然后根据计划执行

【注意】不能直接通过命令行的方式修改副本，而是需要通过一下方式来增加副本数量！

4.4 文件存储

1、文件存储机制

1） Topic 文件的存储机制
在这里插入图片描述

3）index 文件和 log 文件详解

在这里插入图片描述

2、文件清理策略

Kafka 中默认的日志保存时间为 7 天，可以通过调整如下参数修改保存时间。
Kafka 中提供的日志清理策略有 delete 和 compact 两种
delete 日志删除：将过期数据删除

compact日志压缩：对于相同key的不同value值，只保留最后一个版本。用的比较少，知道即可
在这里插入图片描述

`4.5 高效读写数据`

1）Kafka 本身是分布式集群，采用分区技术，并行度高

2）读数据采用稀疏索引，可以快速定位要消费的数据

3）顺序写磁盘
在这里插入图片描述

4）页缓存 + 零拷贝技术
零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高

PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能。当上层有写操作时，操作系统只是将数据写入PageCache。当读操作发生时，先从PageCache中查找，如果找不到，再去磁盘中读取。实际PageCache是把尽可能多的空闲内存都当做了磁盘缓存来使用

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/108523.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Java设计模式-状态模式

Java设计模式-状态模式

1.概述定义： 对有状态的对象，把复杂的“判断逻辑”提取到不同的状态对象中，允许状态对象在其内部状态发生改变时改变其行为。【例】通过按钮来控制一个电梯的状态，一个电梯有开门状态，关门状态，停止状…

阅读更多...

论文笔记： MOGRIFIER LSTM

论文笔记： MOGRIFIER LSTM

2020 ICLR 修改传统LSTM 当前输入和隐藏状态充分交互，从而获得更佳的上下文相关表达 1 Mogrifier LSTM LSTM的输入X和隐藏状态H是完全独立的机器学习笔记：GRU_gruc_UQI-LIUWJ的博客-CSDN博客这篇论文想探索，如果在输入LSTM之前&#xf…

阅读更多...

前端需要理解的跨平台知识

前端需要理解的跨平台知识

混合开发是指使用多种开发模开发App的一种开发模式，涉及到两大类技术：原生 Native、Web H5。原生 Native 主要指 iOS（Objective C）、Android（Java），原生开发效率较低，开发完成需要重…

阅读更多...

Nginx的搭建与核心配置

Nginx的搭建与核心配置

Nginx的搭建与核心配置 1、IO模型1.1I/O 模型相关概念1.2网络I/O模型1.2.1阻塞型I/O模型1.2.2非阻塞型I/O模型1.2.3多路复用I/O型1.2.4信号驱动式I/O模型1.2.5异步I/O模型 2、Nginx概述2.1Nginx功能介绍2.2基础特性2.3Web服务相关的功能2.4Nginx进程结构2.4Nginx模块2.5Nginx三…

阅读更多...

人工智能项目集合推荐(数据集模型训练 C++和Android部署)

人工智能项目集合推荐(数据集模型训练 C++和Android部署)

人工智能项目集合推荐(数据集模型训练 C和Android部署) 目录人工智能项目集合推荐(数据集模型训练 C和Android部署) 1.三维重建项目集合 ★双目三维重建 ★结构光三维重建 2.AI CV项目集合 ★人脸检测和人体检测 ★人体姿态估计(人体关键点检测) ★头部朝向估计 …

阅读更多...

Java多线程与并发编程

Java多线程与并发编程

课程地址： https://www.itlaoqi.com/chapter.html?sid98&cid1425 源码文档： 链接：https://pan.baidu.com/s/1WMvM3j6qhyjIeAT87kIcxg 提取码：5g56 Java多线程与并发编程 1-并发背后的故事什么是并发 2-你必须知道线程的概念程…

阅读更多...

【RISC-V】RISC-V寄存器简介

【RISC-V】RISC-V寄存器简介

一、通用寄存器 32位RISC-V体系结构提供32个32位的整型通用寄存器寄存器别名全称说明X0zero零寄存器可做源寄存器(rs)或目标寄存器(rd)X1ra链接寄存器保存函数返回地址X2sp栈指针寄存器指向栈的地址X3gp全局寄存器用于链接器松弛优化X4tp线程寄存器常用于在OS中保存指向进程控…

阅读更多...

第十三课宾语从句

第十三课宾语从句

文章目录前言一、宾语从句1、主语及物动词宾语从句2、主语双宾动词间接宾语直接宾语3、主语特定及物动词宾语从句（作宾语）宾补4、主语be某些形容词宾语从句5、动词不定式后面的宾语从句6、动名词后面的宾语从句7、介词后面的宾语从句9、间接引语前言一…

阅读更多...

[Go版]算法通关村第十四关白银——堆高效解决的经典问题（在数组找第K大的元素、堆排序、合并K个排序链表）

[Go版]算法通关村第十四关白银——堆高效解决的经典问题（在数组找第K大的元素、堆排序、合并K个排序链表）

目录题目：在数组中找第K大的元素解法1：维护长度为k的最小堆，遍历n-k个元素，逐一和堆顶值对比后，和堆顶交换，最后返回堆顶复杂度：时间复杂度 O ( k ( n − k ) l o g k ) O(k(n-k)logk) O(k(n−…

阅读更多...

Redis各类数据结构应用场景总结

Redis各类数据结构应用场景总结

Redis各类数据结构应用场景总结引言String应用场景 List应用场景 Hash应用场景 Set应用场景 ZSet应用场景小结引言实际面试过程中更多看重的是对Redis相关数据结构的活学活用，同时也可能会引申出Redis相关底层数据结构原理的实现，笔者最近面试过程中…

阅读更多...

高效公文校对与文字处理：走进自然语言技术的新时代

高效公文校对与文字处理：走进自然语言技术的新时代

在数字化时代的浪潮中，无论是政府材料、新闻稿、还是发言稿，高质量的文字内容成为了信息传递的核心。为了确保内容的专业性和准确性，公文校对和文字处理技术的进步成为了不可或缺的关键。本文将深入探讨自然语言处理技术如何为公文校对和文字…

阅读更多...

DMK5框选变量之后不显示其他位置的此变量高亮

DMK5框选变量之后不显示其他位置的此变量高亮

使用软件MDK5.3.8版本如下在2的位置选择之后，其他同样的变量没有高亮，因为1的原因折叠了； 展开折叠之后就可以了

阅读更多...

如何使用CSS实现一个水平居中和垂直居中的布局？

如何使用CSS实现一个水平居中和垂直居中的布局？

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 水平居中布局⭐ 垂直居中布局⭐ 写在最后 ⭐ 专栏简介前端入门之旅：探索Web开发的奇妙世界记得点击上方或者右侧链接订阅本专栏哦几何带你启航前端之旅欢迎来到前端入门之旅！这个专栏是为那些对Web开发感兴趣…

阅读更多...

使用代理突破浏览器IP限制

使用代理突破浏览器IP限制

一、实验目的: 主要时了解代理服务器的概念，同时如何突破浏览器IP限制二、预备知识： 代理服务器英文全称是Proxy Server，其功能就是代理网络用户去取得网络信息。形象的说：它是网络信息的中转站，特别是它具有一个cac…

阅读更多...

数据分析作业2

数据分析作业2

中国在 2020 年开展第七次全国人口普查，截止 2021 年 5 月 11 日普查结果公布，全国人口共1411778724人。单从数据表格看相关数据不够直观，需要进行数据可视化展示，方便查看数据结果。任务一：链接 MySQL 数据库&#x…

阅读更多...

Python爬虫框架之Selenium库入门：用Python实现网页自动化测试详解

Python爬虫框架之Selenium库入门：用Python实现网页自动化测试详解

概要是否还在为网页测试而烦恼？是否还在为重复的点击、等待而劳累？试试强大的Selenium！让你的网页自动化测试变得轻松有趣！ 一、Selenium库到底是什么？ Selenium 是一个强大的自动化测试工具，它可以让你直…

阅读更多...

前端学习记录~2023.8.10~JavaScript重难点实例精讲～第6章 Ajax

前端学习记录~2023.8.10~JavaScript重难点实例精讲～第6章 Ajax

第 6 章 Ajax 前言6.1 Ajax的基本原理及执行过程6.1.1 XMLHttpRequest对象（1）XMLHttpRequest对象的函数（2）XMLHttpRequest对象的属性 6.1.2 XMLHttpRequest对象生命周期（1）创建XMLHttpRequest对象&#xff…

阅读更多...

Scikit-Learn中的特征选择和特征提取详解

Scikit-Learn中的特征选择和特征提取详解

概要机器学习在现代技术中扮演着越来越重要的角色。不论是在商业界还是科学领域，机器学习都被广泛地应用。在机器学习的过程中，我们需要从原始数据中提取出有用的特征，以便训练出好的模型。但是，如何选择最佳的特征是一个关键问…

阅读更多...

RK3399平台开发系列讲解（存储篇）Linux 存储系统的 I/O 栈

RK3399平台开发系列讲解（存储篇）Linux 存储系统的 I/O 栈

平台内核版本安卓版本RK3399Linux4.4Android7.1🚀返回专栏总目录文章目录一、Linux 存储系统全景二、Linux 存储系统的缓存沉淀、分享、成长，让自己和他人都能有所收获！😄 📢本篇将介绍 Linux 存储系统的 I/O 原理。一、Linux 存储系统全景我们可以把 Linux 存储系…

阅读更多...

opencv的haarcascade_frontalface_default.xml等文件

opencv的haarcascade_frontalface_default.xml等文件

文章目录 GitHub下载在安装好的OpenCV文件夹下寻找opencv-python中获取 GitHub下载下载地址：https://github.com/opencv/opencv/tree/master/data/haarcascades 在安装好的OpenCV文件夹下寻找路径如下： 你安装的opencv路径\OpenCV\opencv\build\et…

阅读更多...

最新文章

推荐文章