【Kafka】Kafka生产者如何实现冥等的?

Kafka的生产者在发送数据到broker,如果broker在收到消息后崩溃或者断开连接,导致生产者没有接收到成功响应,这时会触发重试机制,这种场景下回导致消息的重复。

冥等性

如果一个操作被执行多次,结果与执行一次相同,那么这个操作就是冥等的。

冥等生产者

冥等生产者的工作原理

  • 启用了冥等生产者,那么每条消息都将包含生产者的ID(PID)和序列号。信息将与目标的topic和分区组合在一起,用于唯一表示一条消息。
  • broker收到了之前已经收到的消息,那么将拒绝接收该消息,并且返回错误信息。生产者记录该错误,反应在指标中,但是不抛出异常,也不触发告警。

生产者故障时冥等是怎样的?

  • 生产者重启:当一个生产者发生故障时,我们通常会创建新的生产者来代替他——手动重启或者自动拉起等,这是生产者在连接borker时会生成生产者ID,每次初始化时,都会产生一个新的id,这意味着如果一个生产者发生故障后,重启后的生产者发送了一条旧生产者已经发送过的数据,那么broker无法检测到重复。

  • broker发生故障:当一个broker发生故障,控制器将会为首领副本在该broker上的分区重新选举首领。

    • 每次生成新消息时,首领副本会用最后5个序列号更新内存中生产者状态,跟随者副本在复制消息时,会将该信息更新到自己的内存,所以当跟随者成为新首领时,已经有了最新的序列号来验证新消息的生成。
    • broker发生崩溃,但是没有更新最后一个快照时,由于生产者ID和序列号也是Kafak消息格式的一部分,在进行故障恢复时,通过旧快照+分区最新日志,可以恢复生产者的状态,等故障恢复完成之后,一个新的快照就保存好了。
    • 不彻底的首领选举broker期望接收消息2后面就跟随的消息3,但是接收到了消息27,这时broker会抛出“乱序”的错误,如果使用了不带事务的冥等生产者,这个错误可能会被忽略。该场景下 有可能消息3-消息26发生了丢失,需要检查是否发生了不彻底的首领选举

冥等生产者的局限性

  • 仅能防止由生产者内部重试逻辑引起的消息重复。
  • 不能防止代码中重复发送逻辑,因为这种对于kafka来说是两个消息
  • 使用过程中建议使用生产者内置的重试机制,而不是在应用程序中自行进行重试。

使用冥等生产者

  • enable.idempotence:生产者配置设置该值为true,在acks=all的配置下,性能基本不会有差异
  • transactional.id:可选参数,主要用于事务
启用冥等性后生产者的变化
  • 生产者启动时会额外调用一个API来获取生产者ID
  • 每个消息批次中第一条消息包含生产者ID和序列号(批次中其他消息基于第一条消息递增)
  • broker会验证每一个生产者实例的序列号,保证没有重复消息
  • 每个分区的消息顺序都将得到保证。

总结

通过启用Kafka的冥等生产者,可以保证每条消息在分区中仅被写入一次,即使触发了生产者重试机制也不会导致消息重复。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42403.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件性能测试中的“假阳性”陷阱

软件性能测试中的“假阳性”陷阱主要表现为错误警报频繁、资源浪费严重、测试可信度降低。其中,错误警报频繁是最常见且最严重的问题之一,“假阳性”现象会导致开发团队在解决不存在的问题上花费大量时间。据行业调查显示,超过30%的性能优化成…

AwesomeQt分享3(含源码)

AwesomeQt 这个项目包含了多个Qt组件的使用示例,旨在展示Qt各种强大功能的实现方式。 源码分享 github: awesome_Qtgitee: 后续同步 项目进度 QCustomPlot曲线控件示例 支持排序和筛选的列表控件示例 支持排序和筛选的表格控件示例 属性表示例 Dock窗口示例 自绘…

如何验证极端工况下的系统可靠性?

验证极端工况下系统可靠性的方法主要包括设计极限测试、环境应力筛选(ESS)、可靠性预测与建模。其中,设计极限测试最为关键,通过在试验中施加超过预期使用条件的应力,可以有效评估系统的真实承受能力和潜在弱点。这类测…

[计算机网络]网络I/O模型

欢迎来到啾啾的博客🐱。 这是一个致力于构建完善的Java程序员知识体系的博客📚,记录学习的点滴,分享工作的思考、实用的技巧,偶尔也分享一些杂谈💬。 欢迎评论交流,感谢您的阅读😄。…

MyBaitis-Plus 使用动态表名 selectPage 不生效

在使用 MyBatis-Plus 时,采用动态表名策略后,selectPage 方法无法正常生效。 MyBatis-Plus动态表名插件配置MyBatis-Plus动态表名失效原因MyBatis-Plus动态表名失效解决办法 MyBatis-Plus动态表名插件配置 以下是我项目中 MyBatis - Plus 的插件配置&am…

C语言基础—构造类型

数据类型 1.基本类型/基础类型 整型 短整型:short[int] --2字节 基本整型:int --4字节 长整型:long[int] --32位4字节/64位8字节 长长整型:long long [int] (C99) 注意:以上类型又都分为sig…

交流电机类型及其控制技术

交流电机可分为同步电机和异步电机两大种类,如果电机转子的转速与定子旋转磁场的转速相等,转子与定子旋转磁场在空间同步地旋转,这种电机就称为同步电机。如果电机转子的转速不等于定子旋转磁场的转速,转子与定子旋转磁场在空间旋…

「HTML5+Canvas实战」星际空战游戏开发 - 纯前端实现 源码即开即用【附演示视频】

纯前端实现星际空战游戏【简易版】 博主上次分享的简易版飞机大战收到了不少建议,今天再给大家来一波福利!带来全新升级的飞机大战进阶版!不仅拥有更丰富的游戏机制和更精美的游戏画面,还加入了超燃的BOSS战斗系统。源码完全免费开放,拿来即用无门槛,欢迎感兴趣的小伙伴…

7-项目负责人-添加产品

点击一个项目集,进入项目集的页面。可以进行产品、项目、人员和干系人的管理。 点击“添加产品”,为该项目集添加关联产品。一个项目集可以关联多个产品。还可以通过“产品线”管理一些列产品。 产品。

深度赋能!北京智和信通融合DeepSeek,解锁智能运维无限可能

在数字化飞速发展的今天,传统运维模式面临着设备规模激增、故障复杂度攀升、人工响应滞后等多重挑战。随着DeepSeek、腾讯元宝等AI大模型的兴起,为传统运维模式带来了新的变革。 北京智和信通基于DeepSeek大模型技术,将AI和运维场景深度融合&…

flex和bison笔记

文章目录 flex语法:定义部分:规则部分:flex全局变量:yyin: bison和flex联合编译: flex词法分析 bison语法分析 flex有两种使用方式,一种是flex单独做一个词法分析程序,另一种是flex和bison协同构建一个词法语法分析程序 我们在北…

rbpf虚拟机-call指令

文章目录 一、概述背景知识 二、call 指令的主要方法2.1 注册辅助函数2.2 执行辅助函数 三、完整代码示例与详解3.1 示例辅助函数3.2 测试虚拟机的 call 指令测试代码代码解析 四、总结 Welcome to Code Blocks blog 本篇文章主要介绍了 [rbpf虚拟机-call指令] ❤博主广交技术…

Java构造函数与普通函数

1.概解 tips: 1.声明函数主要用public/private,public可以在其他函数中访问。 2.public后面跟函数返回类型,void表示无返回值。 3.main函数是自动执行的构造函数,而其他函数除非被调用则不会被自动执行 运行结果&#xff1a…

MySQL: 创建两个关联的表,用联表sql创建一个新表

MySQL: 创建两个关联的表 建表思路 USERS 表:包含用户的基本信息,像 ID、NAME、EMAIL 等。v_card 表:存有虚拟卡的相关信息,如 type 和 amount。关联字段:USERS 表的 V_CARD 字段和 v_card 表的 v_card 字段用于建立…

A2 最佳学习方法

记录自己想法的最好理由是发现自己的想法,并将其组织成可传播的形式 (The best reason for recording what one thinks is to discover what one thinks and to organize it in transmittable form.) Prof Ackoff 经验之谈: 做培训或者写文章&#xff…

六十天前端强化训练之第三十二天之Babel 转译配置大师级深度讲解

欢迎来到编程星辰海的博客讲解 看完可以给一个免费的三连吗,谢谢大佬! 目录 一、核心概念与知识体系详解 1. Babel 工作原理全景解析 二、完整配置方案(带详细注释) 1. 进阶版 .babelrc 配置 2. Webpack 集成配置&#xff08…

Linux 下安装和使用 Jupyter Notebook

Jupyter Notebook / Lab 是 Python 开发和数据分析中不可或缺的工具。为了避免环境污染,推荐使用虚拟环境方式安装并启动它。本教程将教你如何: 安装 Python、pip、venv使用虚拟环境安装 Jupyter设置登录密码启动并远程访问编写一个一键启动脚本&#x…

【云成本优化案例】K8s计费探针让跨境电商企业节省30%云预算

01. 财务“谜案”:消失的30%云预算 "我们的K8s集群资源利用率高达78%,但业务部门总说云账单对不上。"某跨境电商企业CTO的报案记录,揭开了一场云原生时代的财务谜案。该企业技术团队自查了所有资源配额和HPA配置,却始…

PyTorch 分布式训练(Distributed Data Parallel, DDP)简介

PyTorch 分布式训练(Distributed Data Parallel, DDP) 一、DDP 核心概念 torch.nn.parallel.DistributedDataParallel 1. DDP 是什么? Distributed Data Parallel (DDP) 是 PyTorch 提供的分布式训练接口,DistributedDataPara…

蓝桥杯[每日一题] 真题:连连看

题目描述 小蓝正在和朋友们玩一种新的连连看游戏。在一个 n m 的矩形网格中,每个格子中都有一个整数,第 i 行第 j 列上的整数为 Ai, j 。玩家需要在这个网格中寻找一对格子 (a, b) − (c, d) 使得这两个格子中的整数 Aa,b 和 Ac,d 相等,且它…