Go微服务: 分布式之TCC事务

TCC 分布式事务

  • T: Try 预处理, 尝试执行,完成所有的业务检查,做好一致性,预留必要的业务资源,做好准隔离性
  • C: Confirm 确认,如果所有的分支Try都成功了, 就到了这个阶段, Confirm 是真正执行业务的过程, 不做任何业务检查, 只使用 try 阶段预留的业务资源
  • C: Cancel 取消,所有的分支中,如果有一个失败了,则走到 Cancel 的阶段,Cancel 就释放了 Try 阶段预留的业务资源
  • 所以,Confirm 和 Cancel 是互斥的,只会执行一个,按照TCC的协议,Confirm 和 Cancel 只返回成功,不返回失败
  • 如果有网络问题,或服务器临时故障, 比如崩溃,掉电这种, 事务管理器会进行重试,最终让他成功
  • 在 Try 阶段要做业务检查,保障一致性以及资源预留隔离的一些问题
  • 此阶段只是一个初步的操作, 它和后续的Confirm一起才能真正构成完整的业务逻辑, 这个算是一部分,当所有的 Try 都完成了,就会向下执行,到Confirm
  • Confirm 阶段做一个确认提交, Try 阶段的所有分支事务执行成功后, 开始执行 Confirm, 采用TCC时候,只要Try 成功了,就表示Confirm 阶段不会出错,如果 Confirm 阶段出错,就引入重试机制, 或者人工处理
  • 上图是在 Try 阶段, 资源2执行失败,资源1执行成功, 要回滚资源1,这时候资源1要回滚,就是执行 Cancel, 业务执行错误,需要回滚,执行分支的事务的业务取消,预留资源的释放,一般认为Cancel阶段也是一定成功的, 如果Cancel 出错,也是重试机制和人工处理
  • 上面全局事务发起方是全局事务的管理器,是独立的第三方,可以实现独立的服务,会生成全局的事务记录,全局的事务id贯穿整个分布式事务的调用链,类似 jaeger 的链路追踪traceID,都是分布式的产品,这些产品设计思路都是相互借鉴,所以,这个全局事务管理器可以追踪和调用状态,由于 Confirm 和 Cancel 失败需要进行重试, 所以要实现幂等性,也就是说同一个操作,无论请求多少次,结果都应该是相同的
  • TCC 的三种异常处理:空回滚,幂等,悬挂
    • 1 )空回滚:在没有调用 Try 阶段的方法而调用了第二阶段的 Cancel 方法
    • Cancel 方法要识别出这是一个空回滚, 然后直接返回成功
    • 也就是说空回滚在某种情况下,没有执行 Try, 就直接回滚了
    • 2 )幂等:为了保证TCC的二阶段提交重试机制不会引发数据不一致
    • 就要求TCC的二阶段Try, Confirm, Cancel 接口保证幂等,这样不会重复使用或者释放资源,如果幂等没有控制做好,就很容易导致数据不一致的严重问题
    • 解决思路是增加执行状态,每次执行前,就要查询状态,这就是说你能不能证明你的状态执行到哪里了,可以做一个记录
    • 3 )悬挂:对于一个分布式事务,二阶段的Cancel接口比Try接口先执行了
    • 悬挂对于分布式的二阶段,Cancel 接口比Try接口先执行
    • 对比空回滚是Try是不执行;而悬挂是Cancel先执行,Try再执行
    • 它的解决思路是,如果二阶段执行成功,一阶段就不能再继续执行了,在执行一阶段事务时要判断一下,全局事务是否已经有二阶段事务的记录,如果有,就不执行Try了

TCC 为何这么难?


1 ) 从代码上来说

  • 可以把我们的TCC放到我们的代码,或者说放到一些场景里来看一下
  • 好,我们先从代码说起, 那我们在这里先新建一个目录,就叫 TCC Demo
  • 按照TCC的规则来,我们每一个方法函数都需要有这三个函数: Try, Confirm, Cancel
  • 比如订单业务,有三个函数
    • func TryOrder() {}
    • func ConfirmOrder() {}
    • func CancelOrder() {}
  • 比如下单的时候,需要协同构建库存,增加积分
  • 对于库存来说, 有:
    • func TryStock(){}
    • func ConfirmStock(){}
    • func CancelStock(){}
  • 对于积分来说,有:
    • func TryPoint(){}
    • func ConfirmStock(){}
    • func CancelOrder(){}
  • 如果我们业务中有10个这种,那么我们要写30个这类服务,而且需要有数据库的配合,非常的繁琐

2 ) 基于业务场景来看

  • 先看左边的订单服务,它有自己的这个mysql数据库。它第一步先启动事物和这个TCC事务管理器去交互
  • 它启动事物之后,第二步就调用这个Try,调用所有的资源上的Try
  • 第三步就是要执行提交或者回滚,现在,我们的Try都是ok的
  • 下面它就要执行第四步,这第四步的这个Confirm和Cancel是互斥的, 只能择其一执行
  • 因为你这个Try执行成功了,就直接都是 confirmStock 和 confirmPoint
  • 如果要是有问题,中间可能就是 CancelStock 和 CancelPoint
    在实际开发中一般是一个什么样的情况呢?
    • 就是说 Try 一般是执行主业务的, 比如我们有一个非常难的业务, 在try里基本都搞定了
    • 那对于这个 Confirm和Cancel, 它一般都是基本是比较简单的操作
    • 其实一般只要Try里没有问题, 那么Confirm和这个Cancel就基本上可以认为是没有太大问题,但是还有其他的问题
    • 并不是说,Try ok了,然后 Confirm OK了,Cancel 也 ok 了,就没有问题
    • 分布式的复杂,它是存在各种问题的,比如说你这个分布式网络,你永远不要相信分布式里网络永远是好的
    • 或者说我现在这个库存有另一个小组维护,这个库存它没有问题,但是我们这个积分服务挂了,或者说很慢
    • 我们说这个库存服务,还有这个积分服务,都是其他小组维护的,我们站在我们这个订单角度来说,比如说我是订单服务的负责人
    • 那我不能说动人家这个积分服务的这个代码,比如说积分服务,是挂了或者处理很慢
    • 就要去看这个TCC的事务管理器了,其实这个TCC在开启事务之前,它会详细的记录日志
    • 它有一个日志,每个服务调用了哪个接口,当前事务执行到哪里?
    • 比如,即便积分服务挂了,重启了,对吧?重启以后,我们找到日志,找到这个日志仍然可以继续执行
    • 假如,我们的积分服务 Cancel 执行这个出错了, 那么我们的TCC事务会一直重试
    • 那么TCC事务管理器,要保证执行Cancel不出错,它就会重试。
    • 这样一来就可以解决大部分的网络带来的这个问题
    • 因为Cancel, Confirm, 这里面的这个业务逻辑基本不是很复杂
    • 可能改个状态,或者是添加个什么东西,就是这种类型的,它可能就是网络抖动, 给你造成了一下这个小麻烦
    • 那你你这个重试几次之后呢,补偿一下就可以
    • 从这儿可以看到TCC事务管理器控制整个流程
  • 我们调用TCC,如果Try阶段有问题,那TCC框架就会执行服务的Cancel逻辑撤销之前的操作
  • 如果,我们调用这个TCC如果Try阶段它就有问题,比如说你的这个业务太复杂了,在某个地方突然出了一个小bug
  • 那么TCC框架就会执行各种Cancel逻辑撤销之前的操作
  • 如果上图这个Confirm或Cancel它就是一直不成功,怎么办?
  • 其实分布式它本身虽然比较复杂,但是大部分业务的Confirm和Cancel代码就是很简单
  • 一般的都是网络问题,通过一直调用的进行补偿就可以了
  • 如果一直不成功,你可以在某种程度上做一个记录器进行报警,人为干预
  • 自己做的计录器可以按你自己的业务逻辑,因为你这个TCC事务,比如三次或五次都不成功,它要保证成功,则可以通过电话,微信,钉钉通知人报警
  • 这时候,比如说开发人员肯定是收到了嘛,人为介入解决这个问题就行了嘛
  • 所以,其实TCC真的是不简单,我们只要使用了微服务和这个分布式,就没有办法避免没有这些问题,只要你用了就会遇到这些问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/343736.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】图论入门

引入 数据的逻辑结构: 集合:数据元素间除“同属于一个集合”外,无其他关系线性结构:一个对多个,例如:线性表、栈、队列树形结构:一个对多个,例如:树图形结构&#xff1…

Liunx环境下redis主从集群搭建(保姆级教学)02

Redis在linux下的主从集群配置 本次演示使用三个节点实例一个主节点,两个从节点:7000端口(主),7001端口(从),7002端口(从); 主节点负责写数据&a…

澳大利亚和德国媒体投放-国外新闻发稿-海外软文推广

德国媒体 Firmenpresse德国新闻 Firmenpresse德国新闻是一家备受欢迎的新闻发布平台,其好友搜索引擎在收录网站方面表现出色。如果您希望更好地将您的新闻传播给德国受众,Firmenpresse德国新闻将是一个理想的选择。 Frankfurt Stadtanzeiger法兰克福城…

《深入浅出C语言:从基础到指针的全面指南》

1. 简介 C语言是一种通用的编程语言,广泛应用于系统编程、嵌入式系统和高性能应用程序。它由Dennis Ritchie在1972年开发,并且至今仍然非常流行。C语言以其高效、灵活和强大的功能著称,是许多现代编程语言的基础。 2. 基本语法 2.1 Hello, …

K8s Pod的QoS类

文章目录 OverviewPod的QoS分类Guaranteed1.如何将 Pod 设置为保证Guaranteed2. Kubernetes 调度器如何管理Guaranteed类的Pod Burstable1. 如何将 Pod 设置为Burstable2.b. Kubernetes 调度程序如何管理 Burstable Pod BestEffort1. 如何将 Pod 设置为 BestEffort2. Kubernete…

ROS云课三分钟外传之CoppeliaSim_Edu_V4_1_0_Ubuntu16_04

三分钟热度试一试吧,走过路过不要错过。 参考之前: 从云课五分钟到一分钟之v-rep_pro_edu_v3_6_2-CSDN博客 git clone https://gitcode.net/ZhangRelay/v-rep_pro_edu_v3_6_2_ubuntu16_04.gittar -xf v-rep_pro_edu_v3_6_2_ubuntu16_04/V-REP_PRO_EDU…

在当前页面拿到抽屉弹窗页面中从后端返回的值 #Vue3 #两个.vue页面之间传值问题

在当前页面拿到抽屉弹窗页面中从后端返回的值 #Vue3 #两个.vue页面之间传值问题 *解决方法一: 将抽屉弹窗里从后端返回得到的值缓存在浏览器中,在当前页面中从浏览器中获取该值。 (原理其实就是借助第三个盒子来传递一下值,太小学…

在npm发布自己的组件包

目录 前言 正文 npm和git的对比 Node环境的配置 具体发布步骤 ※※需要注意的是 尾声 🔭 Hi,I’m Pleasure1234🌱 I’m currently learning Vue.js,SpringBoot,Computer Security and so on.👯 I’m studying in University of Nottingham Ni…

金融领域的AI解决方案

AI可赋能金融营销、资管、风控等领域,面向金融消费者、金融机构和金融监管机构,改善金融 市场信息对称性并提升金融交易的效率和安全性。目前,金融行业各机构对于安全认证和客户身份识别的需求较为迫切,身份识别和智能客服应用和落…

如何在没有密码的情况下解锁iPhone

通常,您可以使用密码、FaceID 或 Touch ID 轻松解锁 iPhone。但是,有时您可能会忘记密码、iPhone 已停用或您的二手手机已锁定。在这种情况下,您必须绕过 iPhone 密码才能访问您的设备。在本文中,我们将向您介绍 5 种经过测试的方…

JavaEE初阶---多线程编程(一.线程与进程)

目录 🤣一.线程与进程的概念与联系: 进程的基本概念: 线程的基本概念: 进程和线程的区别与联系: 🙃代码执行实列: 1.通过继承Thread父类来实现多线程 2.通过实现Runnable接口来实现多线程…

Leetcode3171. 找到按位与最接近 K 的子数组

Every day a Leetcode 题目来源:3171. 找到按位与最接近 K 的子数组 解法1:位运算 优化: 代码: /** lc appleetcode.cn id3171 langcpp** [3171] 找到按位与最接近 K 的子数组*/// lc codestart class Solution { public:int m…

路由器作为网络扩展器——设置桥接、路由模式

下面提到的路由器都是家用路由器 一、有线桥接(交换模式) 1.连接示意图 (副路由器只看交换模式部分) 副路由器充当交换机的角色 二、无线桥接(与有线类似) (副路由器的无线信号 连接 主路由器的无线信号) 三、路由模式 1.连接示意图 (副路由器只看…

RT-DETR 详解之 Efficient Hybrid Encoder

在先前的博文中,博主介绍了RT-DETR在官方代码与YOLOv8集成程序中的训练与推理过程,接下来,博主将通过代码调试的方式来梳理RT-DETR的整个过程。 整体结构 RT-DETR的代码调试大家可以参考博主这篇文章: 在梳理整个代码之前&…

Serverless 使用OOS将http文件转存到对象存储

目录 背景介绍 系统运维管理OOS 文件转存场景 前提条件 实践步骤 附录 示例模板 背景介绍 系统运维管理OOS 系统运维管理OOS(CloudOps Orchestration Service)提供了一个高度灵活和强大的解决方案,通过精巧地编排阿里云提供的OpenAPI…

监控摄像机接入GB28181平台如何获取监控视频

各种型号监控摄像头或硬盘录像机接入 GB28181平台配置过程非常简单明了,但有些细节需要注意,避免走弯路。 1、基本要求 (1)网络要求 总的来说,只要监控设备和GB28181平台的网络是连通的,设备可以主动访问…

2024 cicsn SuperHeap

文章目录 参考沙箱存在protobuf逆向buy_booksee_bookreturn_bookedit_booksearch_book 思路exp 参考 https://hakuya.work/post/7 https://akaieurus.github.io/2024/05/20/2024%E5%9B%BD%E8%B5%9B%E5%88%9D%E8%B5%9Bpwn-wp/#SuperHeap https://blog.csdn.net/m0_63437215/art…

mysql工具----dbForgeStudio2020

dbForgeStudio2020,除了基本的操作外,还具有可调试mysql存储过程的功能,是一个不可夺得的mysql软件工具。 本文的软件将简单介绍软件的安装方式,仅供学习交流,不可做它用。 1.安装软件,安装后&#xff0c…

Linux 中常用的设置、工具和操作

1.设置固定的ip地址步骤 1.1 添加IPADDR“所设置的固定ip地址” TYPE"Ethernet" PROXY_METHOD"none" BROWSER_ONLY"no" BOOTPROTO"static" DEFROUTE"yes" IPV4_FAILURE_FATAL"no" IPV6INIT"yes" IPV6…

Intel x86+FPGA:智能AI计算机系统在支气管导航机器人的应用

随着人工智能的快速发展、技术的突破及应用领域的逐渐广泛化。医疗机器人作为人工智能时代在医疗领域应用的深化,能够有效帮助医生进行一系列的医疗诊断和辅助治疗,在有效缓解医疗资源紧张的问题下推动医疗信息化的发展。 智慧医疗场景应用 从应用场景来…