再问你一遍,你真的了解分布式事务吗?
ccwgpt 2024-09-26 07:51 39 浏览 0 评论
对于分布式事务的概念,可能还有很多朋友不理解或者理解得不是很深刻,本文将带大家一文吃透“分布式事务”。
本地事务
事务 Transaction 由一组 SQL 组成,具有四个 ACID 特性:
- Atomicity:原子性,构成事务的一组SQL,要么全部生效,要么全不生效,不会出现部分生效的情况。
- Consistency:一致性,数据库经过事务操作后从一种状态转变为另一个状态。可以说原子性是从行为上描述,而一致性是从结果上描述。
- Isolation:隔离性,事务操作的数据对象相对于其他事务操作的数据对象相互隔离,互不影响。
- Durability:持久性,事务提交后,其结果就是永久性的,即使发生宕机(非磁盘损坏)。
事务实现
对于 MySQL 数据库(InnoDB 存储引擎)而言,隔离性是通过不同粒度的锁机制来实现事务间的隔离。
原子性、一致性和持久性通过 redo log 重做日志和 undo log 回滚日志来保证的。
redo log:当数据库对数据做修改的时候,需要把数据页从磁盘读到 buffer pool 中,然后在 buffer pool 中进行修改。
那么这个时候 buffer pool 中的数据页就与磁盘上的数据页内容不一致,称 buffer pool 的数据页为 dirty page 脏数据。
如果这个时候发生非正常的 DB 服务重启,那么这些数据还没在内存,并没有同步到磁盘文件中(注意,同步到磁盘文件是个随机 IO),也就是会发生数据丢失。
如果这个时候,能够在有一个文件,当 buffer pool 中的 data page 变更结束后,把相应修改记录记录到这个文件(注意,记录日志是顺序 IO)。
那么当 DB 服务发生 crash 的情况,恢复 DB 的时候,也可以根据这个文件的记录内容,重新应用到磁盘文件,数据保持一致。
undo log:undo 日志用于存放数据被修改前的值,如果修改出现异常,可以使用 undo 日志来实现回滚操作,保证事务的一致性。另外 InnoDB MVCC 事务特性也是基于 undo 日志实现的。
undo 日志分为 insert undo log(insert 语句产生的日志,事务提交后直接删除)和 update undo log(delete 和 update 语句产生的日志,由于该 undo log 可能提供 MVVC 机制使用,所以不能再事务提交时删除)。
问题引入
CAP 理论
CAP 原则又称 CAP 定理,指的是在一个分布式系统中的一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)。
CAP 原则指的是,这三个要素最多只能同时实现两点,不可能三者兼顾。但由于在分布式系统中,分区容错性必然存在,所以只能在一致性和可用性妥协。
传统的 DBMS,如 MySQL 其实 CA 组合,在主从架构下,读写分离的情况下,是牺牲一定的一致性的(主从延迟)。
Base 理论:
- base available,基本可用,分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。
- soft state,软状态,允许系统中存在中间状态,这个状态不影响系统可用性。
- eventually consistent,最终一致性,系统的中间状态经过短暂的时间后到达一致状态。
如何解决
场景举例
考虑这样一种业务场景,系统 A 调用系统 B 的退款服务进行退款,系统 A 更改内部退款状态,接着调用系统 C 的短信服务通知用户。
在这样的一个场景下,由于网络不可靠的必然存在,存在 A、B、C 三个系统之间一致性的问题。
本地表
针对上述场景,设计两张表:退款记录表和短信发送记录表以及相应的补偿 Job。
具体实现过程:
- 新增退款记录表,状态为处理中。
- 调用系统 B 的退款服务进行退款。
- 更新退款记录状态为对应的状态(成功/失败)。
- 如果退款成功,则新增短信发送记录,记录状态为待发送。
- 调用系统 C 的短信服务,发送短信。
- 更新短信发送记录为已发送。
退款补偿 Job,查询退款记录表中处理中的记录,调用系统 B 的退款服务,退款成功处理:
- 新增短信发送记录,记录状态为待发送。
- 调用系统 C 的短信服务,发送短信。
- 更新短信发送记录为已发送。
短信通知补偿 Job,查询短信发送记录中待发送的记录,调用系统 C 的短信服务:
- 调用系统 C 的短信服务,发送短信。
- 更新短信发送记录为已发送。
注意:
- 系统 B 和系统 C 需要根据调用方传的 uuid 支持幂等。
- 系统 A、B、C 会出现短暂的不一致,但最终一致。
事务消息
可以将其视为两阶段提交消息实现,以确保分布式系统中的最终一致性。事务性消息可确保本地事务的执行和消息的发送可以原子方式执行。
但是由于事务消息异步的特性,调用方拿不到消费方的处理结果,适用于不关心对方的返回结果/对方负责保证处理成功。
针对上述场景,增加两个事务消息的方式解决一致性问题,系统 A 通过发送事务消息的方式与系统 B 和系统 C 进行交互。
具体实现过程:
- 发送退款的事务消息。
- 新增退款记录,状态为:处理中。
- Commit 退款事务消息。
提供 MQ 事务 callback:
- 退款 callback 查询:有退款记录且为处理中则 Commit;其他则 Rollback。
- 发送短信 callback 查询:有退款记录且成功则 Commit;其他则 Rollback。
退款同步 Job,查询退款记录表中处理中的记录,调用系统 B 的退款查询接口同步状态,其中退款成功处理:
- 发送短信的事务消息
- 更新退款记录为成功
- Commit 短信事务消息
相关理论
二阶段提交
二阶段提交是解决分布式事务问题的重要理论基础,但也存在着明显的问题:
- 阻塞问题,参与者将协议消息发送给协调器后,它将阻塞直到收到提交或回滚,只能依赖协调者的超时机制。
- 协调者单点问题,如果协调者出现故障,则某些参与者将一直无法收到提交或回滚的消息。
为了解决二阶段提交出现的问题,又有了三阶段提交(Three-phase commit):
- 解决阻塞问题:将 2PC 中的第一阶段一分为二,提供了一个 CanCommit 阶段,此阶段并不锁定资源,这样可以大幅降低阻塞概率。
- 解决单点问题:在参与者这边也引入了超时机制。
DTP Model
X/Open 分布式事务处理 DTP(Distributed Transaction Processing)模型是一种软件体系架构,已经成为事实上的事务模型组件的行为标准。
它允许多个应用程序共享由多个资源管理器提供的资源,并允许其工作被协调为全局事务:
- ApplicationProgram(AP),应用程序定义了事务边界并指定构成事务的操作。
- ResourceManager(RM),资源管理器用来管理我们需要访问的共享资源,我们可以将它理解为关系数据库、文件存储系统、消息队列、打印机等。
- TransactionManager(TM),事务管理器是一个独立的组件,他为事务分配标识符并监视事务的执行情况,负责事务完成和故障恢复。
- CommunicationResourceManager(CRM),通信资源管理器控制一个或多个 TM domain 之间分布式应用的通信。
XA Specification:XA 规范是 X/Open 关于分布式事务处理(DTP)的规范。规范描述了全局的事务管理器与局部的资源管理器之间的接口。
XA 规范的目的是允许多个资源(如数据库,应用服务器,消息队列,等等)在同一事务中访问,这样可以使 ACID 属性跨越应用程序而保持有效。
XA 使用两阶段提交来保证所有资源同时提交或回滚任何特定的事务。
XA 规范描述了资源管理器要支持事务性访问所必需做的事情。
TCC
Saga
在 Saga 模式下,分布式事务内有多个参与者,每一个参与者都是一个冲正补偿服务,需要用户根据业务场景实现其正向操作和逆向回滚操作。
分布式事务执行过程中,依次执行各参与者的正向操作,如果所有正向操作均执行成功,那么分布式事务提交。
如果任何一个正向操作执行失败,那么分布式事务会去退回去执行前面各参与者的逆向回滚操作,回滚已提交的参与者,使分布式事务回到初始状态。
Saga 模式下分布式事务通常是由事件驱动的,各个参与者之间是异步执行的,Saga 模式是一种长事务解决方案。
Saga 模式的优势是:
- 一阶段提交本地数据库事务,无锁,高性能。
- 参与者可以采用事务驱动异步执行,高吞吐。
- 补偿服务即正向服务的“反向”,易于理解,易于实现。
缺点:Saga 模式由于一阶段已经提交本地数据库事务,且没有进行“预留”动作,所以不能保证隔离性。
开源项目
Seata
Seata 是一款开源的分布式事务解决方案,致力于在微服务架构下提供高性能和简单易用的分布式事务服务。支持 AT、TCC、Saga、XA 四种模式,对微服务框架支持友好。
如下图所示,Seata 中有三大模块,分别是 TM、RM 和 TC。其中 TM 和 RM 是作为 Seata 的客户端与业务系统集成在一起,TC 作为 Seata 的服务端独立部署:
- TC:事务协调者,维护全局和分支事务的状态,驱动全局事务提交或回滚。
- TM:事务管理器,定义全局事务的范围:开始全局事务、提交或回滚全局事务。
- RM:资源管理器,管理分支事务处理的资源,与 TC 交谈以注册分支事务和报告分支事务的状态,并驱动分支事务提交或回滚。
在 Seata 中,分布式事务的执行流程:
- TM 开启分布式事务(TM 向 TC 注册全局事务记录)。
- 按业务场景,编排数据库、服务等事务内资源(RM 向 TC 汇报资源准备状态 )。
- TM 结束分布式事务,事务一阶段结束(TM 通知 TC 提交/回滚分布式事务)。
- TC 汇总事务信息,决定分布式事务是提交还是回滚。
- TC 通知所有 RM 提交/回滚资源,事务二阶段结束。
①AT 模式
AT 模式是一种无侵入的分布式事务解决方案。
在 AT 模式下,用户只需关注自己的“业务 SQL”,用户的 “业务 SQL” 作为一阶段,Seata 框架会自动生成事务的二阶段提交和回滚操作。
- 一阶段:业务数据和回滚日志记录在同一个本地事务中提交,释放本地锁和连接资源。
- 二阶段:提交异步化,非常快速地完成。回滚通过一阶段的回滚日志进行反向补偿。
在一阶段,Seata 会拦截“业务 SQL”,首先解析 SQL 语义,找到“业务 SQL”要更新的业务数据,在业务数据被更新前,将其保存成“before image”,然后执行“业务 SQL”更新业务数据,在业务数据更新之后,再将其保存成“after image”,最后生成行锁。
以上操作全部在一个数据库事务内完成,这样保证了一阶段操作的原子性。
②TCC 模式
一个分布式的全局事务,整体是两阶段提交的模型。全局事务是由若干分支事务组成的,分支事务要满足两阶段提交的模型要求,即需要每个分支事务都具备自己的:
- 一阶段 prepare 行为。
- 二阶段 commit 或 rollback 行为。
TCC 模式,不依赖于底层数据资源的事务支持:
- 一阶段 prepare 行为:调用自定义的 prepare 逻辑。
- 二阶段 commit 行为:调用自定义的 commit 逻辑。
- 二阶段 rollback 行为:调用自定义的 rollback 逻辑。
所谓 TCC 模式,是指支持把 自定义 的分支事务纳入到全局事务的管理中。
③Saga 模式
目前 Seata 提供的 Saga 模式是基于状态机引擎来实现的,机制是:
- 通过状态图来定义服务调用的流程并生成 json 状态语言定义文件。
- 状态图中一个节点可以是调用一个服务,节点可以配置它的补偿节点。
- 状态图 json 由状态机引擎驱动执行,当出现异常时状态引擎反向执行已成功节点对应的补偿节点将事务回滚 (异常发生时是否进行补偿也可由用户自定义决定)。
- 可以实现服务编排需求,支持单项选择、并发、子流程、参数转换、参数映射、服务执行状态判断、异常捕获等功能。
状态机引擎原理:
- 图中的状态图是先执行 stateA,再执行 stateB,然后执行 stateC。
- "状态"的执行是基于事件驱动的模型,stateA 执行完成后,会产生路由消息放入 EventQueue,事件消费端从 EventQueue 取出消息,执行 stateB。
- 在整个状态机启动时会调用 Seata Server 开启分布式事务,并生产 xid,然后记录"状态机实例"启动事件到本地数据库。
- 当执行到一个"状态"时会调用 Seata Server 注册分支事务,并生产 branchId,然后记录"状态实例"开始执行事件到本地数据库。
- 当一个"状态"执行完成后会记录"状态实例"执行结束事件到本地数据库,然后调用 Seata Server 上报分支事务的状态。
- 当整个状态机执行完成, 会记录"状态机实例"执行完成事件到本地数据库,然后调用 Seata Server 提交或回滚分布式事务。
相关推荐
- 用Deepseek扩写土木工程毕业论文实操指南
-
用Deepseek扩写毕业论文实操指南一、前期准备整理现有论文初稿/提纲列清楚论文核心框架(背景、现状、意义、方法、数据、结论等)梳理好关键文献,明确核心技术路线二、Deepseek扩写核心思路...
- 985学霸亲授,DeepSeek也能绘6大科研图表,5分钟就出图
-
在实验数据处理中,高效可视化是每个科研人的必修课。传统绘图软件操作复杂、耗时费力,而智能工具DeepSeek的出现彻底改变了这一现状。本文将详解如何用DeepSeek一键生成六大科研常用图表,从思维导...
- AI写论文刷屏?大学生正在丢掉的思考力
-
一、宿舍深夜:当论文变成"Ctrl+C+V"凌晨两点的大学宿舍,小王对着电脑屏幕叹气。本该三天前开始写的近代史论文,此刻还一片空白。他熟练打开某AI写作网站,输入"论五四运动的...
- Grok在辅助论文写作上能不能既“聪明”又“可怕”?!
-
AcademicIdeas-学境思源AI初稿写作随着人工智能技术的飞速发展,论文写作这一学术任务正迎来新的助力。2025年2月18日,美国xAI公司推出了备受瞩目的Grok3模型,其创始人埃隆·...
- 大四论文沟通场景!音频转文字难题听脑AI来化解
-
大四学生都知道,写论文时和导师沟通修改意见,简直是“过关斩将”。电话、语音沟通完,想把导师说的修改方向、重点要求记下来,麻烦事儿可不少。手写记不全,用普通录音转文字工具,转完还得自己慢慢找重点,稍不注...
- 论文写作 | 技术路线图怎么画?(提供经典优秀模板参考)
-
技术路线图是一种图表或文字说明,用于描述研究目标、方法和实施计划。它展示了研究的整体框架和步骤,有助于读者理解研究的逻辑和进展。在课题及论文中,技术路线图是常见的一部分,甚至是一个类似心脏一样的中枢器...
- 25年信息系统项目管理师考试第2批论文题目写作建议思路框架
-
25年信息系统项目管理师考试第2批论文题目写作建议思路框架--马军老师
- 微信购物应尽快纳入法律框架(微信购物管辖)
-
符向军近日,甘肃省工商行政管理局发布《2016年上半年信息分析报告》。报告显示,微信网购纠纷迅猛增长,网络购物投诉呈上升趋势。投诉的主要问题有出售的商品质量不过关、消费者通过微信付款后对方不发货、购买...
- 泛珠三角区域网络媒体与腾讯微信签署《战略合作框架协议》
-
新海南客户端、南海网7月14日消息(记者任桐)7月14日上午,参加第四届泛珠三角区域合作网络媒体论坛的区域网络媒体负责人及嘉宾一行到腾讯微信总部座谈交流,并签署《战略合作框架协议》(以下简称《框架协...
- 离线使用、植入微信-看乐心Mambo手环如何打破框架
-
从2014年开始智能手环就成功进入人们的生活,至今已经演变出数据监测、信息推送、心率监测等诸多五花八门的功能,人们选择智能手环并不指望其能够改变身体健康情况,更多的是通过数据来正视自身运动情况和身体健...
- 华专网络:如何零基础制作一个网站出来?
-
#如何零基础制作一个网站出来?#你是不是觉得网站建设很复杂,觉得自己是小白,需求不明确、流程搞不懂、怕被外包公司坑……这些问题我都懂!今天华专网络就用大白话给你捋清楚建站的全流程,让你轻松get网站制...
- WAIC2024丨明日上午9点,不见不散!共同探讨智能社会与全球治理框架
-
大咖云集,硕果闪耀WAIC2024世界人工智能大会智能社会论坛将于7月5日9:00-12:00与你相约直播间WAIC2024上海杨浦同济大学哔哩哔哩多平台同步直播探讨智能社会与全球治理框架WAIC...
- 约基奇:森林狼换来戈贝尔时大家都在嘲笑 他们的阵容框架很不错
-
直播吧5月4日讯西部季后赛半决赛,掘金将迎战森林狼,约基奇赛前接受采访。约基奇说道:“当蒂姆-康纳利(森林狼总经理、前掘金总经理&曾选中约基奇)做了那笔交易(换来戈贝尔)时,每个人都在嘲笑他...
- 视频号带货为什么一个流量都没有?顶级分析框架送给你
-
视频号带货为什么一个流量都没有?遇到问题,一定是步步来分析内容,视频号带货一个流量都没有,用另外一个意思来讲,就可以说是零播放。为什么视频号带货一个流量都没有?跟你说再多,都不如来个分析框架。1、是否...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- MVC框架 (46)
- spring框架 (46)
- 框架图 (58)
- flask框架 (53)
- quartz框架 (51)
- abp框架 (47)
- jpa框架 (47)
- laravel框架 (46)
- springmvc框架 (49)
- 分布式事务框架 (65)
- scrapy框架 (56)
- shiro框架 (61)
- 定时任务框架 (56)
- java日志框架 (61)
- JAVA集合框架 (47)
- grpc框架 (55)
- ppt框架 (48)
- 内联框架 (52)
- winform框架 (46)
- gui框架 (44)
- cad怎么画框架 (58)
- ps怎么画框架 (47)
- ssm框架实现登录注册 (49)
- oracle字符串长度 (48)
- oracle提交事务 (47)