Oracle死锁问题: enq: TX - row lock contention

 


前言


       这篇文章也是记录近期遇到的问题以及从中学到的知识 ,近期一直在救火,有些问题自认为还是挺有代表性的,有兴趣的话再继续向下看


问题现象


       线上反馈,执行批量处理EXCEL数据时,系统一直卡在进度滚动条界面。处理任务等了一个多小时也没有完成。起初,看到售后反馈这个问题时我很惊讶, 因为在这前一天,我还帮另一位售后完成了相同的处理操作。怎么隔一天就出问题了 。我习惯性的觉得操作员又弄错了配置或者又把数据填错了,处理这类问题是最让开发人员恼火的事情。

      一般系统问题分两类, 要么是程序问题要么是数据问题, 找到售后拿到了问题视频记录, 看到传回来的视频发现售后人员操作满足流程要求,没有错误, 又核实了EXCEL模板并检查模板数据,最后排查代码也没有发现明显问题, 这就不好办了


问题分析


1. 系统中发现死锁

         正当自己纠结的时候,售后告知问题复现, 能复现问题,那么就好解决了, 查询了下栈信息,发现系统多线程数据处理的时候都卡在了1条UPDATE语句上,堆栈信息如下。 (如果查看栈信息, 可参考另一篇文章 传送门:JVM记 jstack命令的时候报错Unable to open socket file)

"pool-91-thread-1" prio=6 tid=0x53116800 nid=0x3bc8 in Object.wait() [0x51b2f000]java.lang.Thread.State: TIMED_WAITING (on object monitor)at java.lang.Object.wait(Native Method)at com.star.sms.batch.TransactionGuarded.doHold(TransactionGuarded.java:75)at com.star.sms.batch.TransactionGuarded.hold(TransactionGuarded.java:60)- locked <0x32269c70> (a com.star.sms.batch.TransactionGuarded)at com.star.sms.batch.AbstractBatchAcceptTask.processByGuarded(AbstractBatchAcceptTask.java:112)at com.star.sms.batch.AbstractBatchAcceptTask.call(AbstractBatchAcceptTask.java:56)2022-08-08 18:33:57,563 INFO [com.star.sms.business.accept2.BatchAcceptService$2] pool-91-thread-2 start|size=1
2022-08-08 18:33:57,600 INFO [com.star.sms.business.accept2.AcceptSheetContext] Current Thread: pool-91-thread-2 ######accept getsequence total time : 3 #####at com.star.sms.dao.utils.SmsJdbcTemplate.update(SmsJdbcTemplate.java:599)at com.star.sms.dao.resource.support.AbstractUpdateModel.doUpdate(AbstractUpdateModel.java:115)at com.star.sms.dao.resource.support.AbstractUpdateModel.insert(AbstractUpdateModel.java:77)at com.star.sms.dao.resource.AbstractResourceDaoJdbc.insert(AbstractResourceDaoJdbc.java:149)at com.star.sms.dao.resource.logicres.jdbc.CertResourceDaoImp.addCertResource(CertResourceDaoImp.java

从日志上看, 发现很多线程都卡在了数据库update 操作上 ,所以怀疑是数据库出现了死锁,执行下面的SQL查询统计,确认是否库中存在死锁

with vw_lock AS (SELECT * FROM v$lock)
select
a.sid,
'is blocking',
(select 'sid:'||s.sid||' object:'||do.object_name||' rowid:'||dbms_rowid.rowid_create ( 1, ROW_WAIT_OBJ#, ROW_WAIT_FILE#, ROW_WAIT_BLOCK#, ROW_WAIT_ROW# )||' sql_id:'||s.sql_idfrom v$session s, dba_objects dowhere s.sid=b.sidand s.ROW_WAIT_OBJ# = do.OBJECT_ID
) blockee,
b.sid,b.id1,b.id2
from vw_lock a, vw_lock b
where a.block = 1
and b.request > 0
and a.id1 = b.id1
and a.id2 = b.id2;
select * from v$session_wait t where t.WAIT_CLASS#<>6;

 查询结果:

SID  SEQ#  EVENT  P1TEXT	P1	P1RAW	P2TEXT	P2	P2RAW	P3TEXT
381	465	enq: TX - row lock contention	name|mode	1415053316	54580004	usn<<16 | slot	851989	000D0015	sequence
410	466	enq: TX - row lock contention	name|mode	1415053316	54580004	usn<<16 | slot	851989	000D0015	sequence
411	468	enq: TX - row lock contention	name|mode	1415053316	54580004	usn<<16 | slot	851989	000D0015	sequence
431	475	enq: TX - row lock contention	name|mode	1415053316	54580004	usn<<16 | slot	851989	000D0015	sequence

从查询结果发现,库中存在大量的行锁    enq: TX - row lock contention。 enq 是一种保护共享资源的锁定机制,一个排队机制

为了进一步确认那些个SQL死锁,通过行锁记录的SID 查询SQL详情,SQL如下

select se.SID, se.sql_id,se.SERIAL#,event,program,machine,q.SQL_TEXT,q.SQL_FULLTEXT,q.LAST_ACTIVE_TIMEfrom v$session se, v$sql qwhere wait_class# <> 6and se.SQL_ID = q.SQL_IDand sid  in (371,378,379,386,391)

查询结果

SQL_ID  EVENT  PROGRAM  MACHINE  SQL_TEXT  SQL_FULLTEXT
9vg758n0nm8vt  enq: TX - row lock contention  JDBC Thin Client  star10001874  INSERT INTO LOGICRESOURCEEN...  <CLOB>
9p3mtvy6ztgxq  SQL*Net message to client  PlSqlDev.exe  BJ\STAR10001874  select se.sql_id,event, .... 	     <CLOB>
9vg758n0nm8vt	enq: TX - row lock contention	JDBC Thin Client	star10001874	INSERT INTO LOGICRESOURCEEN...	<CLOB>
9vg758n0nm8vt	enq: TX - row lock contention	JDBC Thin Client	star10001874	INSERT INTO LOGICRESOURCEEN...	<CLOB>
9vg758n0nm8vt	enq: TX - row lock contention	JDBC Thin Client	star10001874	INSERT INTO LOGICRESOURCEEN...	<CLOB>

从查询结果看到,几个会话都有 TX锁,并且都是执行INTO LOGICRESOURCEEN.。然后查看线程栈日志中 SmsJdbcTemplate#update内容, 发现确实也是在执行LOGICRESOURCEEN表添加操作。 

TX 锁问题找到了, 那么为什么会产生TX锁呢?因为不了解TX锁所以查询了官方的文档。 我们用的是10g 版本的ORACEL, 下面的信息也是10g相关

2. Oracle 官方资料中TX相关描述

从查询结果看, 行锁发生在IINSERT NTO LOGICRESOURCEEN... 插入语句上  ,查询Oracle 官方资料中enq:TX - row lock contention. 相关信息


10.3.7.2.4 TX enqueue
These are acquired exclusive when a transaction initiates its first change and held until the transaction does a COMMIT or ROLLBACK.

10.3.7.2.4 TX排队

当事务启动其第一次更改时,这些数据将以独占方式获取,并一直保持到事务执行提交或回滚。

1. Waits for TX in mode 6: occurs when a session is waiting for a row level lock that is already held by another session. This occurs when one user is updating or deleting a row, which another session wishes to update or delete. This type of TX enqueue wait corresponds to the wait event enq: TX - row lock contention.

The solution is to have the first session already holding the lock perform a COMMIT or ROLLBACK.

大概意思:模式6TX等待:发证在当会话正在等待另一个会话已持有的行级锁时。即当一个用户正在更新或删除另一个会话希望更新或删除的行时,会发生这种情况。这种类型的TX排队等待对应于等待事件enq:TX - row lock contention.

解决方案:已经持有锁的第一个会话执行提交或回滚

2. Waits for TX in mode 4 can occur if the session is waiting for an ITL (interested transaction list) slot in a block. This happens when the session wants to lock a row in the block but one or more other sessions have rows locked in the same block, and there is no free ITL slot in the block. Usually, Oracle dynamically adds another ITL slot. This may not be possible if there is insufficient free space in the block to add an ITL. If so, the session waits for a slot with a TX enqueue in mode 4. This type of TX enqueue wait corresponds to the wait event enq: TX - allocate ITL entry.

The solution is to increase the number of ITLs available, either by changing the INITRANS or MAXTRANS for the table (either by using an ALTER statement, or by re-creating the table with the higher values).

大概意思:如果会话正在等待块中的ITL:当会话想要锁定块中的行,但一个或多个其他会话在同一块中锁定了行,并且块中没有空闲的ITL插槽时,会发生这种情况。通常,Oracle会动态添加另一个ITL插槽。如果区块中没有足够的可用空间来添加日志。 如果没有足够空间, 会话将在模式4中等待具有TX排队的插槽。这种类型的TX排队等待对应于“等待事件enq:TX-allocateITL entry”

解决方案:通过更改表的INITRANS或MAXTRANS(通过使用ALTER语句或通过使用更高的值重新创建表)来增加可用的ITL数量

备注: 之前也遇到过这个问题ITL事务槽不足引发了enq:TX-allocateITL entry等待事件, 有兴趣可进入传送门 ( 传送门:Oracle死锁问题: enq: TX - allocate ITL entry )

3. Waits for TX in mode 4 can also occur if a session is waiting due to potential duplicates in UNIQUE index. If two sessions try to insert the same key value the second session has to wait to see if an ORA-0001 should be raised or not. This type of TX enqueue wait corresponds to the wait event enq: TX - row lock contention.

The solution is to have the first session already holding the lock perform a COMMIT or ROLLBACK.

大概意思:如果会话由于唯一索引中的潜在重复而正在等待,如果两个会话试图插入相同的键值,则第二个会话必须等待,以查看是否应引发ORA-0001。这种类型的TX排队等待对应于“等待事件enq:TX - row lock contention.”

解决方案:已经持有锁的第一个会话执行提交或回滚

4. Waits for TX in mode 4 is also possible if the session is waiting due to shared bitmap index fragment. Bitmap indexes index key values and a range of ROWIDs. Each 'entry' in a bitmap index can cover many rows in the actual table. If two sessions want to update rows covered by the same bitmap index fragment, then the second session waits for the first transaction to either COMMIT or ROLLBACK by waiting for the TX lock in mode 4. This type of TX enqueue wait corresponds to the wait event enq: TX - row lock contention.

如模式4TX等待:会话由于共享位图索引片段而等待。位图索引索引键值和一系列行ID。位图索引中的每个“entry”可以覆盖实际表中的许多行。如果两个会话希望更新同一位图索引片段所覆盖的行,则第二个会话通过等待模式4中的TX锁来等待第一个事务提交或回滚。这种类型的TX排队等待对应于“等待事件enq:TX - row lock contention.

5. Waits for TX in mode 4 also occur when a transaction inserting a row in an index has to wait for the end of an index block split being done by another transaction. This type of TX enqueue wait corresponds to the wait event enq: TX - index contention.

当在索引中插入行的事务必须等待另一个事务完成的索引块拆分结束时,会发生TX锁等待。这种类型的TX排队等待对应于“等待事件 enq: TX - index contention.”


从上述内容分析可以可知, 通过COMMIT or ROLLBACK可以解锁, 参考SQL


--KILL 锁住的session
--例如:alter system kill session 'sid,serial#';alter system kill session '371,52558';
alter system kill session '378,10931';
alter system kill session '379,34850';
alter system kill session '386,35260';

3. 为什么INSERT 产生enq:TX - row lock contention.

从官网看,引起  enq:TX - row lock contention.等待事件的最大可能是LOGICRESOURCEEN中存在唯一约束。  查看表结构,数据表LOGICRESOURCEEN存在唯一约束RADIUSUNIQUE

alter table LOGICRESOURCEENadd constraint UQ_LGCRES_RADUSU unique (RADIUSUNIQUE)

 创建唯一约束的时候会同时创建唯一索引

select * from user_indexes where  table_name='LOGICRESOURCEEN';

查询结果:

INDEX_NAME	UNIQUENESS	TABLE_NAME	INDEX_TYPE	TABLE_TYPE
UQ_LGCRES_RADUSU	UNIQUE	LOGICRESOURCEEN	NORMAL	TABLE
PK_LOGICRESOURCEEN	UNIQUE	LOGICRESOURCEEN	NORMAL	TABLE
IDX$LOGRES_RADIUSCODESTR	NONUNIQUE	LOGICRESOURCEEN	NORMAL	TABLE
IDX$LOGRES_IPSTR	NONUNIQUE	LOGICRESOURCEEN	NORMAL	TABLE

4. 模拟自测



1. 两个事务分别向表LOGICRESOURCEEN做INSERT 操作,两次操作radiusunique完全相同
第一个事务执行后不COMMIT
第二个事务执行INSERT 后,卡死,无法执行COMMIT操作
此时查询数据库,库中存在两条执行记录的 enq: TX - row lock contention锁

2. 两个事务分别向表LOGICRESOURCEEN做INSERT 操作,两次操作radiusunique不同时
第一个事务执行后不COMMIT
第二个事务执行INSERT 后可以COMMIT操作


问题原因


        当确认是因为LOGICRESOURCEEN表中的RADIUSUNIQUE字段的值出现了相同值引发了死锁。所以排查 RADIUSUNIQUE 字段产生的方式。  通过这个突破口很容易就发现RADIUSUNIQUE字段生成规则存在缺陷, 特定条件下会产生相同的编码。最终,通过解决程序问题避免RADIUSUNIQUE相同解决enq:TX - row lock contention.等额问题

        整个排查过程学到了很多,另外也发现工作中要保持一颗平常心,勿急、勿燥、勿上火。

        希望对看到这篇文章的朋友有所帮助

      

上一篇:Oracle 如何使用循环控制关键字exit、goto、continue


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38406.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle 出现锁表了,如何处理

出现锁表的情况很多种&#xff0c;但是大部分情况都是更新表&#xff0c;然后并没有提交&#xff0c;导致数据库的表被锁的情况。处理方式也比较简单&#xff0c;如下&#xff1a; 查询是否有表锁&#xff1a; select count(1) count from v$locked_object; 如果查询出来的数量…

短文重复性检测综述,谷歌文本重复性检测: Detect duplicate content like Google

文本重复性检测一直是NLP等领域非常重要的一项研究工作&#xff0c;今天 #paperClub# 给大家翻译一下"Detect duplicate content like Google"。 重复的内容是影响网站排名的最重要的负面因素之一。这就是为什么近重复检测 (NDD) 在任何 SEO 应执行的任务之间占据重要…

词云图:统计一个文本中词出现的次数。

在进行词云图的创作时&#xff0c;统计词语的出现频率是非常有意义的&#xff0c;可以依据词语频率的高低来判断词云图是否准确。选择小说中的某一章节&#xff0c;利用程序统计词语出现的次数。 程序如下&#xff1a; # -*- codeing utf-8 -*- # Time : 2021/12/12 1:21 # A…

chatgpt赋能python:Python词语分类

Python词语分类 Python是一种高级编程语言&#xff0c;它有很多词语&#xff0c;其中一些可能令你在学习Python时感到困惑。在这篇文章中&#xff0c;我们将探讨Python词语的分类&#xff0c;以帮助您更好地理解Python编程。 变量与数据类型 在Python中&#xff0c;变量用于…

DaVinci:Camera Raw(ARRI)

本文主要介绍 ARRI 的 Raw 格式素材相关的 Camera Raw 参数。 解码质量 Decode Quality 解码质量决定了图像解拜耳之后所呈现的素质&#xff0c;也与最终的输出息息相关。 默认为“使用项目设置” Use project setting&#xff0c;表示使用项目设置对话框中的“Camera RAW”解码…

DaVinci_Resolve_Studio_18.1.1达芬奇图文安装教程及下载

DaVinci Resolve最大的特点是&#xff0c;将剪辑、调色、视觉特效、动态图形和音频后期制作融于一身&#xff0c;它采用美观新颖的界面设计&#xff0c;易学易用&#xff0c;能让新手用户快速上手操作&#xff0c;还能提供专业人士需要的强大性能。 DaVinci Resolve 18是一次重…

davinci使用笔记(1)

第一节主要介绍达芬奇17的各个界面以及第一次使用的注意事项和主要设置。 这是达芬奇打开出现的界面&#xff0c;如图这是一个项目工程界面&#xff0c;我们可以在这里新建新的项目和和对项目进行分类&#xff0c;在这个界面右下角有三个按钮&#xff0c;其中第二个按钮是新建文…

达芬奇调色DaVinci Resolve Studio18v18.1.4 2023中文版更新发布,支持intel/M1/M2芯片

达芬奇是世界上唯一在单一软件环境中进行剪辑、调色、视觉效果、图形和音频后期处理的解决方案。其现代、时尚的界面简单直观&#xff0c;对于新手和有经验的用户来说都足够了。 DaVinci Resolve 无需掌握多个应用程序或在不同系统之间切换&#xff0c;极大地简化了您的创作过…

TI DaVinci(达芬奇)入门

&#xff08;转载来自 德州仪器半导体技术&#xff08;上海&#xff09;有限公司 通用DSP 技术应用工程师 崔晶 德州仪器&#xff08;TI&#xff09;的第一颗达芬奇&#xff08;DaVinci&#xff09;芯片&#xff08;处理器&#xff09;DM6446已经问世快三年了。继DM644x之后&am…

davinci 达芬奇BI工具

Davinci 是一个 DVAAS&#xff08;Data Visualization as a Service&#xff09;平台解决方案&#xff0c;面向业务人员/数据工程师/数据分析师/数据科学家&#xff0c;致力于提供一站式数据可视化解决方案。既可作为公有云/私有云独立部署使用&#xff0c;也可作为可视化插件集…

ChatGPT3.0 text-davinci-003 表现诡异

最近想试用一下通过API调用ChatGPT&#xff0c;在测试 gpt-3.5-turbo 的时候遇到了“openai.error.InvalidRequestError: This is not a chat model and thus not supported in the v1/chat/completions endpoint. Did you mean to use v1/completions? ”的问题。 所以该尝试…

中国元宇宙科技有限公司+《星云虚境》+AI虚拟数字人+chatgpt

随着人工智能、虚拟现实等技术的不断发展&#xff0c;中国元宇宙科技有限公司计划推出一款名为《星云虚境》的虚拟数字人平台。该平台将采用AIchatgpt等技术&#xff0c;为用户提供更加真实、智能的虚拟人体交互体验&#xff0c;为未来的数字化生活带来新的可能性。 未来&…

辅助现实?aR?AR?进入元宇宙,这个概念得搞懂

1 什么是辅助现实&#xff1f; 辅助现实&#xff08;aR&#xff0c;assisted Reality&#xff09;这个词在最近的一些AR眼镜的新品发布会频繁出现。那这辅助现实又是什么&#xff0c;与增强现实之间有什么关系呢&#xff1f; 其实&#xff0c;辅助现实可以说是增强现实里面的一…

元宇宙系列之AI虚拟人:“人”潮汹涌 探路未来

尽管元宇宙尚处不断扩充定义的进程中&#xff0c;但市场对于虚拟人在其中扮演关键要素已达成一定共识。我们认为&#xff0c;从中短期视角看&#xff0c;虚拟人相关技术逐步落地&#xff0c;应用场景持续拓宽&#xff0c;或为元宇宙概念下技术、内容及产业融合升级的初步尝试&a…

ChatGPT和AI会重燃中国的虚拟宇宙吗?

随着像 Meta 这样的科技巨头关闭他们的元宇宙部门以支持人工智能 &#xff08;AI&#xff09; 的努力——尽管他们认为元宇宙仍将是其主要产品——观众们相信&#xff0c;以前备受赞誉的虚拟生态系统已经被 AI 淘金热从互联网宝座上推倒了。 人工智能的利润潜力在今年上半年吸…

元宇宙虚拟人迎来高峰期,哪个是你的最爱?

虚拟人从最初的不温不火&#xff0c;到现在步入“出生高峰期”&#xff0c;元宇宙可以说是功不可没。 此前&#xff0c;量子位发布了《虚拟数字人深度产业报告》&#xff0c;报告显示&#xff0c;到2030年我国虚拟数字人整体市场规模将达到2700亿元。其中&#xff0c;“身份型…

WebAR也是元宇宙的一种? #geenee.ar 快速上手制作 AR 应用

Mixlab AR & VR 是构建元宇宙应用的热点 “接口”。前期推文介绍了 Web 端的快捷高效的 VR 创作工具 Styly &#xff0c;AR 创作也有类似的简易工具吗&#xff1f; 知识库 有社群成员推荐了一款 Web AR 工具 Geenee。该工具是一个无代码平台&#xff0c;即使是非技术创作者…

解密通往元宇宙的三大入口,VR先上AR紧跟,但脑机接口才是未来

来源: 智东西 编辑&#xff1a;智东西内参 VR、AR和脑机接口&#xff0c;谁是人类通往元宇宙的合适入口&#xff1f; VR/AR/脑机接口是集合了微显示、传感器、芯片和算法等多项技术在内的下一代人机交互平台。回顾整个人机交互发展历程&#xff0c;我们看到人机交互的指令输入形…

元宇宙,现实与虚拟交互的新一代互联网?

在家中&#xff0c;你可以到访埃及的五大遗迹或者中国的兵马俑&#xff0c;当然全球的著名景点可以玩个遍&#xff0c;和真实体验无异。 在一个可互操作的协作空间&#xff0c;建筑师、工程师和设计师在一虚拟世界上共同进行空间设计&#xff0c;随意进出虚拟与现实世界。 同样…

VR和AR只是入门,真正的元宇宙远不止于此

近来&#xff0c;在金融市场上&#xff0c;“元宇宙”的概念相当火爆&#xff0c;就像20多年前的互联网泡沫一般。当年&#xff0c;任何一个金融产品或公司&#xff0c;只要一打上“.com”的标记&#xff0c;立刻“鸡犬升天”。而金融市场永远是你方唱罢我登场——寻找一个新花…