Linux中死锁问题的探讨

在 Linux 中,死锁(Deadlock) 是指多个进程或线程因为竞争资源而相互等待,导致所有相关进程或线程都无法继续执行的状态。死锁是一种严重的系统问题,会导致系统资源浪费,甚至系统崩溃。

死锁的定义

死锁是指两个或多个进程或线程在执行过程中,因为争夺资源而造成的一种互相等待的现象。如果没有外部干预,这些进程或线程将永远无法继续执行。

死锁的四个必要条件

死锁的发生需要同时满足以下四个条件(称为 Coffman 条件):

互斥条件(Mutual Exclusion)

资源一次只能被一个进程或线程占用。

例如,锁(如互斥锁)就是一种互斥资源。

占有并等待(Hold and Wait)

进程或线程持有至少一个资源,同时等待获取其他被占用的资源。

非抢占条件(No Preemption)

 已分配给进程或线程的资源不能被强制剥夺,必须由其自行释放。

循环等待条件(Circular Wait)

存在一个进程或线程的循环链,每个进程或线程都在等待下一个进程或线程所占用的资源。

只有当这四个条件同时满足时,死锁才会发生。

死锁的示例

以下是一个典型的死锁示例:

#include <pthread.h>
#include <stdio.h>pthread_mutex_t mutexA = PTHREAD_MUTEX_INITIALIZER;
pthread_mutex_t mutexB = PTHREAD_MUTEX_INITIALIZER;void* thread1_func(void* arg) {pthread_mutex_lock(&mutexA); // 线程1持有mutexAsleep(1); // 模拟一些操作pthread_mutex_lock(&mutexB); // 线程1尝试获取mutexBprintf("Thread 1 is running.\n");pthread_mutex_unlock(&mutexB);pthread_mutex_unlock(&mutexA);return NULL;
}void* thread2_func(void* arg) {pthread_mutex_lock(&mutexB); // 线程2持有mutexBsleep(1); // 模拟一些操作pthread_mutex_lock(&mutexA); // 线程2尝试获取mutexAprintf("Thread 2 is running.\n");pthread_mutex_unlock(&mutexA);pthread_mutex_unlock(&mutexB);return NULL;
}int main() {pthread_t tid1, tid2;pthread_create(&tid1, NULL, thread1_func, NULL);pthread_create(&tid2, NULL, thread2_func, NULL);pthread_join(tid1, NULL);pthread_join(tid2, NULL);return 0;
}

线程1持有 mutexA 并等待 mutexB

线程2持有 mutexB 并等待 mutexA

两个线程互相等待,导致死锁。

死锁的影响

资源浪费:死锁会导致相关进程或线程无法继续执行,占用系统资源。

系统崩溃:如果死锁涉及关键资源,可能导致整个系统无法正常运行。

难以调试:死锁通常难以复现和调试,尤其是在复杂的多线程程序中。

如何避免死锁

锁顺序:确保所有线程以相同的顺序获取锁。

超时机制:为锁操作设置超时(如 pthread_mutex_timedlock),避免无限等待。

避免嵌套锁:尽量减少锁的嵌套使用。

死锁检测:使用工具或算法检测死锁并采取措施。

资源分配策略:使用资源分配算法(如银行家算法)避免死锁。

死锁检测与恢复

检测

使用工具(如 gdbvalgrind)分析程序运行状态。

实现死锁检测算法(如图的环路检测)。

恢复

强制终止一个或多个进程或线程。

回滚操作,释放资源并重新分配。

线程阻塞

在 Linux 中,死锁阻塞是两个不同的概念,尽管它们都与资源的竞争和等待有关,但它们的表现和原因有显著区别:

阻塞(Blocking)

定义:阻塞是指一个进程或线程因为等待某个资源(如锁、I/O 操作、信号量等)而暂时无法继续执行,进入等待状态。

原因

等待获取锁(如互斥锁、读写锁)。

等待 I/O 操作完成(如读取文件、网络数据)。

等待信号量或其他同步机制。

特点

阻塞是暂时的,一旦资源可用,进程或线程会被唤醒并继续执行。

阻塞是正常的同步机制,用于协调多个进程或线程对共享资源的访问。

阻塞不会导致系统无法运行,只是当前任务暂时停止。

示例

pthread_mutex_lock(&mutex); // 如果锁被其他线程持有,当前线程会阻塞
// 临界区代码
pthread_mutex_unlock(&mutex);

区别总结

总之,阻塞是正常的同步行为,而死锁是需要避免的系统错误。

线程饥饿

一个线程持有锁一直不释放,其他线程一直在等待这个锁,这种情况不满足锁的四个必要条件,算是死锁吗?

比如如果一个线程持有锁后进入死循环,且其他线程尝试获取该锁。

具体过程:

  1. 线程 A 持有锁后进入死循环,永远不会释放锁。

  2. 线程 B 尝试获取该锁,但由于锁被线程 A 持有,线程 B 会一直阻塞等待。

  3. 如果还有其他线程也尝试获取该锁,它们同样会阻塞等待。

  4. 最终,这些线程会因为无法获取锁而永久阻塞

示例代码如下:

#include <pthread.h>
#include <stdio.h>pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;void* thread_func(void* arg) {pthread_mutex_lock(&mutex); // 线程 A 获取锁while (1) {// 死循环,永远不会释放锁}pthread_mutex_unlock(&mutex); // 这行代码永远不会执行return NULL;
}int main() {pthread_t tid;pthread_create(&tid, NULL, thread_func, NULL);pthread_mutex_lock(&mutex); // 主线程尝试获取锁,会一直阻塞printf("This will never be printed.\n");pthread_mutex_unlock(&mutex);pthread_join(tid, NULL);return 0;
}

线程 A 获取锁后进入死循环,永远不会释放锁。

主线程尝试获取锁时会被阻塞

这种情况下,虽然不满足死锁的四个必要条件,但它确实会导致类似死锁的现象,通常称为**资源饥饿(Resource Starvation)活锁(Livelock)**的一种表现。下面详细分析:

1. 这种情况的特点

一个线程持有锁后一直不释放。

其他线程因为无法获取锁而一直等待。

不满足死锁的四个必要条件(特别是循环等待条件),因为没有多个线程相互等待。

2. 为什么不是死锁?

死锁的四个必要条件之一是循环等待,即存在一个进程或线程的循环链,每个进程或线程都在等待下一个进程或线程所占用的资源。而在你的描述中:

只有一个线程持有锁,其他线程在等待这个锁。

没有形成循环等待链,因此不满足死锁的定义。

3. 这种情况的名称

这种情况通常被称为资源饥饿(Resource Starvation)

一个线程独占资源(如锁),导致其他线程无法获取资源,从而无法继续执行。

资源饥饿不一定是死锁,但它会导致系统性能下降或部分功能失效。

总结下线程饥饿和死锁的区别

比较明显的现象就是,线程饥饿时通常会有部分线程还能执行,但是死锁时,涉及到的所有线程都无法执行。

更多参考:

五、面试官:你讲一下线程死锁、饥饿和死循环的区别以及死锁的处理? 我:滔滔不绝...._死锁和循环依赖的区别-CSDN博客

常见问题

死锁、资源饥饿、CPU飙高、内存泄漏、内存溢出、栈溢出

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27832.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Baklib内容中台赋能企业智管

内容中台构建全场景智管 现代企业数字化运营中&#xff0c;全域内容管理能力已成为核心竞争力。通过智能知识引擎驱动的内容中台架构&#xff0c;企业能够实现跨部门、多形态数据的统一归集与动态调度。以某制造企业为例&#xff0c;其利用中台系统将分散在CRM、ERP及内部文档…

ArcGIS Pro高级应用:高效生成TIN地形模型

一、引言 在地理信息科学与遥感技术的快速发展背景下&#xff0c;数字高程模型&#xff08;DEM&#xff09;已成为地形表达与分析的关键工具。 三角网&#xff08;TIN&#xff09;作为DEM的一种重要形式&#xff0c;因其能够精准描绘复杂地形特征而广受青睐。 ArcGIS Pro为用…

leetcode112-路径总和

leetcode 112 思路 我们利用递归来实现&#xff0c;用result字段来记录结果值&#xff0c;默认为false&#xff0c;我们递归的时候传入需要的目标值&#xff0c;然后每次遍历到一个节点&#xff0c;就用目标值减去节点当前值&#xff0c;最终到叶子节点时&#xff0c;如果是…

LLM | 论文精读 | CVPR | PEACE : 通过多模态大语言模型(MLLMs)赋能地质图全面理解

论文标题&#xff1a;FairCLIP: Harnessing Fairness in Vision-Language Learning 作者&#xff1a;Yan Luo Min Shi Muhammad Osama Khan Muhammad Muneeb Afzal等 期刊&#xff1a;CVPR 2025 email&#xff1a;yuhan.huangwhu.edu.cn 创作不易&#xff0c;恳请大家点赞收…

网络学习(四)HTTPS中,SSL的单向认证与双向认证

目录 一、什么是SSL&#xff1f;1.1 SSL 的主要功能1.2 SSL 的工作原理1.3 SSL 的核心组件1.4 SSL 的应用场景1.5 SSL 与 TLS 的区别 二、SSL 单向认证、双向认证2.1 SSL 单向认证2.2 SSL 双向认证2.3 总结&#xff1a;SSL 单向认证和双向认证的区别 一、什么是SSL&#xff1f;…

Mybatis 中#{} 和${} 的区别是什么?

在 MyBatis 中&#xff0c;#{} 和 ${} 都是用于动态 SQL 语句中的占位符&#xff0c;但是它们的作用和使用方式是不同的。下面是它们的区别&#xff1a; 1. #{} —— 用于防止 SQL 注入和自动类型处理 #{} 是用来将参数安全地传递到 SQL 语句中&#xff0c;它会将传递的参数值…

HTML-05NPM使用踩坑

2025-03-04-NPM使用踩坑 本文讲述了一个苦逼程序员在使用NPM的时候突然来了一记nmp login天雷&#xff0c;然后一番折腾之后&#xff0c;终究还是没有解决npm的问题&#x1f61e;&#x1f61e;&#x1f61e;,最终使用cnpm完美解决的故事。 文章目录 2025-03-04-NPM使用踩坑[toc…

Zookeeper 的核心引擎:深入解析 ZAB 协议

#作者&#xff1a;张桐瑞 文章目录 前言ZAB 协议算法崩溃恢复选票结构选票筛选消息广播 前言 ZooKeeper 最核心的作用就是保证分布式系统的数据一致性&#xff0c;而无论是处理来自客户端的会话请求时&#xff0c;还是集群 Leader 节点发生重新选举时&#xff0c;都会产生数据…

C++ Primer 动态数组

欢迎阅读我的 【CPrimer】专栏 专栏简介&#xff1a;本专栏主要面向C初学者&#xff0c;解释C的一些基本概念和基础语言特性&#xff0c;涉及C标准库的用法&#xff0c;面向对象特性&#xff0c;泛型特性高级用法。通过使用标准库中定义的抽象设施&#xff0c;使你更加适应高级…

基于 HTML、CSS 和 JavaScript 的智能九宫格图片分割系统

目录 1 前言 2 技术实现 2.1 HTML 结构 2.2 CSS 样式 2.3 JavaScript 交互 3 代码解析 3.1 HTML 部分 3.2 CSS 部分 3.3 JavaScript 部分 4 完整代码 5 运行结果 6 总结 6.1 系统特点 6.2 使用方法 1 前言 在当今数字化的时代&#xff0c;图片处理需求日益增长。…

Java+iTextPDF,实时生成与预览PDF文件的最佳实践!

Java+iTextPDF,实时生成与预览PDF文件的最佳实践! 背景 其实公司之前的项目里是用到了帆软报表的,然而最近接了一个新项目,这个项目独立部署在甲方的独立环境中,组长的意思是不用再单独部署一套帆软报表,成本太大,用其他方式实现一下。虽然我不太理解成本大在哪儿,不…

Linux 快捷命令链接

修改mvn命令 默认手动安装后&#xff0c;命令格式为 安装路径命令 /data/apache-maven-3.8.8/bin/mvn -v更改为通用的命令模式 [root ~]# cat /etc/centos-release CentOS Linux release 7.9.2009 (Core) [root ~]# echo $PATH /usr/local/node16/bin:/usr/local/sbin:/sbin…

论文回顾:NeoBERT:新一代 BERT

NeoBERT&#xff1a;新一代编码器&#xff0c;具有 4K 标记上下文长度&#xff0c;在 MTEB 上优于 RoBERTa 等更大的模型&#xff01; 论文链接&#xff1a;https://arxiv.org/pdf/2502.19587 摘要 NeoBERT 是下一代双向编码器&#xff1b;它融合了最先进的架构、现代数据和优…

机器视觉开发教程——封装Halcon通用模板匹配工具【含免费教程源码】

目录 引言前期准备Step1 设计可序列化的输入输出集合【不支持多线程】Step2 设计程序框架1、抽象层【IProcess】2、父类【HAlgorithm】3、子类【HFindModelTool】 Step3 设计UI结果展示 引言 通过仿照VisionPro软件二次开发Halcon的模板匹配工具&#xff0c;便于在客户端软件中…

一、OpenGL的原理解析

文章目录 OpenGL到底实现的是什么&#xff1f;OpenGL内模型数据的本质是什么&#xff1f;为什么三角形是 3D 渲染的最基本单元&#xff1f;MVP 变换&#xff08;Model-View-Projection 变换&#xff09;OpenGL渲染流程-摄像机变换OpenGL渲染流程-投影变换OpenGL渲染管线概述 Op…

大模型——CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4:生成中英双语高清图片的开源文生图模型综合介绍 CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非常适合广告设计、短视频创作等场…

网络安全法与等级保护 PPT 精华汇总

资源描述 本资源文件为《网络安全法与等级保护》的PPT精华汇总&#xff0c;内容涵盖了网络安全法与等级保护的总体框架及相关标准规范。该PPT详细介绍了网络安全法与等级保护的各个章节和条款&#xff0c;并提供了基础类和应用类的相关标准文件&#xff0c;帮助读者全面了解和…

前端知识一

&#xff08;ref函数&#xff09;1.为什么vue3中使用ref来创建响应式数据&#xff0c;而不是直接声明一个变量 import { ref } from "vue";const count ref(0); // 创建一个响应式的计数器&#xff0c;初始值为0function increment() {count.value; // 增加计数器的…

国产免费AI的IDE-TRAE

还是在AI的加持下的新的工具 在上周一次偶然的机会看到了这样的标题–用上Claude的AI编程工具Trae。 AI我还没入门&#xff0c;编程也是小白级别。Claude是什么不知道。Trae这是什么也不知道。为什么起这个名字&#xff1f;都不知道含义。 先下载吧。&#xff08;这里要说一…

解决中文乱码:字符编码全攻略 - ASCII、Unicode、UTF-8、GB2312详解

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;精通Java编…