线程的概念和控制

文章目录

  • 线程概念
    • 线程的优点
    • 线程的缺点
    • 线程异常
    • 线程用途
    • 理解虚拟地址
  • 线程控制
    • 线程的创建
    • 线程终止
    • 线程等待
    • 线程分离
    • 封装线程库

线程概念

什么是线程?

  1. 在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序
  2. 一切进程至少都有一个执行线程
  3. 线程在进程内部运行,本质是在进程地址空间内运行
  4. 在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化,线程是比进程更加轻量化的一种执行流。
  5. 透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程
    执行流

如何看待之前的进程?
之前的进程是内部只有一个执行流。

如何看待现在的进程?
现在的进程内部有多个执行流。并且多个执行流共享大部分资源。

线程更像是一种标准,各个平台的实现方式可能不同,但是作用都是一样的。在Linux中,因为线程也是执行流,进程也是,并且一个进程内的所有线程共享大部分资源。所以Linux中线程的实现就直接复用了进程的代码,这样在OS的调度算法就只有一个进程调度就可以了,一个进程中的的线程是共享大部分数据,所以创建线程可以直接复制PCB就可以了,一个进程中是可以存在多个线程的,所以OS也一定会对线程进行管理,所以OS也一定要有对线程描述的结构体(TCB),但是线程是直接复制进程的,所以Linux中描述线程的结构体也是PCB。所以Linux下线程也称为轻量级进程。
在这里插入图片描述
因此现在看来,线程是CPU调度的基本单位,进程就是承担系统资源的基本实体。

线程的优点

  1. 创建一个新线程的代价要比创建一个新进程小得多
  2. 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
  3. 线程占用的资源要比进程少很多
  4. 能充分利用多处理器的可并行数量
  5. 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  6. 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  7. I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

为什么说创建线程比进程的代价小呢呢?
因为线程是在进程的地址空间中运行的,并且线程创建更简单,只需要复制进程的PCB,只有一小部分的数据是私有的,大部分数据都和进程是一样的。

线程切换的效率为什么高?
如果是一个进程中的两个线程进程切换的话,CPU中的有一部分寄存器中的内容是不需要被切换的,并且因为局部性原理,CPU中是存在Cache缓存的,如果是一个进程中的两个线程进程切换,根据局部性原理Cache缓存也大部分不会被替换,但是如果是进程切换,所有的寄存器和Cache都是要被切换的。

线程的缺点

  1. 性能损失
    一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。
  2. 健壮性降低
    编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
  3. 缺乏访问控制
    进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
  4. 编程难度提高
    编写与调试一个多线程程序比单线程程序困难得多

线程异常

  1. 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
  2. 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该
    进程内的所有线程也就随即退出

线程用途

  1. 合理的使用多线程,能提高CPU密集型程序的执行效率
  2. 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现)

我们说线程和线程之间大部分数据是共享的但是有一部分数据是私有的,那么什么共享什么私有?
共享

文件描述符表
每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
当前工作目录
用户id和组id
地址空间

私有

线程ID(lwp)
一组寄存器

errno
信号屏蔽字
调度优先级

理解虚拟地址

我们现在直到磁盘中文件是以4KB为单位存储的,称之为页帧。并且我们编译好的可执行程序仍然遵守这样的规则,所以我们的内存空间也是被划分为4KB大小为单位的空间,称之页框,所以在访问一块内存时只需要知道页框的首地址+页内偏移就可以访问内存中的任意一个地址空间。因为内存会被划分成很多的页框,所以OS要对内存管理,就需要先描述在组织,可以理解为所有的页框都被放在一个数组中,然后OS对内存的管理就变成了对数组的增删查改。

虚拟地址到物理地址的转换是需要页表的,页表的每一行存在很多的字段,假设现在是10个字节,要是每个物理地址都存在一个虚拟地址跟他直接映射的话,假设是2^32的内存,就需要40G来存放页表,显然是不可能的,所以虚拟地址和物理地址并不是直接进行映射的。
以32为的地址为例假设先现在有一个地址 11110011 10111011 00101001 10100101 一个32个比特位,把前10 为1111001110作为一个整体,一共10个比特位,可以表示的范围就是0~1023,所以假设有一个1024大小的数组,就可以通过前十位的数据找到一个数组的下标,数组的内容还是一个大小为1024的数组,这个数组为页目录,然后11 ~ 20为比特位1110110010作为数组指向的那个数组的下标,数组的内容就是页框的起始地址,然后最后12个比特位就是页内的偏移地址。所以通过这样的方式找到物理地址,并且大大的减少了直接映射的使用空间,因此在页表中是没有物理地址的,在CPU中有一个MMU寄存器,我们只需要把一个虚拟地址放进去,就可以值就拿到物理地址然后进行访问。当然CPU中也有一个寄存器专门保存的就是当前页目录的起始地址。

在这里插入图片描述
每个线程要执行自己的代码,根据我们传递的函数,本质就是划分页表,划分页表的本质就是划分地址空间。所以在进程的视角,虚拟地址空间本身就是资源。

进程和线程关系如下:
在这里插入图片描述

线程控制

Linux中是没有真正的线程的,只有轻量级进程的概念,所以OS只会提供轻量级进程的系统调用,不会直接提供线程调用的接口。所以为了便于人们对线程的控制,写Linux的程序员就把对线程的控制封装成了pthread原生线程库。对上提供线程控制的接口。

  1. 与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”打头的
  2. 要使用这些函数库,要通过引入头文<pthread.h>
  3. 链接这些线程函数库时要使用编译器命令的“-lpthread”选项

线程的创建

在这里插入图片描述

  1. 传统的一些函数是,成功返回0,失败返回-1,并且对全局变量errno赋值以指示错误。pthreads函数出错时不会设置全局变量errno(而大部分其他POSIX函数会这样做)。而是将错误代码通过返回值返回
  2. pthreads同样也提供了线程内的errno变量,以支持其它使用errno的代码。对于pthreads函数的错误,建议通过返回值判定,因为读取返回值要比读取线程内的errno变量的开销更小

在Linux中可以通过ps -aL 查看创建的线程
在这里插入图片描述
我们可以看到同个进程内的线程的pid是相同的,但是LWP是不同的,因为LWP是线程的id,LWP在内核中使用,和我们用pthread_create获取出来的线程id是不一样的。内核中用LWP来表示线程的唯一。

pthread_create获取出来的线程id是我们用户自己使用的,可以通过pthread_ self()来获取。
在这里插入图片描述
那么这个线程id到底是什么呢?
我们使用的所有的线程的函数都不是系统直接提供的,是原生线程库提供的,而原生线程库一定不只会有我们一个进程用,所以原生线程库中一定会存在多个进程创建的多个线程,所以线程库一定要把我们多个进程创建的线程给管理好,所以线程库中会存在描述线程的结构体,结构体中有很多线程的数据(属于哪个进程,线程id等),然后再用数据结构把各个描述线程的结构体管理起来。我们来认识一个系统调用:
在这里插入图片描述
它可以通过flags的标识符来表示创建一个进程或者是创建一个轻量级进程(线程),我们看到参数中有一个child_stack的参数,表示我们是可以传一段空间是作为线程的栈空间的,所以我们前面说每个线程有自已的独立栈空间,pthread_create的底层就是封装了这个函数。因此我们每个新线程都会有自己的栈空间,而默认地址空间中的栈由主线程使用。在原生线程库中每个线程和每个线程的数据结构和栈空间还有一些相关的独立的数据放在一起,而我们用户用的线程id就是线程属性在线程库中的地址。
在这里插入图片描述

现在理解了线程id后,我们迷惑的应该是线程的局部存储是什么,我们知道对于全局变量来说是被所有线程共享的,但是加了一个__thread修饰一个变量,程序在编译的时候就会为每个线程开辟一段空间专门存储这个变量,也就是说,这个变量每个线程都存在一份,互不干扰。
在这里插入图片描述

线程终止

如果需要只终止某个线程而不终止整个进程,可以有三种方法:

  1. 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
  2. 线程可以调用pthread_ exit终止自己。
  3. 一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。

pthread_exit
在这里插入图片描述
pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了。

pthread_cancel
在这里插入图片描述

线程等待

为什么要进程线程等待?

  1. 已经退出的线程,其空间没有被释放,仍然在进程的地址空间内。
  2. 创建新的线程不会复用刚才退出线程的地址空间。

pthread_join

在这里插入图片描述
调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:

  1. 如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
  2. 如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_ CANCELED(-1)。
  3. 如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参
    数。
  4. 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。

线程分离

一般情况下对于创建的线程我们是需要join的,但是如果我们不关系线程的返回值,那么join就会成为一中负担,这时我们就可以对线程进程分离。即当线程退出时,自动释放线程资源。

pthread_detach

在这里插入图片描述
可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离,可以通过pthread_self()来获取自己的线程id。

join和分离是冲突的,一个线程不能既是join又是分离的。

如何理解语言中的线程库?
本质就是对原生线程库的封装。

线程中可以进程fork吗?可以进程execl程序替换吗?
线程中是可以fork的,也是可以进程execl程序替换的,但是进行程序替换整个进程的代码都会被替换,可能会影响其他线程的正常运行,比较推荐先fork然后在进程程序替换。

封装线程库

基于上面的接口,我们来模拟实现一下简单版的线程库。

#pragma once
#include <iostream>
#include <string>
#include <functional>
#include <pthread.h>
#include <unistd.h>template<class T>
using func_t = std::function<void(T)>;template<class T>
class Thread
{
public:Thread(const std::string& name, func_t<T> func, T data) : _name(name), _func(func), _tid(0), _isruning(false), _data(data){}static void* threadRountine(void* attr){Thread* t = static_cast<Thread*>(attr);t->_func(t->_data);}void Start(){int n = pthread_create(&_tid,nullptr,threadRountine,this);if(n == 0) {_isruning = true;}else {std::cerr << "pthread error" << std::endl;}}void Join(){if(!_isruning) return;int n = pthread_join(_tid,nullptr);if(n == 0){_isruning = false;}else {std::cerr << "join error" << std::endl;}}std::string getname(){return _name;}bool isruning(){return _isruning;}
private:std::string _name;pthread_t _tid;bool _isruning;func_t<T> _func;T _data;
};

如果需要返回值可以在成员变量可以加个模板参数在成员变量中定义一个返回值通过join得到就可以,如果调用的函数参数有多个也可以通过类似的方法实现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/329182.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware虚拟机安装Windows server 2022超详细教程

文章目录 ISO下载安装步骤总结 ISO下载 链接&#xff1a;https://pan.baidu.com/s/19Z2q9KFKZq0pLisPZLn7_g 提取码&#xff1a;3pgn 安装步骤 安装完打开虚拟机后发现引导程序无法正常执行 解决方法见我的上一篇文章&#xff1a;http://t.csdnimg.cn/PzfOz 问题解决完后正常…

计算机毕业设计 | node.js(Express)+vue影院售票商城 电影放映购物系统(附源码+论文)

1&#xff0c;绪论 1.1 项目背景 最近几年&#xff0c;我国影院企业发展迅猛&#xff0c;各大电影院不断建设新的院线&#xff0c;每年新投入使用的荧幕数目逐年显著上升。这离不开人们的观影需求及对观影的过程要求的不断进步。广大观影消费者需要知道自己的空闲时间&#x…

P1【知识点】【数据结构】【链表LinkedList】C++版

链表是一种逻辑上连续&#xff0c;内存上分散的线性表数据结构&#xff0c;是用一组任意的空间&#xff08;可以连续&#xff0c;也可以不连续&#xff09;来存放数据元素。每个数据元素成为一个”结点“&#xff0c;每个结点由数据域和指针域组成。 访问元素&#xff08;Acce…

保护共享资源的方法(互斥锁)

我最近开了几个专栏&#xff0c;诚信互三&#xff01; > |||《算法专栏》&#xff1a;&#xff1a;刷题教程来自网站《代码随想录》。||| > |||《C专栏》&#xff1a;&#xff1a;记录我学习C的经历&#xff0c;看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

工厂模式(简单工厂模式+工厂模式)

工厂模式的目的就是将对象的创建过程隐藏起来&#xff0c;从而达到很高的灵活性&#xff0c;工厂模式分为三类&#xff1a; 简单工厂模式工厂方法模式抽象工厂模式 在没有工厂模式的时候就是&#xff0c;客户需要一辆马车&#xff0c;需要客户亲自去创建一辆马车&#xff0c;…

向上调整建堆与向下调整建堆的时间复杂度 AND TopK问题

目录 前言建堆的时间复杂度TOPK问题总结 前言 本篇旨在介绍使用向上调整建堆与向下调整建堆的时间复杂度. 以及topk问题 博客主页: 酷酷学!!! 感谢关注~ 建堆的时间复杂度 堆排序是一种优于冒泡排序的算法, 那么在进行堆排序之前, 我们需要先创建堆, 为什么说堆排序的是优于…

2023年数维杯国际大学生数学建模挑战赛D题洗衣房清洁计算解题全过程论文及程序

2023年数维杯国际大学生数学建模挑战赛 D题 洗衣房清洁计算 原题再现&#xff1a; 洗衣房清洁是人们每天都要做的事情。洗衣粉的去污作用来源于一些表面活性剂。它们可以增加水的渗透性&#xff0c;并利用分子间静电排斥机制去除污垢颗粒。由于表面活性剂分子的存在&#xff…

Ubuntu 20/22 安装 Jenkins

1. 使用 apt 命令安装 Java Jenkins 作为一个 Java 应用程序&#xff0c;要求 Java 8 及更高版本&#xff0c;检查系统上是否安装了 Java。 sudo apt install -y openjdk-17-jre-headless安装完成后&#xff0c;再次验证 Java 是否已安装 java --version2. 通过官方存储库安…

15:00面试,15:08出来,面试问的有点变态。。。。

&#x1f345; 视频学习&#xff1a;文末有免费的配套视频可观看 &#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天…

第10章 数据聚合与分组运算

以下内容参考自https://github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version/blob/master/%E7%AC%AC05%E7%AB%A0%20pandas%E5%85%A5%E9%97%A8.md 《利用Python进行数据分析第2版》 用以学习和记录。 对数据集进行分组并对各组应用一个函数&#xff08;无论…

Dubbo生态之dubbo功能

1.Dubbo生态功能的思考 dubbo具有哪些功能呢&#xff1f;我们要根据dubbo的架构和本质是用来干什么的来思考? 首先对于分布式微服务&#xff0c;假设我们有两个服务A和B&#xff0c;并且都是集群部署的。那么按照我们正常的流程应该是启动两个微服务项目&#xff08;启动时应该…

vscode添加代办相关插件,提高开发效率

这里写目录标题 前言插件添加添加TODO Highlight安装TODO Highlight在项目中自定义需要高亮显示的关键字 TODO Tree安装TODO Tree插件 单行注释快捷键 前言 在前端开发中&#xff0c;我们经常会遇到一些未完成、有问题或需要修复的部分&#xff0c;但又暂时未完成或未确定如何处…

C++初阶学习第十弹——探索STL奥秘(五)——深入讲解vector的迭代器失效问题

vector&#xff08;上&#xff09;&#xff1a;C初阶学习第八弹——探索STL奥秘&#xff08;三&#xff09;——深入刨析vector的使用-CSDN博客 vector&#xff08;中&#xff09;&#xff1a;C初阶学习第九弹——探索STL奥秘&#xff08;四&#xff09;——vector的深层挖掘和…

MYSQL 集群

1.集群目的:负载均衡 解决高并发 高可用HA 服务可用性 远程灾备 数据有效性 类型:M M-S M-S-S M-M M-M-S-S 原理:在主库把数据更改(DDL DML DCL&#xff09;记录到二进制日志中。 备库I/O线程将主库上的日志复制到自己的中继日志中。 备库SQL线程读取中继日志…

Mongodb介绍及springboot集成增删改查

文章目录 1. MongoDB相关概念1.1 业务应用场景1.2 MongoDB简介1.3 体系结构1.4 数据模型1.5 MongoDB的特点 2. docker安装mongodb3. springboot集成3.1 文件结构3.2 增删改查3.2.1 增加insert3.2.2 保存save3.2.3 更新update3.2.4 查询3.2.5 删除 1. MongoDB相关概念 1.1 业务…

【学习笔记】Windows GDI绘图(五)图形路径GraphicsPath详解(上)

文章目录 图形路径GraphicsPath填充模式FillMode构造函数GraphicsPath()GraphicsPath(FillMode)GraphicsPath(Point[],Byte[])和GraphicsPath(PointF[], Byte[])GraphicsPath(Point[], Byte[], FillMode)和GraphicsPath(PointF[], Byte[], FillMode)PathPointType 属性FillMode…

jsp连接数据库

1.打开命令框进入数据库 打开eclipse创建需要连接的项目 粘贴驱动程序 查看驱动器 使用sql的包 int代表个 conlm代表列名 <%page import"java.sql.ResultSet"%> <%page import"java.sql.Statement"%> <%page import"java.sql.Connect…

关于如何创建一个可配置的 SpringBoot Web 项目的全局异常处理

前情概要 这个问题其实困扰了我一周时间&#xff0c;一周都在 Google 上旅游&#xff0c;我要如何动态的设置 RestControllerAdvice 里面的 basePackages 以及 baseClasses 的值呢&#xff1f;经过一周的时间寻求无果之后打算决定放弃的我终于找到了一些关键的线索。 当然在此…

html5 笔记01

01 表单类型和属性 input的type属性 单行文本框: typetext 电子邮箱 : typeemail 地址路径 : type url 定义用于输入数字的字段: typenumber 手机号码: typetel 搜索框 : typesearch 定义颜色选择器 : typecolor 滑块控件 : typerange 定义日期 :typedate 定义输入时间的控件…

CR80清洁卡都能用在什么地方?

CR80清洁卡&#xff08;也被称为ISO 7810 ID-1清洁卡&#xff09;的规格确实使其在各种需要读取磁条或接触式智能卡的设备中都有广泛的用途。这些设备包括但不限于&#xff1a; ATM自动终端机&#xff1a;当ATM机的磁条读卡器出现故障或读卡不灵敏时&#xff0c;可以使用CR80清…