Linux——线程详解(一)

索引

  • 初识线程
      • 1.inux下的线程
      • 2.再谈进程
      • 3.理解页表
      • 4. 再次理解虚拟到物理的转化
  • 线程的控制
      • 1.线程的创建
      • 2.线程异常
      • 3.验证`pthread_join` 的第二个参数
      • 4.线程的退出方式
      • 5. 线程的公有和私有
      • 6.pthread_t 与线程独立栈
      • 7.线程的局部性存储
      • 8.线程分离

初识线程

1.inux下的线程

在这里插入图片描述
之前了解到,当一个进程被创建的时候,进程的task_struct被创建,进程的数据和代码通过页表的映射加载到物理内存。CPU选择一个进程调度就是将进程task_struct的地址load到寄存器当中,这样CPU就能很快找到这个地址,并且也可以将页表的起始地址也load到寄存器中,通过页表就能完成虚拟地址到物理地址的映射,由于task_struct和页表的上下关系都有,所以CPU内部是能快速的找到进程的所有数据的。
由于我们再创建一个进程,那么又是重复完成上述的一系列工作,成本非常高。

在这里插入图片描述
如果此时我们只创建PCB,并且是这几个PCB指向同一个地址空间,共用一张页表并且将进程的代码和数据通过函数划分成几部分,让各个PCB执行自己的部分代码和数据,各个PCB各自使用部分页表来完成映射,所以各个PCB完成的都是一部分 ——这就是Linux下粗粒度的线程。
所以就可以引出线程的几个基本概念:

1.线程是在进程的地址空间内运行的,是进程内部的一个执行流
2.线程执行粒度比进程更细,因为其执行的代码变得更小了,数据变得更少了,CPU内有一大堆寄存器,调度的时候地址空间不用切换了,页表不用切换了,要切的只是当前进程产生的临时上下文,寄存器上的一些核心数据结构不用切换了,所以调度的成本更低
3.线程是CPU内调度的基本单位。

上述说的只是在Linux的线程。
对于其他操作系统而言,由于线程的一些特性,导致线程:进程一定是 n:1的。进程需要管理,线程当然也需要管理,线程的描述是tcb,进程是pcb,但是如果单独实现线程的描述,那么其和进程之间的耦合关系就会变得很复杂。
对于Linux而言:
没有线程,没有线程在概念上的划分,只有一个叫做执行流
Linux的线程是用进程模拟的,PCB模拟的。(这是很多教材的说法)。
因此在linux下是有TCB的,但不是单独设计的,其直接复用了PCB。
所以Linux下提供了一些接口来进行线程的相关操作,但是系统调用接口太麻烦了,而是所有的Linux必须自带的一套原生线程库,在用户层对线程进行相关动作。

这样对于CPU而言有区别吗?没有任何区别,都是调度一个task_struct,只是调度的粒度更小,调度的成本更低,这样本来串行化执行的代码,可以并发或并行的同时执行代码,同时推进,这就线程!!!

2.再谈进程

曾经: 进程 = 内核数据结构 + 进程对应的代码和数据
现在:进程 = 内核视角:承担分配系统资源的基本实体(进程的基座属性)
意义:向系统申请资源的基本单位!!

在这里插入图片描述
之前的进程是内部只有一个执行流的单执行流的进程,但是现在可以是内部有多个执行流的进程——多执行流的进程。

总结

CPU视角,task_struct <= 传统的进程PCB
;没有真正意义上的线程,而是用进程的task_struct模拟实现的,linux下的“进程” <= 其他操作系统的进程概念。
linux下的线程也叫做轻量级进程!线程是调度的基本单位!
下面写一段线程代码:

#include <iostream>
#include <string>#include <pthread.h>
#include <unistd.h>
using namespace std;
void *callback1(void *args)
{string name = (char *)args;while (true){cout << name << ": " << getpid() << endl;sleep(1);}
}
void *callback2(void *args)
{string name = (char *)args;while (true){cout << name << ": " << getpid() << endl;sleep(1);}
}
int main()
{pthread_t tid1;pthread_t tid2;pthread_create(&tid1, nullptr, callback1, (void *)"thread 1");pthread_create(&tid2, nullptr, callback2, (void *)"thread 2");while (true){cout << "我是主线程 我正在运行代码" << endl;sleep(1);}pthread_join(tid1, nullptr);pthread_join(tid2, nullptr);return 0;
}

在这里插入图片描述
验证了linux下线程就是轻量级进程。
总结

优点:
1.创建一个线程的代价要比一个新进程的小得多
2.线程的切换不需要切换页表和地址空间,需要做的工作比进程的少
3.线程占用的资源比进程小
4.线程可以充分利用多处理器的并行数量
5.在等待慢速I/O操作时,程序可执行其他任务
6.计算密集型应用,为了能够在多处理器系统上运行,将计算分解到多个线程执行
缺点:
1.性能损失,一个很少被阻塞的计算密集型往往无法与其他线程共用一个处理器,并且一旦线程的数量比处理器的数量多,那么就可能会造成较大的性能损失,这里的损失指的是增加了额外的同步和调度开销,而可用的资源不变
2.健壮性降低,进程有独立的地址空间和页表,线程往往会和其他线程共享变量
3.缺乏访问控制,线程时调度的基本单位,在一个线程中调用某些OS会对整个进程造成影响
4.编写苦难较高,调试较难

3.理解页表

先看一个例子:
char*msg = "hello world; *msg = 'z'
上述一行代码是对的吗?
上述的代码能编译过,但是运行时会报错。
因为上述的msg指向的是字符串常量,其存在于只读常量区,是只读的,不能被修改,当发现被修改时,就会报异常。
在这里插入图片描述
字符常量区位于代码区和已初始化数据区,该代码基于页表的映射此时在页表中的权限是只读的,当程序企图修改时,OS会通过页表检测到权限不符,就会报错,其实内存任何时候都是可以被修改的,只是有没有修改的权限罢了。

4. 再次理解虚拟到物理的转化

在这里插入图片描述

这样做有什么好处呢?

1.将进程虚拟地址管理和内存管理通过页表+page进行解耦。当我们要访问某个数据时,通过页表的映射,发现page = null,此时OS就必须从内存重新加载了。在解释一下,页表只关心page在还是不在,如果不在,就交给操作系统的内存管理,将数据重新从磁盘加载到内存。
2.因为将页表拆开了,可以实现页表的按需创建,节省空间
**解释:**页表的最终大小是2^32 / 2^12 = 1M 假设一个条目是20个字节,所以页表最大也就是20M

线程的控制

1.线程的创建

#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);
作用:创建线程
thread:线程id
attr:属性(不考虑)
void *(*start_routine) (void *):线程执行时所对应的回调方法
arg:传入回调方法中的参数
返回值:创建成功返回0
失败:返回错误码

#include <pthread.h>
pthread_t pthread_self(void);
作用:谁调用该函数就获取该线程的线程ID

#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);
作用:等待线程
因为线程本质上就是第一个轻量级进程,所以也是要等待的。否则会造成类似于进程那般的内存泄露问题。
thread:线程id
retval: 输出型参数,获取线程的返回值

#include <iostream>
#include <string>
#include <vector>
#include <pthread.h>
#include <unistd.h>
using namespace std;
static void PrintId(const char *name, const pthread_t &tid)
{printf("%s 正在运行,thread id: 0x%x\n", name, tid);
}
void *callback1(void *args)
{int cnt = 5;const char *name = static_cast<const char *>(args);while (true){cout << "线程正在运行...." << endl;PrintId(name, pthread_self());sleep(1);if (!cnt--)break;}cout << "线程退出了..." << endl;return nullptr;
}
void *callback2(void *args)
{int cnt = 5;const char *name = static_cast<const char *>(args);while (true){cout << "线程正在运行...." << endl;PrintId(name, pthread_self());sleep(1);if (!cnt--)break;}cout << "线程退出了..." << endl;return nullptr;
}
int main()
{pthread_t tid1;pthread_t tid2;pthread_create(&tid1, nullptr, callback1, (void *)"thread 1");pthread_create(&tid2, nullptr, callback2, (void *)"thread 2");int cnt = 10;while (true){PrintId("main thread", pthread_self());sleep(1);if (!cnt--)break;}cout << "进程也退出了!!!" << endl;pthread_join(tid1, nullptr);pthread_join(tid2, nullptr);return 0;
}

在这里插入图片描述

2.线程异常

3.验证pthread_join 的第二个参数

参数是一个输出型参数,获取新线程的退出码
整体代码与上述相似,只写出更改的代码和运行结果的部分截图

return (void *)10;pthread_join(tid1, &retval);cout << "retval: " << ((long long)retval) << endl;

在这里插入图片描述

4.线程的退出方式

void *callback1(void *args)
{int *ptr = nullptr;*ptr = 4;int cnt = 3;const char *name = static_cast<const char *>(args);while (true){cout << "线程正在运行...." << endl;PrintId(name, pthread_self());sleep(1);if (!cnt--)break;}cout << "线程退出了..." << endl;return (void *)10;
}

如果此时线程一的回调函数如上所示
在这里插入图片描述
进程会直接退出,线程发生段错误,操作系统会发送信号给线程,而进行线程的信号是共享的,所以线程异常 = 进程异常
这也说明了线程的健壮性比较低
所以线程终止只考虑正常终止的情况。

#include <pthread.h>
void pthread_exit(void *retval);
线程终止函数,与上述代码的return 作用一样

#include <pthread.h>
void pthread_exit(void *retval);
给线程发送取消请求,如果线程是被取消的,退出结果是-1
-1实际上就是PTHREAD_CANCELED;表示线程的退出信息此时是被取消的。

int main()
{pthread_t tid1;pthread_t tid2;pthread_create(&tid1, nullptr, callback1, (void *)"thread 1");pthread_create(&tid2, nullptr, callback2, (void *)"thread 2");sleep(2);pthread_cancel(tid1);int cnt = 5;while (true){PrintId("main thread", pthread_self());sleep(1);if (!cnt--)break;}cout << "进程也退出了!!!" << endl;void *retval = nullptr;pthread_join(tid1, &retval);cout << "retval: " << ((long long)retval) << endl;pthread_join(tid2, nullptr);return 0;
}

在这里插入图片描述
总结线程的退出方式:

1.return
value_ptr(pthread_join的第二个参数)存放的是thread线程的返回值
2.pthread_exit()
value_ptr(pthread_join的第二个参数)存放的是传给pthread_exit的参数
3.pthread_cancel();
value_ptr(pthread_join的第二个参数)存放的是常数:PTHREAD_ CANCELED
4.如果对线程的终止状态不感兴趣,可以穿nullptr给value_ptr

5. 线程的公有和私有

多线程进程,线程共享同一地址空间,同时线程还共享

文件描述符
每种信号的处理方式
当前工作目录
用户id和组id

当然,线程也有一部分自己的数据

线程ID
一组寄存器

errno
信号屏蔽字
调度优先级

线程私有寄存器说明线程是可被调度的,可以进行线程切换,验证了线程是调度的基本单位。
私有栈说明线程是可以运行起来的,各自进行出栈和压栈

在这里插入图片描述

6.pthread_t 与线程独立栈

在这里插入图片描述
可以看到我们的用户级线程使用第三方线程库 libpthread.so
在这里插入图片描述
无论是第三方第三方线程库还是可执行程序,都要从磁盘加载到内存,然后通过页表建立地址空间与内存的映射。需要注意的是无论是自己的代码,还是库的代码,又或是系统的代码,都是在进程的地址空间中进行的。

在这里插入图片描述
对于用户而言:其需要的是线程
但是对于LinuxOS而言,其只能提供轻量级进程。
所以libpthread.so起到了一个过渡的作用,其通过封装相关系统调用,使得用户看似拿到了线程,也正是在libpthread.so这一层开始有线程的概念。

所以线程的全部实现,并没有体现在OS中,而是OS提供执行流,具体的线程结构由库来进行管理。
库要创建多个线程,因此库要管理线程。
伪代码:
struct thread_info
{
pthread_t tid;
void *stack; //私有栈
};

大致如下
在这里插入图片描述

所以pthread_t对应的用户级线程结构体的起始地址
并且各自线程的私有栈也是在共享区中的,主线程用的是独立栈结构,也就是地址空间中的栈,新线程用的是库提供的栈结构。

7.线程的局部性存储

#include <iostream>
#include <string>
#include <vector>
#include <pthread.h>
#include <unistd.h>
using namespace std;
int global_val = 100;
void *startRounte(void *args)
{while (true){cout << "thread " << pthread_self() << "  global_val: " << global_val<< "&global_val: " << &global_val << "Inc: " << global_val++ << endl;sleep(1);}
}
int main()
{pthread_t tid1;pthread_t tid2;pthread_t tid3;pthread_create(&tid1, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid2, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid3, nullptr, startRounte, (void *)"pthread 1");while (true){cout << "thread " << pthread_self() << "  global_val: " << global_val<< "&global_val: " << &global_val << "Inc: " << global_val++ << endl;sleep(1);}pthread_join(tid1, nullptr);pthread_join(tid2, nullptr);pthread_join(tid3, nullptr);return 0;
}

在这里插入图片描述
如上所示,此时的变量是全局变量,线程可以共享变量,各自打印的变量地址都是一样的
__thread int global_val = 100;
如果将变量的定义改成如上所示。

在这里插入图片描述
此时三个线程各自私有数据,这叫做线程的局部性存储,可以理解为一旦加了__thread,此时每个线程各自将变量拷贝了一份。

8.线程分离

默认情况下:新创建的线程都是可等待的,线程退出后,需要主线程对其pthread_join,否则无法释放资源吗,从而造成资源的泄露。
但是如果不担心线程的分离,pthread_join反而是一种负担,因为一直要阻塞式的等待线程,无法执行主线程的代码。

#include <pthread.h>
int pthread_detach(pthread_t thread);
线程既可以分离,也可以是其他线程对目标线程分离。但是建议用主线程对支线程进行分离,并且join和线程分离是冲突的,线程分离了就不能等待。

__thread int global_val = 100;
void *startRounte(void *args)
{pthread_detach(pthread_self());while (true){cout << "thread " << pthread_self() << "  global_val: " << global_val<< "&global_val: " << &global_val << "  Inc: " << global_val++ << endl;sleep(1);}
}
int main()
{pthread_t tid1;pthread_t tid2;pthread_t tid3;pthread_create(&tid1, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid2, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid3, nullptr, startRounte, (void *)"pthread 1");// sleep(1);pthread_join(tid1, nullptr);pthread_join(tid2, nullptr);pthread_join(tid3, nullptr);return 0;
}

上述是一个错误代码,因为线程已经分离了,但是又在后面join了,此时应该会报错,但是运行之后发现
在这里插入图片描述
运行的结果非常好,这是因为线程是缺乏访问控制的,有可能主线程先调度,此时其直接阻塞式等待了,压根没有意识到线程分离了,为了避免这个情况,我们应该在主线程上进行线程分离。

__thread int global_val = 100;
void *startRounte(void *args)
{while (true){cout << "thread " << pthread_self() << "  global_val: " << global_val<< "&global_val: " << &global_val << "  Inc: " << global_val++ << endl;sleep(1);}
}
int main()
{pthread_t tid1;pthread_t tid2;pthread_t tid3;pthread_create(&tid1, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid2, nullptr, startRounte, (void *)"pthread 1");pthread_create(&tid3, nullptr, startRounte, (void *)"pthread 1");// sleep(1);pthread_detach(tid1);pthread_detach(tid2);pthread_detach(tid3);int n = pthread_join(tid1, nullptr);cout << n << " : " << strerror(n) << endl;n = pthread_join(tid2, nullptr);cout << n << " : " << strerror(n) << endl;n = pthread_join(tid3, nullptr);cout << n << " : " << strerror(n) << endl;return 0;
}

在这里插入图片描述
此时就可以显示出非法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/123770.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】单链表详解

当我们学完顺序表的时候&#xff0c;我们发现了好多问题如下&#xff1a; 中间/头部的插入删除&#xff0c;时间复杂度为O(N)增容需要申请新空间&#xff0c;拷贝数据&#xff0c;释放旧空间。会有不小的消耗。增容一般是呈2倍的增长&#xff0c;势必会有一定的空间浪费。例如当…

光栅和矢量图像处理:Graphics Mill 11.4.1 Crack

Graphics Mill 是适用于 .NET 和 ASP.NET 开发人员的最强大的成像工具集。它允许用户轻松向 .NET 应用程序添加复杂的光栅和矢量图像处理功能。 光栅图形 加载和保存 JPEG、PNG 和另外 8 种图像格式 调整大小、裁剪、自动修复、色度键和 30 多种其他图像操作 可处理任何尺寸&am…

AJAX学习笔记1发送Get请求

传统请求有哪些方式,及缺点 传统请求有哪些? 1.直接在浏览器地址栏上输入URL. 2.点击超连接. <a href"/上下文/请求地址">超链接请求</a> ---->相对路径 <a href"http://www.baidu.com">超链接请求</a> ---->绝对路…

【前端】React项目初体验

React介绍 React 是一个非常流行的 JavaScript 前端框架&#xff0c;它为开发人员提供了一种快速构建高质量用户界面的方式。以下是使用 React 构建项目的初体验&#xff1a; 安装 React 和相关依赖项 使用 React 开发项目需要先安装一些必需的依赖项&#xff0c;包括 Node.…

Echarts 中国地图

直接展示效果图&#xff1a; 我们需要引入两个文件&#xff1a; echarts.js 官网地址下载&#xff1a;快速上手 - Handbook - Apache ECharts chain.js 这个官网已经找不到了&#xff0c;需要自行搜寻下载 也可以私信我(网上下载的China.js会导致省名称定为不准确&#xff0…

leetcode 1002. 查找共用字符

2023.9.6 个人感觉这题难度不止简单&#xff0c;考察到的东西还是挺多的。 首先理解题意&#xff0c;可以将题意转化为&#xff1a;求字符串数组中 各字符串共同出现的字符的最小值。 分为三步做&#xff1a; 构造一个哈希表hash&#xff0c;初始化第一个字符串的字母出现频率…

如何挑选低值易耗品管理系统?优化企业管理效率与成本控制

在现代企业管理中&#xff0c;低值易耗品的管理是一个容易被忽视但却十分重要的环节。低值易耗品包括办公用品、耗材、工具等&#xff0c;它们虽然单价不高&#xff0c;但数量庞大且频繁使用&#xff0c;对企业的日常运营和成本控制有着重要影响。为了提高管理效率、降低成本&a…

【Git】删除本地分支;报错error: Cannot delete branch ‘wangyunuo-test‘ checked out at ‘XXX‘

目录 0.环境 1.问题描述 2.解决步骤 1&#xff09;使用命令切换到其他分支 2&#xff09;查看当前本地所有分支 3&#xff09;删除“wangyunuo-test”分支 0.环境 windows 11 64位 Git VScode跑代码 1.问题描述 在做项目过程中&#xff0c;想删除一个本地分支“wangyun…

JS返回NodeList和HTMLCollection详解

HTML DOM 集合 (Collection) 概述 HTML DOM 集合 (Collection) 是一组 HTML 元素&#xff0c;这些元素可以通过 JavaScript 代码进行访问和操作。HTML DOM 集合通常由一个或多个 HTML 元素组成&#xff0c;并提供了访问和操作这些元素的方法。HTML DOM 集合在 JavaScript 中非常…

解决DCNv2不能使用高版本pytorch编译的问题

可变形卷积网络GitHub - CharlesShang/DCNv2: Deformable Convolutional Networks v2 with Pytorch代码已经出来好几年了&#xff0c;虽然声称"Now the master branch is for pytorch 1.x"&#xff0c;实际上由于pytorch自1.11版开始发生了很大变化&#xff0c;原来基…

JAVA毕业设计096—基于Java+Springboot+Vue的在线教育系统(源码+数据库+18000字论文)

基于JavaSpringbootVue的在线教育系统(源码数据库18000字论文)096 一、系统介绍 本系统前后端分离 本系统分为管理员、用户两种角色(管理员角色权限可自行分配) 用户功能&#xff1a; 注册、登录、课程预告、在线课程观看、学习资料下载、学习文章预览、个人信息管理、消息…

elementUI——el-table自带排序使用问题

问题 排序表格默认第一列按降序排&#xff08;状态1&#xff09;&#xff0c;当点击其他列后&#xff08;状态2&#xff09;&#xff0c;改变日期&#xff0c;触发表格数据更新&#xff0c;发现列的排序还点亮在之前的操作上&#xff0c;没有按照默认来&#xff08;回到状态1&a…

Rokid Jungle--Max pro

介绍和功能开发 YodaOS-Master操作系统&#xff1a;以交换计算为核心&#xff0c;实现单目SLAM空间交互&#xff0c;具有高精度、实时性和稳定性。发布UXR2.0SDK&#xff0c;为构建空间内容提供丰富的开发套件 多模态交互 算法原子化 多种开发工具协同 多生态支持 骁龙XR2…

【C++精华铺】10.STL string模拟实现

1. 序言 STL&#xff08;标准模板库&#xff09;是一个C标准库&#xff0c;其中包括一些通用的算法、容器和函数对象。STL的容器是C STL库的重要组成部分&#xff0c;它们提供了一种方便的方式来管理同类型的对象。其中&#xff0c;STLstring是一种常用的字符串类型。 STLstrin…

既然有 HTTP 协议,为什么还要有 RPC

HTTP和RPC 什么是HTTP HTTP协议&#xff08;Hyper Text Transfer Protocol&#xff09;&#xff0c;又叫做超文本传输协议。平时上网在浏览器上敲个网址就能访问网页&#xff0c;这里用到的就是HTTP协议。 什么是RPC RPC&#xff08;Remote Procedure Call&#xff09;&…

VLAN间路由:单臂路由与三层交换

文章目录 一、定义二、实现方式单臂路由三层交换 三、单臂路由与三层路由优缺点对比四、常用命令 首先可以看下思维导图&#xff0c;以便更好的理解接下来的内容。 一、定义 VLAN间路由是一种网络配置方法&#xff0c;旨在实现不同虚拟局域网&#xff08;VLAN&#xff09;之…

ssprompt:一个LLM Prompt分发管理工具

阅读顺序 &#x1f31f;前言&#x1f514;ssprompt介绍命令介绍Metafile介绍版本依赖规则 &#x1f30a; PromptHubGitHub Token &#x1f680; Quick Install系统依赖pip安装Linux, macOS, Windows (WSL)Windows (Powershell) &#x1f6a9; Roadmap&#x1f30f; 项目交流讨论…

Android手机防沉迷软件的基本原理

(现在手机游戏、短视频等不仅对小孩子负面影响巨大&#xff0c;连很多成年人都沉迷其中难以自拔&#xff0c;影响工作、生活、学习。这已经造成全社会性的巨大影响&#xff0c;长此以往&#xff0c;国将不国。本人仅在此以自己掌握的些许技术略尽绵薄之力&#xff0c;希望能抛砖…

一、了解[mysql]索引底层结构和算法

目录 一、索引1.索引的本质2.mysql的索引结构 二、存储引擎1.MyISAM2.InnoDB3.为什么建议InnoDB表要建立主键并且推荐int类型自增&#xff1f;4.innodb的主键索引和非主键索引&#xff08;二级索引&#xff09;区别5.联合索引 一、索引 1.索引的本质 索引:帮助mysql高效获取数…

ClickHouse 存算分离改造:小红书自研云原生数据仓库实践

ClickHouse 作为业界性能最强大的 OLAP 系统&#xff0c;在小红书内部被广泛应用于广告、社区、直播和电商等多个业务领域。然而&#xff0c;原生 ClickHouse 的 MPP 架构在运维成本、弹性扩展和故障恢复方面存在较大局限性。为应对挑战&#xff0c;小红书数据流团队基于开源 C…