摘要
本章继续讲一下线程的东西
目录
摘要
一、抢票
二、加锁保护
三、死锁
1、死锁四个必要条件
2、避免死锁
四、同步
1、常见的线程安全的情况
2、常见不可重入的情况
3、常见可重入的情况
4、可重入与线程安全联系
5、可重入与线程安全区别
一、抢票
这里回顾一下指令
pthread_create创建一个线程
- `thread`:指向线程标识符的指针。在成功创建线程后,线程 ID 被存储在此变量中。
- `attr`:指向线程属性的指针。可以使用默认属性,传入 `NULL`。
- `start_routine`:指向线程函数的指针。新线程将从此函数的起始点开始执行。
- `arg`:传递给线程函数的参数。
pthread_join等待线程
- `thread`:要等待的线程 ID。
- `value_ptr`:指向线程返回值的指针。可以传入 `NULL`。
pthread_exit结束线程其原型如下:
void pthread_exit(void *value_ptr);
- `value_ptr`:线程的返回值。
如下方截图所示就是使用函数进行创建三个线程进行抢票,结果发现抢到了-1这个显然是不可能的,这个按照我的思想是抢到一就停止,这个显然是不可能的。
#include <iostream>
#include <sys/types.h>
#include <unistd.h>
#include <pthread.h>
#include <cstring>
using namespace std;int tickets = 10000; void *getTickets(void *args)
{(void)args;while(true){if(tickets > 0){usleep(1000);printf("%p: %d\n", pthread_self(), tickets);//打印自己的id,并且打印剩余票数tickets--;}else{break;}}return nullptr;
}int main()
{pthread_t t1,t2,t3;// 多线程抢票的逻辑pthread_create(&t1, nullptr, getTickets, nullptr);//创建三个多线程pthread_create(&t2, nullptr, getTickets, nullptr);pthread_create(&t3, nullptr, getTickets, nullptr);pthread_join(t1, nullptr);//等待线程结束pthread_join(t2, nullptr);pthread_join(t3, nullptr);
}
出现上图中这种情况是因为当我现在这个线程在申请抢票的时候,但是因为cpu的速度很快,同时另一个线程也到执行了,所以在这个线程结束的时候,另外一个也结束了,但是他不知道这个票引已经没了,所以就会出现这种情况,所以在图中就可以看出需要一个方案解决这个问题,所以引出了加锁这个概念。
二、加锁保护
加锁保护:加锁的粒度越细、越小越好。
swap或者exchange这两个指令,都是以一条汇编的方式将内存和CPU寄存器区数据进行交换,如果我们在汇编的角度时,只有一条汇编语句,我们就认为该汇编语句的执行是原子的,也就是一条汇编指令就是原子的。
在执行流的视角,是如何看待CPU上面的寄存器呢?
CPU内部的寄存器本质上叫做当前执行流的上下文,寄存器们的空间是被所有的执行流共享的,但是寄存的内容,是被每一个执行流私有的,在被换走的时候上下文数据也会被带走,如下图在A把自己里面的值和寄存器里面的值进行交换,这时就是如第二图就是A里面是1,寄存器里面就是0了,所以当加锁上了,CPU里面的数据变成了0,这时被换下去了,但是A也会把自己的上下文带走,也就是寄存器里面时由1变成0了,所以当B想声请加锁的时候,但是和CPU里面数据交换了,但是CPU里面的数据这时是0,但是交换了也是0,又因为B里面还是0,所以没法进锁内,所只能等A把锁接了,并且和cpu交换了。这个就是加锁保护。
这里介绍几个函数
1、pthread_mutex_init这个就是和下面的全局的用法一样,不过是局部的
2、pthread_mutex_t这个就是全局的加锁,这个就是原生线程库提供的一个数据类型
3、pthread_mutex_lock这个就是加锁,任何时刻只能有一个线程可以取得所的钥匙,这个就是串行的方式
4、pthread_mutex_unlock这个就是解锁的函数
加锁和解锁之间的代码称之为临界区,而线程共同访问的全局变量就称之为临界资源
这里如下方代码所示演示的,就是利用加锁把买票的代码进行了包装,所以这个结果如图就可以看出不会抢票抢到了-1,就是正常的抢票了
#include <iostream>
#include <thread>
#include <cerrno>
#include <cstring>
#include <unistd.h>
#include <pthread.h>
#include <time.h>
#include <cassert>
#include <cstdio>using namespace std;int tickets = 10000; // 临界资源#define THREAD_NUM 800class ThreadData
{
public:ThreadData(const std::string &n,pthread_mutex_t *pm):tname(n), pmtx(pm){}
public:std::string tname;pthread_mutex_t *pmtx;
};void *getTickets(void *args)
{// int myerrno = errno;ThreadData *td = (ThreadData*)args;while(true){// 抢票逻辑int n = pthread_mutex_lock(td->pmtx);assert(n == 0);// 临界区if(tickets > 0) // 1. 判断的本质也是计算的一种{usleep(rand()%1500);printf("%s: %d\n", td->tname.c_str(), tickets);tickets--; // 2. 也可能出现问题n = pthread_mutex_unlock(td->pmtx);assert(n == 0);}else{n = pthread_mutex_unlock(td->pmtx);assert(n == 0);break;}// 抢完票,其实还需要后续的动作usleep(rand()%2000);// errno = myerrno;}delete td;return nullptr;
}int main()
{pthread_mutex_t mtx;pthread_mutex_init(&mtx, nullptr);srand((unsigned long)time(nullptr) ^ getpid() ^ 0x147);pthread_t t[THREAD_NUM];// 多线程抢票的逻辑for(int i = 0; i < THREAD_NUM; i++){std::string name = "thread ";name += std::to_string(i+1);ThreadData *td = new ThreadData(name, &mtx);pthread_create(t + i, nullptr, getTickets, (void*)td);}for(int i = 0; i < THREAD_NUM; i++){pthread_join(t[i], nullptr);}pthread_mutex_destroy(&mtx);
}
下面就是我总结的一些小问题
1、如果多线程访问同一个全局变量,并对它进行数据计算,多线程会互相影响吗?
2、加锁保护:加锁的时候,一定要保证加锁的粒度,越小越好!!
3、pthread_mutex_t 就是原生线程库提供的一个数据类型
4、加锁就是串行执行了吗?加锁了之后,线程在临界区中,是否会切换,会有问题吗?原子性的体现加锁了之后,线程在临界区中,是否会切换,会有问题吗?会切换,不会!第一次理解:虽然被切换了,但是你是持有锁被切换的, 所以其他抢票线程要执行临界区代码,也必须先申请锁,锁它是无法申请成功的,所以,也不会让其他线程进入临界区,就保证了临界区中数据一致性!
5、我是一个线程,我不申请锁,就是单纯的访问临界资源!-- 错误的编码方式
6、在没有持有锁的线程看来,对我最有意义的情况只有两种:
线程1没有持有锁(什么都没做)
线程1释放锁(做完),此时我可以申请锁!
7、加锁就是串行执行了吗? 是的,执行临界区代码一定是串行的!
8、要访问临界资源,每一个线程都必须现申请锁,每一个线程都必须先看到同一把锁&&访问它,锁本身是不是就是一种共享资源?
9、谁来保证锁的安全呢??所以,为了保证锁的安全,申请和释放锁,必须是 原子的!!!
三、死锁
死锁就是如下图所示当A拥有锁1的时候想去申请锁2,但是B在之前已经申请了锁2,他也想申请锁1,但是A想要2并且不给1,B也不给2,这个就是死锁
1、死锁四个必要条件
互斥条件:一个资源每次只能被一个执行流使用
请求与保持条件:一个执行流因请求资源而阻塞时,对已获得的资源保持不放
不剥夺条件:一个执行流已获得的资源,在末使用完之前,不能强行剥夺
循环等待条件:若干执行流之间形成一种头尾相接的循环等待资源的关系
2、避免死锁
破坏死锁的四个必要条件
加锁顺序一致
避免锁未释放的场景
资源一次性分配
四、同步
为什么会引入同步,主要是为了解决访问临界资源的合理性的问题
按照一定的顺序,进行临界资源的访问,线程同步,当我们申请临界资源前需要先做临界资源时候存在的检测,做检测的本质就是访问临界资源,所以得出结论就是对临界资源的检测,也一定需要在加锁和解锁之间的
接着这里总结一下
1、常见的线程安全的情况
每个线程对全局变量或者静态变量只有读取的权限,而没有写入的权限,一般来说这些线程是安的类或者接口对于线程来说都是原子操作
多个线程之间的切换不会导致该接口的执行结果存在二义性
2、常见不可重入的情况
调用了malloc/free函数,因为malloc函数是用全局链表来管理堆的
调用了标准I/O库函数,标准I/O库的很多实现都以不可重入的方式使用全局数据结构
可重入函数体内使用了静态的数据结构
3、常见可重入的情况
不使用全局变量或静态变量
不使用用malloc或者new开辟出的空间
不调用不可重入函数
不返回静态或全局数据,所有数据都有函数的调用者提供
使用本地数据,或者通过制作全局数据的本地拷贝来保护全局数据
4、可重入与线程安全联系
函数是可重入的,那就是线程安全的
函数是不可重入的,那就不能由多个线程使用,有可能引发线程安全问题
如果一个函数中有全局变量,那么这个函数既不是线程安全也不是可重入的
5、可重入与线程安全区别
可重入函数是线程安全函数的一种
线程安全不一定是可重入的,而可重入函数则一定是线程安全的。
如果将对临界资源的访问加上锁,则这个函数是线程安全的,但如果这个重入函数若锁还未释放则会产生死锁,因此是不可重入的。