线程
线程共享存储空间主要带来的问题是数据同步和互斥。由于线程在同一进程中运行,它们共享相同的内存空间,任何线程都可以访问共享数据。这样,多个线程并发执行时,可能会导致以下两种主要问题:
互斥问题(Mutual Exclusion)同步问题(Synchronization)
互斥问题指的是多个线程对共享资源的访问冲突,通常表现为多个线程试图同时读写同一份数据,导致数据不一致或者不可预测的行为。为了避免这种情况,需要通过互斥机制确保同一时刻只有一个线程能够访问共享资源。
同步问题指的是线程间的协作问题,例如一个线程需要等待另一个线程完成某个任务,或者需要确保线程按照特定顺序执行。同步通常涉及线程之间的协调,确保它们在正确的时机访问共享资源或按顺序执行。
互斥锁(Mutex):互斥锁是一种用于保证某段代码在任何时刻只能由一个线程执行的同步机制。当一个线程获得互斥锁后,其他线程必须等待直到该线程释放锁,才能获得访问权限。
自旋锁:自旋锁与互斥锁很相似,从本质上说也是一把锁,在访问共享资源之前对自旋锁进行上锁,在访问完成后释放自旋锁(解锁);事实上,从实现方式上来说,互斥锁是基于自旋锁来实现的,所以自旋锁相较于互斥锁更加底层。如果在获取自旋锁时,自旋锁处于未锁定状态,那么将立即获得锁(对自旋锁上锁);如果在获取自旋锁时,自旋锁已经处于锁定状态了,那么获取锁操作将会在原地“自旋”,直到该自旋锁的持有者释放了锁。由此介绍可知,自旋锁与互斥锁相似,但是互斥锁在无法获取到锁时会让线程陷入阻塞等待状态;而自旋锁在无法获取到锁时,将会在原地“自旋”等待。“自旋”其实就是调用者一直在循环查看该自旋锁的持有者是否已经释放了锁,“自旋”一词因此得名。
读写锁(Read-Write Lock):允许多个线程并发地读共享资源,但在写操作时要求独占访问。这对于读操作较多的场景非常有用。
信号量(Semaphore):信号量可以用于控制访问共享资源的线程数量,通常用于多个线程对有限资源的访问控制。
条件变量(Condition Variables):条件变量允许线程在某个条件不满足时进入阻塞状态,直到条件满足时被唤醒。常用于生产者-消费者模型,或其他需要线程等待某个条件成立的情况。
进程
进程间通信(IPC) 和 同步 是操作系统中两个密切相关的概念,它们都涉及到多进程或多线程环境下的协调与协作,但其关注点有所不同。简单来说,IPC 主要关注数据交换,而同步主要关注资源访问控制。IPC 侧重于消息传递、共享内存或信号传递等形式的通信,同步 侧重于通过锁、信号量等机制控制对共享资源的访问。
进程间通信:
UNIX IPC
UNIX 系统早期的进程间通信机制相对简单,主要包括以下几种:
管道(Pipe):
用于同一进程组中的进程之间的单向通信。
管道提供了一个数据流通道,一个进程写入数据到管道中,另一个进程从管道中读取数据。
管道仅支持单向通信,且只能用于具有亲缘关系的进程(如父子进程)。
FIFO(命名管道):
FIFO 是管道的扩展,它允许无亲缘关系的进程通过一个名称来进行通信。
与管道不同,FIFO 可以通过文件路径名在文件系统中创建,允许不同的进程通过这个命名管道进行通信。
它也支持双向通信,但是仍然是基于字节流的。
信号(Signal):
UNIX 中的信号是一种轻量级的进程间通信方式,用于通知进程某个事件的发生。
常见的信号包括 SIGINT(中断)、SIGTERM(终止)等。进程可以通过 kill() 函数发送信号,目标进程通过信号处理器接收信号。
信号适用于进程之间的通知与控制,但并不适合传递大量数据。
System V IPC
System V IPC 是 UNIX 系统在 1980s 后期引入的一套扩展机制,提供了更为强大和灵活的进程间通信功能。System V IPC 包括以下几种主要机制:
System V 信号量(Semaphore):
信号量是一种用于同步进程间访问共享资源的机制。它通过一个计数器来表示资源的可用数量,进程在访问共享资源时,通过对信号量的操作(如 P() 和 V() 操作)来控制对资源的访问。
支持计数信号量和二值信号量,可以用于实现互斥锁、资源计数等。
System V 消息队列(Message Queue):
消息队列允许进程通过一个消息队列进行通信。每条消息有一个类型,接收进程可以根据消息类型来接收特定的消息。
它是一个先进先出(FIFO)的队列,用于在进程间传递结构化的消息。
System V 共享内存(Shared Memory):
共享内存是 System V IPC 中最快的一种方式,允许多个进程直接访问相同的内存区域,实现高效的数据交换。
使用共享内存时,需要额外的同步机制(如信号量)来防止竞争条件。
缺点:
System V IPC 的使用较为复杂,API 不够直观。
资源管理不够灵活,创建和销毁 IPC 资源可能会产生问题。
资源控制和错误处理机制较弱,容易发生资源泄漏。
POSIX IPC
POSIX IPC 是在 System V IPC 基础上进行改进的一组标准,目的是提供更清晰、更灵活、更易用的进程间通信机制。POSIX IPC 采用了与 System V IPC 相同的基本概念,但做了一些优化。
POSIX 信号量(POSIX Semaphore):
POSIX 信号量提供了更易于使用的 API,并改进了对信号量的控制。与 System V 信号量相比,POSIX 信号量在实现上更加一致和简洁。
POSIX 消息队列(POSIX Message Queue):
与 System V 消息队列类似,POSIX 消息队列允许进程通过消息队列进行通信。POSIX 消息队列支持更高效的消息管理和更简单的错误处理。
POSIX 消息队列可以提供持久化支持,并且支持异步操作,适合于需要高吞吐量的场景。
POSIX 共享内存(POSIX Shared Memory):
POSIX 共享内存同样允许多个进程访问同一块内存区域,具有较高的效率。POSIX 的实现相比 System V 共享内存提供了更简洁的 API 和资源管理。
POSIX 共享内存还支持映射到进程地址空间,方便访问和管理。
POSIX IPC 的优势:
API 简单直观,易于使用和理解。
更好的资源管理和错误处理。
在 POSIX 标准中,IPC 机制是跨平台的(例如,Linux、macOS 等支持 POSIX 标准)。
Socket IPC
Socket IPC 是基于 套接字 的进程间通信机制,支持在同一台主机内的进程间通信,也可以实现跨网络的进程通信。
套接字是计算机网络通信的基本单元,可以用于 TCP/IP 协议栈之上进行通信。
套接字通常用于网络通信,但也可以用于同一主机内的进程间通信(Unix 域套接字)。
Socket 的特点:
跨平台支持:适用于同一主机内和分布式系统中的进程间通信。
灵活性强:支持流式通信(TCP)和数据报式通信(UDP),可以满足各种通信需求。
可靠性:TCP 套接字提供了可靠的连接和数据传输保障。
进程同步
常见的进程间同步机制
互斥锁(Mutex):
确保同一时刻只有一个进程能够访问共享资源。其他进程必须等待锁释放才能继续访问该资源。
互斥锁用于防止竞态条件,保证共享资源在临界区内只有一个进程操作。
信号量(Semaphore):
信号量是一种用来控制多个进程对共享资源访问的计数器。它可以用于实现互斥、同步以及进程间的通信。
信号量有两种类型:二值信号量(只允许两个状态:0和1,类似于互斥锁)和计数信号量(允许多个进程并发访问共享资源)。