Linux：五种IO模型

1：五种IO模型

1：阻塞IO

阻塞IO:

在内核将数据准备好之前,系统调用会一直等待.所有的套接字,默认都是阻塞方式。

2：非阻塞 IO

非阻塞 IO:

如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回EWOULDBLOCK 错误码。

非阻塞 IO 往往需要循环的方式反复尝试读写文件描述符(对于CPU会有较大的浪费), 这个过程称为轮询。

3：信号驱动IO

信号驱动 IO:

内核将数据准备好的时候, 使用 SIGIO 信号通知应用程序进行 IO操作。

4：IO多路转接

IO 多路转接:

虽然从流程图上看起来和阻塞 IO 类似. 实际上最核心在于 IO 多路转接能够同时等待多个文件描述符的就绪状态。

5：异步IO

异步 IO:

由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据)。

2：总结

任何 IO 过程中, 都包含两个步骤。第一是等待, 第二是拷贝。而且在实际的应用场景中, 等待消耗的时间往往都远远高于拷贝的时间。让 IO 更高效, 最核心的办法就是让等待的时间尽量少。

同步通信(synchronous communication) vs 异步通信(asynchronous communication)

1. 同步(Synchronous IO)：

就是在发出一个调用时，在没有得到结果之前，该调用就不返回。但是一旦调用返回，就得到返回值了; 换句话说，就是由调用者主动等待这个调用的结果;

2. 异步(Asynchronous IO)：

调用在发出之后，这个调用就直接返回了，所以没有返回结果; 换句话说，当一个异步过程调用发出后，调用者不会立刻得到结果; 而是在调用发出后，被调用者通过状态、通知来通知调用者，或通过回调函数处理这个调用。

同步（Synchronization）vs 互斥（Mutual Exclusion）

同步（Synchronization）：
- 同步是指在多线程环境中，协调多个线程的执行顺序，使得它们能够按照预定的顺序执行。
- 同步通常用于确保线程之间的合作，例如，一个线程可能需要等待另一个线程完成某些任务后才能继续执行。
- 同步可以通过多种机制实现，如信号量（Semaphore）、事件（Event）、条件变量（Condition Variable）等。
互斥（Mutual Exclusion）：
- 互斥是指在多线程环境中，确保同一时间只有一个线程能够访问某个特定的资源或代码段。
- 互斥主要用于防止竞争条件，即多个线程同时访问和修改共享数据，导致数据不一致的问题。
- 互斥可以通过锁（Locks）如互斥锁（Mutex）、读写锁（Read-Write Lock）等来实现。

常见的同步和互斥机制：

互斥锁（Mutex）：一种基本的同步机制，用于保护临界区，确保同一时间只有一个线程可以进入临界区。
信号量（Semaphore）：用于控制对共享资源的访问，可以允许多个线程同时访问，也可以限制访问数量。
事件（Event）：用于线程之间的通信，一个线程可以等待事件被另一个线程触发。
条件变量（Condition Variable）：用于线程之间的同步，允许线程在某些条件不满足时挂起，并在条件满足时被唤醒。
读写锁（Read-Write Lock）：允许多个读操作同时进行，但写操作会独占锁，确保写操作的互斥。

同步与互斥的区别：

同步：关注的是线程之间的协调和合作，确保它们能够按照正确的顺序执行。
互斥：关注的是保护共享资源，防止多个线程同时访问同一资源，从而避免数据不一致。

阻塞（Blocking）vs 非阻塞（Non-blocking）

阻塞和非阻塞关注的是程序在等待调用结果（消息，返回值）时的状态。

阻塞（Blocking）：
- 当一个线程执行一个阻塞操作时，它会停止执行，直到该操作完成。在等待期间，线程不会做任何其他工作。
- 阻塞操作通常用于简化编程模型，因为它们不需要额外的机制来处理并发和同步。
- 缺点是阻塞操作可能导致程序的响应性降低，特别是在等待时间较长的情况下。
非阻塞（Non-blocking）：
- 非阻塞操作不会停止线程的执行。如果操作尚未完成，线程可以继续执行其他任务。
- 非阻塞操作通常需要额外的同步机制，如事件、回调或轮询，来处理操作的完成。
- 优点是可以提高程序的并发性和响应性，因为线程不需要等待就可以继续执行其他任务。

阻塞与非阻塞的比较：

性能：
- 阻塞操作可能导致线程资源的浪费，特别是在IO密集型应用中。
- 非阻塞操作可以提高资源利用率，因为线程可以在等待期间执行其他任务。
编程复杂性：
- 阻塞操作通常更容易理解和实现，因为它们遵循同步编程模型。
- 非阻塞操作可能更复杂，需要更多的同步和错误处理机制。
适用场景：
- 阻塞操作适用于简单的应用或那些不需要高并发的场景。
- 非阻塞操作适用于需要高并发和快速响应的系统，如服务器和网络应用。

实际应用中的阻塞与非阻塞：

文件IO：
- 阻塞式文件IO：当一个线程读取文件时，如果文件不可用，线程会等待直到文件可用。
- 非阻塞式文件IO：线程会立即返回，不会等待文件可用，而是定期检查文件状态。
网络IO：
- 阻塞式网络IO：当一个线程等待数据到来时，它会阻塞直到数据到达。
- 非阻塞式网络IO：线程会立即返回，不会等待数据，而是定期检查数据是否到达。

3：非阻塞IO举例

fcntl

#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );

传入的 cmd 的值不同, 后面追加的参数也不相同。

fcntl 函数有 5 种功能：

• 复制一个现有的描述符（cmd=F_DUPFD）。

• 获得/设置文件描述符标记(cmd=F_GETFD 或 F_SETFD)。

• 获得/设置文件状态标记(cmd=F_GETFL 或 F_SETFL)。

• 获得/设置异步 I/O 所有权(cmd=F_GETOWN 或 F_SETOWN)。

• 获得/设置记录锁(cmd=F_GETLK,F_SETLK 或 F_SETLKW)。

轮询方式读取标准输入

#include <iostream>
#include <unistd.h>
#include <fcntl.h>
#include <sys/select.h>int SetNoBlock(int fd)
{int flags = fcntl(fd, F_GETFL);if (flags == -1){perror("fcntl get flags");return 0;}else{int n = fcntl(fd, F_SETFL, flags | O_NONBLOCK);if (n == -1){perror("fcntl set flags");return 0;}}return 1;
}int main()
{if (!SetNoBlock(0)){perror("fcntl set fcntl!");return -1;}while (true){printf("Enter: ");fflush(stdout);char buffer[1024];ssize_t n = ::read(0, buffer, sizeof(buffer));// 如果是非阻塞，底层数据没有准备就绪，IO接口，会以出错的形式返回！// 区分 底层不就绪 与 真的出错了 ？// 底层没有就绪（错误码被设置）：errno错误码：EWOULDBLOCK EAGAINif (n > 0){buffer[n] = 0;std::cout << buffer << std::endl;}else if (n == 0) //ctrl + d 读取输入结束{perror("read done");break;}else{if (errno == EWOULDBLOCK){sleep(1);// 轮询检测...// Do other things...printf("Do other things\n");continue;}else if (errno == EINTR) // 处理读取被中断{continue;}else{perror("read");break;}}sleep(1);}return 0;
}