1.阻塞/非阻塞、同步/异步(网络IO)
【思考】典型的一次 IO 的两个阶段是什么?
- 数据就绪 和 数据读写
数据就绪 :根据系统 IO 操作的就绪状态
- 阻塞
- 非阻塞
数据读写 :根据应用程序和内核的交互方式
- 同步
- 异步
陈硕:在处理 IO 的时候,阻塞和非阻塞都是同步 IO ,只有使用了特殊的 API 才是异步 IO 。
一个典型的网络IO接口调用,分为两个阶段,分别是“数据就绪” 和 “数据读写”,数据就绪阶段分为 阻塞和非阻塞,表现得结果就是,阻塞当前线程或是直接返回。
同步 表示 A 向 B 请求调用一个网络 IO 接口时(或者调用某个业务逻辑 API 接口时), 数据的读写都是 由请求方A自己来完成的(不管是阻塞还是非阻塞);
异步 表示 A 向 B 请求调用一个网络 IO 接口时 (或者调用某个业务逻辑API接口时), 向 B传入请求的 事件以及事件发生时通知的方式,A 就可以处理其它逻辑了,当B监听到事件处理完成后,会用事先约定好的通知方式,通知 A处理结果。
2.Unix/Linux上的五种IO模型
a.阻塞 blocking
调用者调用了某个函数,等待这个函数返回,期间什么也不做,不停的去检查这个函数有没有返回,必须等这个函数返回才能进行下一步动作。
b.非阻塞 non-blocking(NIO)
非阻塞等待,每隔一段时间就去检测 IO 事件是否就绪。没有就绪就可以做其他事。非阻塞 I/O 执行系统调用总是立即返回,不管事件是否已经发生,若事件没有发生,则返回-1 ,此时可以根据 errno 区分这两种情况,对于accept,recv 和 send,事件未发生时,errno 通常被设置EAGAIN。
c.IO复用(IO multiplexing)
Linux 用 select/poll/epoll 函数实现 IO 复用模型,这些函数也会使进程阻塞,但是和阻塞 IO所不同的是 这些函数可以同时阻塞多个IO操作。而且可以同时对多个读操作、写操作的IO 函数进行检测。直到有数据可读或可写时,才真正调用IO 操作函数。
d.信号驱动(signal-driven)
Linux 用套接口进行信号驱动 IO ,安装一个信号处理函数,进程继续运行并不阻塞,当 IO 事件就绪,进程收到SIGIO 信号,然后处理 IO 事件。
内核在第一个阶段是异步,在第二个阶段是同步;与非阻塞IO的区别在于它提供了消息通知机制,不需要用户进程不断的轮询检查,减少了系统API的调用次数,提高了效率。
e.异步(asynchronous)
Linux 中,可以调用 aio_read 函数告诉内核描述字缓冲区指针和缓冲区的大小、文件偏移及通知的方式,然后立即返回,当内核将数据拷贝到缓冲区后,再通知应用程序。
/* Asynchronous I/O control block. */
struct aiocb
{int aio_fildes; /* File desriptor. */int aio_lio_opcode; /* Operation to be performed. */int aio_reqprio; /* Request priority offset. */volatile void *aio_buf; /* Location of buffer. */size_t aio_nbytes; /* Length of transfer. */struct sigevent aio_sigevent; /* Signal number and value. *//* Internal members. */struct aiocb *__next_prio;int __abs_prio;int __policy;int __error_code;__ssize_t __return_value;#ifndef __USE_FILE_OFFSET64__off_t aio_offset; /* File offset. */char __pad[sizeof (__off64_t) - sizeof (__off_t)];#else__off64_t aio_offset; /* File offset. */#endifchar __glibc_reserved[32];
};