IO多路转接之select
1. 初识select
系统提供select
函数来实现多路复用输入/输出模型。
- select系统调用是用来让我们的程序监视多个文件描述符的状态变化的;
- 程序会停在select这里等待,直到被监视的文件描述符有一个或多个发生了状态改变;
2. select函数原型
#include <sys/select.h>
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
2.1 参数解释
-
nfds:输入型参数,是需要监视的最大的文件描述符值 + 1;
-
rdset,wrset,exset,timeout:输入输出型参数
rdset
:需要检测的可读文件描述符的集合,wrset
:可写文件描述符的集合,exset
:异常文件描述符的集合;timeout
:timeval结构体,用来设置select()的等待时间,共有三个可以被设置的选项:-
NULL:阻塞等待,直到某个文件描述符上发生了事件;
-
0:非阻塞等待,然后立即返回。
-
具体的时间:指定的时间段里阻塞等待,如果等待成功返回剩余时间,否则将超时返回。
-
-
函数返回值:
n > 0 :n个文件描述符就绪;
n == 0:超时返回
n < 0 :等待失败
2.2 fd_set结构
其实这个结构就是一个“位图”。使用位图中对应的位来表示要监视的文件描述符。完成用户和内核之间的信息的互相传递。
这里提供了一组操作fd_set
的接口,来比较方便的操作位图。
void FD_CLR(int fd, fd_set *set); // 用来清除描述词组set中相关fd 的位
int FD_ISSET(int fd, fd_set *set); // 用来测试描述词组set中相关fd 的位是否为真
void FD_SET(int fd, fd_set *set); // 用来设置描述词组set中相关fd的位
void FD_ZERO(fd_set *set); // 用来清除描述词组set的全部位
2.3 timeval结构
timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件发生则函数返回,返回值为0。
/* A time value that is accurate to the nearestmicrosecond but also has a range of years. */
struct timeval{__time_t tv_sec; /* Seconds. */__suseconds_t tv_usec; /* Microseconds. */};
2.4 函数返回值
- 执行成功则返回文件描述词状态已改变的个数,
- 如果返回0代表在描述词状态改变前已超过timeout时间,没有返回
- 当有错误发生时则返回-1,错误原因存于errno,此时参数readfds,writefds, exceptfds和timeout的值变成不可预测。
错误值可能为:
- EBADF 文件描述词为无效的或该文件已关闭
- EINTR 此调用被信号所中断
- EINVAL 参数n 为负值。
- ENOMEM 核心内存不足
3. 理解select执行过程
理解select模型的关键在于理解fd_set
,取fd_set
长度为1字节,fd_set
中的每一bit位可以对应一个文件描述符fd。则1字节长的fd_set
最大可以对应8个fd。
(1)执行fd_set set
;FD_ZERO(&set);则set用位表示是0000,0000
。
(2)若fd=5,执行FD_SET(fd, &set);后set变为0001,0000
(第5个bit位 置为1)
(3)若再加入fd=2,fd = 1,则set变为0001,0011
。
(4)执行select(6, &set, NULL, NULL, NULL) 阻塞等待。
(5)若fd = 1,fd = 2上都发生可读事件,则select返回,此时set变为0000,0011
。
注意:没有事件发生的fd = 5被清空。
4. socket就绪条件
4.1 读就绪
- socket内核中,接收缓冲区中的字节数 大于等于低水位标记SO_RCVLOWAT。此时可以无阻塞的读该文件描述符,并且返回值大于0;
- socket TCP通信中,对端关闭连接,此时对该socket读,则返回0;
- 监听的socket上有新的连接请求;
- socket上有未处理的错误;
4.2 写就绪
- socket内核中,发送缓冲区中的可用字节数(发送缓冲区的空闲位置大小),大于等于低水位标记SO_SNDLOWAT,此时可以无阻塞的写,并且返回值大于0;
- socket的写操作被关闭(close或者shutdown)。 对一个写操作被关闭的socket进行写操作,会触发SIGPIPE信号;
- socket使用非阻塞connect连接成功或失败之后;
- socket上有未读取的错误;
5. select的特点
-
可监控的文件描述符个数取决与sizeof(fd_set)的值。我的服务器上sizeof(fd_set)=128,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是128*8=1024。
-
将fd加入select监控集的同时,还要再使用一个数据结构fdarray[]保存放到select监控集中的fd
-
一是用于再select 返回后,fdarray[]作为源数据和fd_set进行FD_ISSET判断。
-
二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始select前都要重新从fdarray[]取得fd逐一加入(FD_ZERO最先),扫描fdarray[]的同时取得fd最大值maxfd,用于select的第一个参数。
-
6. select缺点
- 每次调用select,都需要手动设置fd集合,从接口使用角度来说也非常不便。
- 每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大。
- 同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大。
- select支持的文件描述符数量太小。