基于Linux socket聊天室-多线程服务器模型(01)

前言

socket在实际系统程序开发当中，应用非常广泛，也非常重要。实际应用中服务器经常需要支持多个客户端连接，实现高并发服务器模型显得尤为重要。高并发服务器从简单的循环服务器模型处理少量网络并发请求，演进到解决C10K，C10M问题的高并发服务器模型。本文通过一个简单的多线程模型，带领大家学习如何自己实现一个简单的并发服务器。

C/S架构

服务器-客户机，即Client-Server(C/S)结构。C/S结构通常采取两层结构。服务器负责数据的管理，客户机负责完成与用户的交互任务。

在C/S结构中，应用程序分为两部分:服务器部分和客户机部分。服务器部分是多个用户共享的信息与功能，执行后台服务，如控制共享数据库的操作等;客户机部分为用户所专有，负责执行前台功能，在出错提示、在线帮助等方面都有强大的功能，并且可以在子程序间自由切换。

如上图所示：这是基于套接字实现客户端和服务器相连的函数调用关系，socket API资料比较多，本文不再过多叙述。

pthread线程库:(POSIX)

pthread线程库是Linux下比较常用的一个线程库，关于他的用法和特性大家可以自行搜索相关文章，下面只简单介绍他的用法和编译。

线程标识

线程有ID, 但不是系统唯一, 而是进程环境中唯一有效. 线程的句柄是pthread_t类型, 该类型不能作为整数处理, 而是一个结构. 下面介绍两个函数:

头文件: <pthread.h>
原型: int pthread_equal(pthread_t tid1, pthread_t tid2);
返回值: 相等返回非0, 不相等返回0.
说明: 比较两个线程ID是否相等.头文件: <pthread.h>
原型: pthread_t pthread_self();
返回值: 返回调用线程的线程ID.

线程创建

在执行中创建一个线程, 可以为该线程分配它需要做的工作(线程执行函数), 该线程共享进程的资源. 创建线程的函数pthread_create()

头文件: <pthread.h>
原型: int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(start_rtn)(void), void *restrict arg);
返回值: 成功则返回0, 否则返回错误编号.
参数:
tidp: 指向新创建线程ID的变量, 作为函数的输出.
attr: 用于定制各种不同的线程属性, NULL为默认属性（见下）.
start_rtn: 函数指针, 为线程开始执行的函数名.该函数可以返回一个void *类型的返回值，
而这个返回值也可以是其他类型，并由 pthread_join()获取
arg: 函数的唯一无类型(void)指针参数, 如要传多个参数, 可以用结构封装.

编译

因为pthread的库不是linux系统的库，所以在进行编译的时候要加上     -lpthread
# gcc filename -lpthread  //默认情况下gcc使用c库，要使用额外的库要这样选择使用的库

常见的网络服务器模型

本文结合自己的理解，主要以TCP为例，总结了几种常见的网络服务器模型的实现方式，并最终实现一个简单的命令行聊天室。

单进程循环

单线进程循环原理就是主进程没和客户端通信，客户端都要先连接服务器，服务器接受一个客户端连接后从客户端读取数据，然后处理并将处理的结果返还给客户端，然后再接受下一个客户端的连接请求。

优点单线程循环模型优点是简单、易于实现，没有同步、加锁这些麻烦事，也没有这些开销。

缺点

阻塞模型，网络请求串行处理；
没有利用多核cpu的优势，网络请求串行处理；
无法支持同时多个客户端连接；
程序串行操作，服务器无法实现同时收发数据。

单线程IO复用

linux高并发服务器中常用epoll作为IO复用机制。线程将需要处理的socket读写事件都注册到epoll中，当有网络IO发生时，epoll_wait返回，线程检查并处理到来socket上的请求。

优点

实现简单，减少锁开销，减少线程切换开销。

缺点

只能使用单核cpu，handle时间过长会导致整个服务挂死；
当有客户端数量超过一定数量后，性能会显著下降；
只适用高IO、低计算，handle处理时间短的场景。

多线程/多进程

多线程、多进程模型主要特点是每个网络请求由一个进程/线程处理，线程内部使用阻塞式系统调用，在线程的职能划分上，可以由一个单独的线程处理accept连接，其余线程处理具体的网络请求（收包，处理，发包）；还可以多个进程单独listen、accept网络连接。

优点：

1、实现相对简单；2、利用到CPU多核资源。

缺点：

1、线程内部还是阻塞的，举个极端的例子，如果一个线程在handle的业务逻辑中sleep了，这个线程也就挂住了。

多线程/多进程IO复用

多线程、多进程IO服用模型，每个子进程都监听服务，并且都使用epoll机制来处理进程的网络请求，子进程 accept() 后将创建已连接描述符，然后通过已连接描述符来与客户端通信。该机制适用于高并发的场景。

优点：

支撑较高并发。

缺点：

异步编程不直观、容易出错

多线程划分IO角色

多线程划分IO角色主要功能有：一个accept thread处理新连接建立；一个IO thread pool处理网络IO；一个handle thread pool处理业务逻辑。使用场景如：电销应用，thrift TThreadedSelectorServer。

优点：

按不同功能划分线程，各线程处理固定功能，效率更高
可以根据业务特点配置线程数量来性能调优

缺点：

线程间通信需要引入锁开销
逻辑较复杂，实现难度大

小结

上面介绍了常见的网络服务器模型，还有AIO、协程，甚至还有其他的变型，在这里不再讨论。重要的是理解每种场景中所面临的问题和每种模型的特点，设计出符合应用场景的方案才是好方案。

多线程并发服务器模型

下面我们主要讨论多线程并发服务器模型。

代码结构

并发服务器代码结构如下：

thread_func()
{while(1) {recv(...);process(...);send(...);}close(...);
}
main(socket(...); bind(...);listen(...);while(1) { accept(...);pthread_create();}
}

由上可以看出，服务器分为两部分：主线程、子线程。

主线程

main函数即主线程，它的主要任务如下：

socket()创建监听套字；
bind（）绑定端口号和地址；
listen（）开启监听；
accept（）等待客户端的连接，
当有客户端连接时，accept（）会创建一个新的套接字new_fd；
主线程会创建子线程，并将new_fd传递给子线程。

子线程

子线程函数为thread_func（），他通过new_fd处理和客户端所有的通信任务。

客户端连接服务器详细步骤

下面我们分步骤来看客户端连接服务器的分步说明。

1. 客户端连接服务器

服务器建立起监听套接字listen_fd，并初始化；
客户端创建套接字fd1；
客户端client1通过套接字fd1连接服务器的listen_fd；

2. 主线程创建子线程thread1

server收到client1的连接请求后，accpet函数会返回一个新的套接字newfd1;
后面server与client1的通信就依赖newfd1，监听套接字listen_fd会继续监听其他客户端的连接；
主线程通过pthead_create()创建一个子线程thread1，并把newfd1传递给thread1；
server与client1的通信就分别依赖newfd1、fd1。
client1为了能够实时收到server发送的信息，同时还要能够从键盘上读取数据，这两个操作都是阻塞的，没有数据的时候进程会休眠，所以必须创建子线程read_thread;
client1的主线负责从键盘上读取数据并发送给，子线程read_thread负责从server接受信息。

3. client2连接服务器

客户端client2创建套接字fd2;
通过connect函数连接server的listen_fd；

4. 主线程创建子线程thread2

server收到client2的连接请求后，accpet函数会返回一个新的套接字newfd2;
后面server与client2的通信就依赖newfd2，监听套接字listen_fd会继续监听其他客户端的连接；
主线程通过pthead_create()创建一个子线程thread2，并把newfd2传递给thread2；
server与client1的通信就分别依赖newfd2、fd2。
同样client2为了能够实时收到server发送的信息，同时还要能够从键盘上读取数据必须创建子线程read_thread;
client1的主线负责从键盘上读取数据并发送给，子线程read_thread负责从server接受信息。

由上图可见，每一个客户端连接server后，server都要创建一个专门的thread负责和该客户端的通信；每一个客户端和server都有一对固定的fd组合用于连接。

实例

好了，理论讲完了，根据一口君的惯例，也继承祖师爷的教诲：talk is cheap，show you my code.不上代码，只写理论的文章都是在耍流氓。

本例的主要功能描述如下：

实现多个客户端可以同时连接服务器；
客户端可以实现独立的收发数据；
客户端发送数据给服务器后，服务器会将数据原封不动返回给客户端。

服务器端

/*********************************************服务器程序  TCPServer.c  
*********************************************/
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <errno.h>
#include <string.h>
#include <pthread.h>
#include <stdlib.h>#define RECVBUFSIZE 2048
void *rec_func(void *arg)
{int sockfd,new_fd,nbytes;char buffer[RECVBUFSIZE];int i;new_fd = *((int *) arg);free(arg); while(1){if((nbytes=recv(new_fd,buffer, RECVBUFSIZE,0))==-1){fprintf(stderr,"Read Error:%s\n",strerror(errno));exit(1);}if(nbytes == -1){//客户端出错了 返回值-1close(new_fd);break;   }if(nbytes == 0){//客户端主动断开连接，返回值是0close(new_fd);break;}buffer[nbytes]='\0'; printf("I have received:%s\n",buffer); if(send(new_fd,buffer,strlen(buffer),0)==-1){fprintf(stderr,"Write Error:%s\n",strerror(errno));exit(1);}}}int main(int argc, char *argv[])
{char buffer[RECVBUFSIZE];int sockfd,new_fd,nbytes;struct sockaddr_in server_addr;struct sockaddr_in client_addr;int sin_size,portnumber;char hello[]="Hello! Socket communication world!\n";pthread_t tid;int *pconnsocke = NULL;int ret,i;if(argc!=2){fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]);exit(1);}/*端口号不对，退出*/if((portnumber=atoi(argv[1]))<0){fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]);exit(1);}/*服务器端开始建立socket描述符  sockfd用于监听*/if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1)  {fprintf(stderr,"Socket error:%s\n\a",strerror(errno));exit(1);}/*服务器端填充 sockaddr结构*/ bzero(&server_addr,sizeof(struct sockaddr_in));server_addr.sin_family     =AF_INET;/*自动填充主机IP*/server_addr.sin_addr.s_addr=htonl(INADDR_ANY);//自动获取网卡地址server_addr.sin_port       =htons(portnumber);/*捆绑sockfd描述符*/ if(bind(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1){fprintf(stderr,"Bind error:%s\n\a",strerror(errno));exit(1);}/*监听sockfd描述符*/if(listen(sockfd, 10)==-1){fprintf(stderr,"Listen error:%s\n\a",strerror(errno));exit(1);}while(1){/*服务器阻塞，直到客户程序建立连接*/sin_size=sizeof(struct sockaddr_in);if((new_fd = accept(sockfd,(struct sockaddr *)&client_addr,&sin_size))==-1){fprintf(stderr,"Accept error:%s\n\a",strerror(errno));exit(1);}pconnsocke = (int *) malloc(sizeof(int));*pconnsocke = new_fd;ret = pthread_create(&tid, NULL, rec_func, (void *) pconnsocke);if (ret < 0) {perror("pthread_create err");return -1;} }//close(sockfd);exit(0);
}

客户端

/*********************************************服务器程序  TCPServer.c  
*********************************************/
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <errno.h>
#include <string.h>
#include <pthread.h>
#include <stdlib.h>
#define RECVBUFSIZE 1024void *func(void *arg)
{int sockfd,new_fd,nbytes;char buffer[RECVBUFSIZE];new_fd = *((int *) arg);free(arg);while(1){if((nbytes=recv(new_fd,buffer, RECVBUFSIZE,0))==-1){fprintf(stderr,"Read Error:%s\n",strerror(errno));exit(1);}buffer[nbytes]='\0';printf("I have received:%s\n",buffer); }}int main(int argc, char *argv[])
{int sockfd;char buffer[RECVBUFSIZE];struct sockaddr_in server_addr;struct hostent *host;int portnumber,nbytes; pthread_t tid;int *pconnsocke = NULL;int ret;//检测参数个数if(argc!=3){fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]);exit(1);}//argv2 存放的是端口号 ，读取该端口，转换成整型变量if((portnumber=atoi(argv[2]))<0){fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]);exit(1);}//创建一个 套接子if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1){fprintf(stderr,"Socket Error:%s\a\n",strerror(errno));exit(1);}//填充结构体，ip和port必须是服务器的bzero(&server_addr,sizeof(server_addr));server_addr.sin_family=AF_INET;server_addr.sin_port=htons(portnumber);server_addr.sin_addr.s_addr = inet_addr(argv[1]);//argv【1】 是server ip地址/*¿Í»§³ÌÐò·¢ÆðÁ¬œÓÇëÇó*/ if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1){fprintf(stderr,"Connect Error:%s\a\n",strerror(errno));exit(1);}//创建线程pconnsocke = (int *) malloc(sizeof(int));*pconnsocke = sockfd;ret = pthread_create(&tid, NULL, func, (void *) pconnsocke);if (ret < 0) {perror("pthread_create err");return -1;} while(1){#if 1printf("input msg:");scanf("%s",buffer);if(send(sockfd,buffer,strlen(buffer),0)==-1){fprintf(stderr,"Write Error:%s\n",strerror(errno));exit(1);}#endif}close(sockfd);exit(0);
}

编译编译线程，需要用到pthread库，编译命令如下：

gcc s.c -o s -lpthread
gcc cli.c -o c -lpthread 先本机测试
开启一个终端 ./s 8888
再开一个终端 ./cl 127.0.0.1 8888,输入一个字符串"qqqqqqq"
再开一个终端 ./cl 127.0.0.1 8888,输入一个字符串"yikoulinux"

有读者可能会注意到，server创建子线程的时候用的是以下代码：

 pconnsocke = (int *) malloc(sizeof(int));*pconnsocke = new_fd;ret = pthread_create(&tid, NULL, rec_func, (void *) pconnsocke);if (ret < 0) {perror("pthread_create err");return -1;}

为什么必须要malloc一块内存专门存放这个新的套接字呢？

这个是一个很隐蔽，很多新手都容易犯的错误。下一章，我会专门给大家讲解。