1.time_wait状态过多原因
在高并发短连接的TCP服务器上,当服务器处理完请求后立刻主动正常关闭连接。主动关闭的一方在发送最后一个 ack 后就会进入TIME_WAIT 状态 停留2MSL(max segment lifetime)的时间,这个场景下,会出现大量socket处于TIMEWAIT状态。如果客户端的并发量持续很高,此时部分客户端就会显示连接不上。
- 高并发让服务器在短时间范围内同时占用大量端口,而端口只0~65535的范围,有限
- 短连接表示“业务处理+传输数据的时间 远远小于 TIMEWAIT超时的时间”的连接。
2.time_wait状态存在的合理性分析
- 可靠的关闭TCP连接
在主动关闭方发送的最后一个 ACK(FIN),有可能丢失,这时被动方会重新发送FIN, 如果这时主动方处于CLOSED状态 ,就会响应RST而不是ACK。所以主动方要处于TIME_WAIT状态,而不能是CLOSED 。 - 防止上一次连接中的包,迷路后重新出现,影响新连接
假设主动关闭方不经过time_wait状态立即调用了close(),双方同时进入CLOSED的终结状态。现在有一个新的连接是原先连接的一个完全复用,IP地址、端口与先前的完全相同,这样新的连接收到的数据报中有可能是先前连接残余的数据报。为了防止这一点,必须要经过time_wait状态,处于TIME_WAIT状态的socket在等待两倍的MSL时间以后(由于MSL是一个数据报在网络中单向发出到认定丢失的时间,确认一个数据报及其响应丢弃的需要两倍的MSL),再转变为CLOSED状态。且TCP不允许新连接复用TIME_WAIT状态下的socket。
3.tcp状态转换
TCP协议规定,对于已经建立的连接,网络双方要进行四次握手才能成功断开连接,如果缺少了其中某个步骤,将会使连接处于假死状态,连接本身占用的资源不会被释放。
参考文章:
https://www.jianshu.com/p/8c5ccbe51f5b
https://blog.csdn.net/csdnlijingran/article/details/88545676
https://blog.csdn.net/yusiguyuan/article/details/21445883
https://blog.csdn.net/baidu_38432732/article/details/81289274