Linux之Tcp粘包笔记

一.网络传输四层模型

二.数据传输中数据包传输的两个限制概念

三.数据传输的中粘包问题

四.数据组装的原因

Nagle算法原理:

五.关闭Nagle优化处理粘包问题吗？

六.粘包处理方法

a.设置消息边界：

b.定义消息长度：

七.UDP是否会出现粘包

a.IP数据报文格式

b.UDP数据报文格式

c.tcp数据报文格式

八.IP层网络层是否会产生粘包

九总结

一.网络传输四层模型

在网络传输的四层模型中:网络层接口(数据链路层)->网络层->传输层->应用层。通过这四层模型传递，进行数据传输。如下图:

发送方传递消息，经过每一层都添加对应模型的包头,在传递下一等模型，接收方接收到通过层层剥离每一层的包头，最后就得到对应的消息。

二.数据传输中数据包传输的两个限制概念

MTU:最大传输单元(这个由网络接口层决定,最大为1500字节)。

MSS:最大传输报文(表示每次传输的报文大小)表示tcp用来限制应用层每次最大发送的报文长度。

两者关系: MTU = MSS + IP(头部,20字节) + TCP(头部,20字节)

例如:如果一个报文长度< 1500,那么一次就可以发送完成。> 1500 的报文传输就需要进行分片传输。比如，2000长度的数据包，第一个分包:1460,第二个分包:540(剔除ip+tcp包头各占20个字节)

如下图,MTU跟MSS关系图解:

三.数据传输的中粘包问题

针对粘包的产生,产生在TCP(字节流传输)，例如:a给b发送一条消息,HelloWorld。可是因为传输过程中,b接受到的信息:HelloW ,orld这样b接收到的信息就变了意思。为什么会产生此种情况。就是因为所说的粘贴包导致。

原因:TCP传输按照字节流传输(传输的就是二进制的数据流)，在下层发送的时候，可能会被切片并且重新组装，最后再发送至接收者的缓冲区，而接收端未能正确的还原对应的数据流导致。这种情况的粘包问题主要是出在了开发者对tcp数据字流的处理上。并非tcp传输方式自身会产生粘包，这个才是出现粘包的实质原因。

四.数据组装的原因

因为受限于MTU跟MSS的报文传输限制,当要传输一个很大的报文时，就需要对该报文进行分割，将其分割成若干，依次通过限制的传输通道，接收方收到后,再将收到的分割包重新组装起来，还原发送方的数据。另外在Tcp的传输方式中还存在一个组装的情况。比如，发送两个比较小的数据报文(<MSS),这样的发送方式比较比较浪费资源。所以TCP中设计了优化算法，Nagle算法进行优化。

Nagle算法原理:

a.在发送一个数据包如果长度达到MSS(or含有FIN的数据包)，那么就立刻发送该数据包。如果当前数据包msg1<MSS,那么就会等到下一个数据包msg2到来，如果该msg1 + msg2 > MSS,那么就会让将msg2进行拆分发送。

b.该算法每次发送数据包，(设置了一个超时等待机制，一般是200ms)，第一个包长度没达到MSS，就会进行一个超时等待第二个包来,如果等待第二个包超时还没来，则立刻发送第一个数据包。

c.如下图解:

d.m1 < MSS,此时m2来了，但是len(m1+ m2) > MSS,在Nagle算法开启情况，会将m2进行拆分,m2-1,m2-2,此时len(m1 + m2-1)= MSS,将该两包进行组装并且立刻发送出去。而m2-2,会重复前面的流程等待(200ms)，以此类推，如果超时还没等到包来，就立刻将当前包发送出去。

e.上图解释明确颜色表述,但实际存储的都是为二进制数据，如果接受者把m1+ m2-1,当成一个包来处理，就会造成不明消息,该情况就是粘包情况。

五.关闭Nagle优化处理粘包问题吗？

a.Nagle算法优化了资源的浪费情况，但是带来粘包问题。另外超时等待机制也是一个很大的缺陷问题,比如当下的游戏场景，正在打游戏,因为该算法的超时等待，导致一个数据包延时到来，就会造成游戏画面卡顿。通常使用中，都会关闭该算法优化。TCP_NODELAY = 1（Nagle关闭）

b.即便关闭了该算法的优化,是不是就不会产生粘包情况？答案是否定的。仍旧会产生粘包问题。如下图:

如图，当m1消息到来时，直接取走了，消息正常还原。然后后续有消息来了，发送到了接受方的缓冲区，因应用层未能及时读走，下一个数据包也发送到了接受方的缓冲期如上图m2m3，此时应用层一次将所有的数据读取了，导致数据混乱，从而导致就出现了粘包问题，

六.粘包处理方法

粘包的问题主要是字节流传输中未能定义具体的消息边界导致。换句话说就是开发者发送数据的问题导致。如下介绍几种方法:

a.设置消息边界：

给消息定义边界头跟边界尾巴，消息结构如下:

    ｜消息头｜消息体｜消息尾｜｜header｜body| body_tail|

但是a中存在一个问题,如果消息内容中存在跟头or尾中一样的标志，也会出现问题，处理该问题,可采用crc校验和添加来处理，如下图解:

校验和:对整个消息生成的校验值

发送方通过对消息设置对应的校验和，接收方收到消息后,校验确保是发送方发送的完整数据。

b.定义消息长度：

利用消息长度，应用层再度读取消息的按照消息长度读取正确的消息内容，跟http中的Content-Length表示传输的数据长度蕾丝。该种方法，也可结合a中的标志，再加上消息长度，就更加的能确保消息的读取的正确性。

结构如下:

七.UDP是否会出现粘包

首先UDP的发送方式，使用的是数据报文方式，每次发送的数据都是一整个数据报文。无论应用层每次丢给UDP的报文多长，都会原样发送出去。这是跟tcp按照字节流发送的差异性。另外如果UDP的数据太大的话，也是会进行分片的,只不过该分片在IP层面,即便在应用层面,也不会像tcp那样分不清啥时候会结束。这就是udp跟tcp两者的区别。例如发送端发送了10次，接受端接收10次，发多少，接收多少,确保每次一完成的数据包就好了。

a.IP数据报文格式

上图中有个16位的总长度,表明Ip包的总长度m。

b.UDP数据报文格式

如上图,UDP报文头有个16位的UDP长度表示n。应用层可根据该字段，读取对应大小的UDP报文。故而UDP不会产生粘包问题。另外如果不存在长度n，那么通过ip层也能够知道udp数据报文长度。计算方式: UDP包长度 = IP包总长度 - IP包头部 - UDP包头部。有个问题,这个16位的n字段是否多余的。如下答案:

c.tcp数据报文格式

如上图tcp的报文结构中没有存储数据包的长度,但是依旧能通过如下方式计算:

tcp包长度 = IP包长度 - IP包头长度 - TCP包长度，如下图:

上面说UDP数据包头中的16位长度是否多余呢？答案否定的。如下解释:Tcp-Ip卷2中解释说是用于计算校验和，并且说UDP底层可能用的不是Ip协议,如果是其他网络类型,那么就不能计算UDP包长度了。但是还有一种解释,根据某位大佬的讲解，因为IP层是网络层协议,而UDP是传输层协议,当数据传输层,此时IP层头部已经被剥离了，此时如果UDP没有自身16位的长度，是无法计算出数据部分长度的。所有该解释感觉比较更切近点。当前卷中的解释,可能以后出现新协议作网络层处理，也是可能的。敬请期待中。。。还有，这个n跟tcp中应用层定义对应数据包长度字段是一个道理,用来确定包长度，防止粘包发生。

八.IP层网络层是否会产生粘包

IP层传输也会对大包进行分包处理的，那么是否会产生粘包呢？

答案是不会产生粘包的。这个前面说了，粘包的原因是使用者无法正确区分消息边界导致的。如下图所示:

整个数据包传输过程,从发送者网络层到接受者网络层，消息太长，超过MTU，会把消息分N个切片,并且每个切片会携带自身在整包的位置偏转量(offset)以及相同的头部信息。当数据包到达接受者的网络层,会将数据包重新组装起来。(过程是申请一个ip结构,将所有的分片包按照偏转量放置在各自的位置)等所有数据包组装完成，再即将数据包推到传输层。后面的处理，就是如上解释的是否粘包问题以及相关的处理。另外有关IP层分片请见如下博文,上图来自博主的下述文章：网络层协议之IP数据包层分片随笔_ip数据报分片计算-CSDN博客