【网络协议】TCP协议常用机制——延迟应答、捎带应答、面向字节流、异常处理,保姆级详解,建议收藏

💐个人主页:初晴~

📚相关专栏:计算机网络那些事


        前几篇文章,博主带大家梳理了一下TCP协议的几个核心机制,比如保证可靠性的 确认应答、超时重传 机制,和提高传输效率的 滑动窗口及其相关优化机制。除此之外,TCP还有一些非常重要的核心机制,就让博主在本篇文章带着大家学习一下吧

一、延迟应答

TCP协议中的延时应答(Delayed Acknowledgment)机制是一种优化技术,旨在减少网络中的确认(ACK)消息数量,从而提高网络带宽利用率和减少网络拥塞

试想一下,如果接收端在收到数据时就立马返回ACK应答可能会出现什么问题?

这时返回的窗口可能会比较小

  • 假设接收端缓冲区1M,⼀次收到了500K的数据,如果⽴刻应答,返回的窗⼝就是500K
  • 但实际上可能处理端处理的速度很快,10ms之内就把500K数据从缓冲区消费掉了
  • 在这种情况下,接收端处理还远没有达到⾃⼰的极限,即使窗⼝再放⼤⼀些, 也能处理过来
  • 如果接收端稍微等⼀会再应答,⽐如等待200ms再应答,那么这个时候返回的窗⼝⼤⼩就是1M

主要原理是接收端接收数据的时候,应用程序也在源源不断地消费接受缓冲区内的数据。

在收到数据时,先等一小会儿,缓冲区内的数据可能就会被消费而少掉很多,此时再返回给发送端 ACK时,返回的窗口大小就大概率会比立即返回更大。

窗口越大,网络吞吐量就越大传输效率也越高。因此延迟应答在一定程度上就能提高网络传输的效率。

但难道能一直延迟下去吗?延迟的时间过久也是会导致接受缓冲区爆满,引发丢包等一系列问题的。因此TCP会对延迟时间做出一些限制

  • 数量限制:每隔N个包就应答⼀次
  • 时间限制:超过最⼤延迟时间就应答⼀次
具体的数量和超时时间,依操作系统不同也有差异。⼀般N取2,超时时间取200ms

这样就能很好地控制应答报文的返回密度,在不影响传输可靠性的条件下,尽可能提高网络传输的效率


二、捎带应答

延迟应答 的基础上,我们发现,实际网络通信中,大多数情况下都是“一问一答”的形式:

  • ack ,是系统内核返回的,在收到请求后就立即返回ack
  • 响应,是应用程序返回的,在代码中,根据请求计算得到响应,然后再返回给发送端

正常情况下,ack与响应 返回的时机不同,无法进行合并。

但别忘了,ack涉及“延时应答”机制,会ack返回时间推迟。这一推迟,ack 就有机会等到 响应 报文生成的时候了,于是就可以再发送响应的时候,捎带上ack数据。

就好比说 客⼾端 给服务器说了 "How are you",服务器也会给客⼾端回⼀个 "Fine, thank you",而这个时候ack就等了一会儿,搭上顺风车,和服务器回应的 "Fine, thank you" 一起返回给客户端

还记得之前在 TCP协议“三次握手,四次挥手” 一文中我们研究过的四次挥手吗?

当时我们介绍过,ack是系统内核返回的,fin是应用程序返回的,理论上来说这俩发送时机并不同,是无法合并的。这也是“四次挥手”说法的由来。

但是,在延时应答的机制下,ack的返回时间可能会推迟,就有可能会和 FIN 合并,一起返回了。这时,“四次挥手” 就变成 “三次挥手” 了。

 之所以ack可以和响应报文合并,是因为 ack 报文本身不需要载荷,只需在报头中将 ack字段设为“1”,接着设置好窗口大小、确认序号即可。这并不会与正常的响应报文产生冲突

 


三、面向字节流

创建⼀个TCP的socket, 同时在内核中创建⼀个 发送缓冲区 和⼀个 接收缓冲区;
  • 调⽤write时,数据会先写⼊发送缓冲区
  • 如果发送的字节数太⻓,会被拆分成多个TCP的数据包发出
  • 如果发送的字节数太短,就会先在发送缓冲区⾥等待,等到缓冲区⻓度差不多了,或者其他合适的时机发送出去
  • 接收数据的时候,数据也是从⽹卡驱动程序到达内核的接收缓冲区
  • 然后应⽤程序可以调⽤read接收缓冲区拿数据
  • 另⼀⽅⾯,TCP的⼀个连接,既有发送缓冲区,也有接收缓冲区

对于这⼀个连接,既可以读数据也可以写数据。这个概念叫做 全双⼯

由于缓冲区的存在,TCP程序的读和写不需要⼀一匹配,例如:
读写100个字节的数据时:
1、可以一次读写一个字节,分 100 次读写
2、可以一次读写十个字节,分 10 次读写
3、可以一次读写50个字节,分 2 次读写
4、可以一次读写100个字节,一次读写完
……

这样读写虽然十分自由,但也会带来一些问题。相比于面向数据报的传输方式,通过面向字节流的方式每次传输的界限没有那么分明了。容易导致粘包问题:

应用层数据包在TCP的接收缓冲区内连成一片,粘在一起

站在应⽤层的⻆度, 看到的只是⼀串连续的字节数据。当应用程序需要读取接收缓冲区内的数据时,由于TCP是面向字节流的,因此缓冲区内数据怎么读都有可能。

可能会读出 a,a,a,b,b,b,c,c,c

也可能读出 aaa,bbb,ccc

还可能读出 aaabbbccc

……

这样肯定是不利于正确读取数据包意义的。想要解决粘包问题,关键就是要明确“包之间的边界”

  • 方案一:指定分隔符

比如我们可以约定,请求响应都以 “\n” 结尾。这样在发送读取的时候都用 “\n” 作为分隔符,每当读写到 “\n” 时,就意味着一个数据包已经结束了,应用端就可以正常对这个数据包进行解析了。

不过,采用这种方案时一定要注意避免数据内容的正文中也会出现分隔符。比如采用ASCII中靠前的目前已不再使用的一些“控制字符”作为分隔符就比较合适。

常见的几种协议有xml、yml、json等,一般适用于文本类的数据的传输。

  • 方案二:指定数据的长度

比如,约定在每个应用层数据包的开头2~4个字节,表示数据包的长度

UDP协议采用的就是这种方案。因此UDP传输是不会出现粘包问题的


四、异常情况处理

现实的网络通信中,不是每一次通信都能够正常完成“四次挥手”断开连接的,可能会遇到各种各样的异常情况。

1、进程崩溃

进程崩溃,听起来很严重,实际上操作系统会做好善后。当进程崩溃时,进程中的PCB就会被回收了,PCB中的⽂件描述符中的所有文件都会被操作系统自动关闭,仍然可以发送FIN。和正常关闭没有什么区别

2、主机关机(正常关机)

正常点击关机键关机时,操作系统会先终止所有进程,同时也会触发“四次挥手”机制。而这时就可能会出现两种情况:

(1)四次挥手完成后,关机才真正完成

这种情况不会有什么问题,通信会正常断开

(2)四次挥手还没有挥完,就已经关机完毕了

这时就有可能收不到 B 发来的 FIN 请求,也就无法像其返回ack,而 B 并不知道 A 已经关机了,接收不到 ack 就会导致四次挥手迟迟不能完成,通信也就无法正常断开了。

 由于 B 接收不到 A 的ACK应答报文,等待一定时间就会触发“超时重传”机制重新发送 FIN报文。当 B 重传一定次数还没有响应时,就会主动断开连接(把保存的 A 的信息删掉了)。虽然过程有些曲折,但最终也能成功让通信断开

3、主机断电(异常关机)

(1)接收方断电

 这时 A 给 B 发送数据,就不会再返回 ACK 了。

A 就会触发超时重传,当多次重传都没有得到 ACK 时,A就会尝试重置连接(reset)。如果重置操作也没有 ACK,A 就会单方面的释放连接(把 B 的信息删掉)

(2)发送方断电

 A  发着发着没声了。在 B 的视角看来,并不确定 A 是终止了,还是说就是这段时间没有请求而已。此时,B 就会给 A 发送一个数据包,询问 A 是否还在。

如果发了探测报文后,A 返回了 ACK,就说明 A 只是暂时没有请求而已。但如果连续发了多个探测报文,A 都没有返回 ACK,就可以认为 A 是异常终止了。就会单方面释放连接。

TCP内置了⼀个保活定时器,会定时发送这样的探测报文。因为这样的报文是用来探测对方“生死”的,因此也会被称之为“心跳包”

4、网线断开

与主机断电类似。只不过是通信双方都感知不到对方的存在了。

  • A 的视角:A 收不到 ACK ,触发多次超时重传,然后尝试重置连接,最后会单方面释放连接
  • B的视角:A 忽然没有反应了。发多次心跳包也没有回应,最后也会单方面释放连接

这样,虽然过程曲折,但最后的结果还是成功让双方断开连接了。这样的处理还是能够让人接受的

总结


那么本篇文章就到此为止了,如果觉得这篇文章对你有帮助的话,可以点一下关注和点赞来支持作者哦。如果有什么讲的不对的地方欢迎在评论区指出,希望能够和你们一起进步✊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/445422.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

node.js服务器基础

node.js的事件循环 node.js是基于事件驱动的,通常在代码中注册想要等待的事件,设定好回调函数,当事件触发的时候就会调用回调函数。如果node.js没有要处理的事件了,那整个就结束了;事件里面可以继续插入事件,如果有事…

华为 静态路由和bfd 侦测的实验

实验要求 sw1 上业务地址192.168.1.1/24 SW3 业务地址192.168.2.1/24 正常情况下走主链路,不正常的情况下走备份链路 2 配置 这是基本地址配置 开启了bfd 本端地址为 10.1.1.1 对端地址是10.1.1.2 关键是discrimination 分辨参数 …

塔吊识别数据集 yolo格式 共5076张图片 已划分好训练验证 txt格式 yolo可直接使用

塔吊识别数据集 yolo格式 共5076张图片 已划分好训练验证 txt格式 yolo可直接使用。 类别:塔吊(Tower-crane) 一种 训练数据已划分,配置文件稍做路径改动即可训练。 训练集: 4724 (正面3224 负面1500) 验证集&#xf…

纠删码参数自适应匹配问题ECP-AMP实验方案(中)

6.方法设计 6.1.数据获取 为了收集不同的文件大小和纠删码参数对性能指标的影响,本文在Hadoop平台上进行了模拟实验。Hadoop是一种开源的分布式存储和计算框架,它可以支持不同类型的纠删码,并提供了一些应用程序接口和工具来测试和评估纠删…

Nginx基础详解5(nginx集群、四七层的负载均衡、Jmeter工具的使用、实验验证集群的性能与单节点的性能)

续Nginx基础详解4(location模块、nginx跨域问题的解决、nginx防盗链的设计原理及应用、nginx模块化解剖)-CSDN博客 目录 14.nginx集群(前传) 14.1如何理解单节点和集群的概念 14.2单节点和集群的比较 14.3Nginx中的负载均衡…

选GB28181还是RTSP?

好多开发者,搞不清楚什么时候用GB28181,什么时候用RTSP,本文就二者使用场景和区别,做个大概的探讨: 定义与性质: GB28181:是中国国家标准,全称为《公共安全视频监控联网系统信息传输…

AcWing 905:区间选点 ← 贪心算法

【题目来源】https://www.acwing.com/problem/content/907/【题目描述】 给定 N 个闭区间 [ai,bi],请你在数轴上选择尽量少的点,使得每个区间内至少包含一个选出的点。 输出选择的点的最小数量。 位于区间端点上的点也算作区间内。【输入格式】 第一行包…

Hopfield神经网络求解旅行商问题(Traveling Salesman Problem,TSP),提供完整MATLAB代码,复制粘贴即可运行

Hopfield神经网络是以美国物理学家约翰霍普菲尔德(John Hopfield)的名字命名的。他在1982年提出了这种类型的神经网络模型,因此通常被称为Hopfield网络。Hopfield网络是一种早期的人工神经网络,具有以下特点: 递归连接…

3、Docker搭建MQTT及Spring Boot 3.x集成MQTT

一、前言 本篇主要是围绕着两个点,1、Docker 搭建单机版本 MQTT(EMQX),2、Spring Boot 3.x 集成 MQTT(EMQX); 而且这里的 MQTT(EMQX)的搭建也只是一个简单的过程&#x…

linux 安装gitlab

安装环境 CentOS 7.7 (centos6.10会报错)2g内存防火墙关闭 安装步骤: 1 安装gitlab # yum install -y git curl policycoreutils-python openssh-server # 安装依赖 # wget https://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/yum/el7/gitlab-ce-10.2.2-ce…

欧派家居被下调盈利预测:销售费用创新高,零售经销渠道压力不小

《港湾商业观察》王璐 在房地产等多重因素冲击之下,上半年不少家居上市公司交出的业绩答卷都不尽理想,这其中也包括了消费者所熟知的“家居一哥”欧派家居(603833.SH)。 从2023年下半年开始,胡歌的代言令全民对欧派家…

鸿蒙UI系统组件16——富文本编辑器(RichEditor)

如果你也对鸿蒙开发感兴趣,加入“Harmony自习室”吧!扫描下方名片,关注公众号,公众号更新更快,同时也有更多学习资料和技术讨论群。 RichEditor是支持图文混排和文本交互式编辑的组件,通常用于响应用户的对…

【C++入门篇 - 3】:从C到C++第二篇

文章目录 从C到C第二篇new和delete命名空间命名空间的访问 cin和coutstring的基本使用 从C到C第二篇 new和delete 在C中用来向系统申请堆区的内存空间 New的作用相当于C语言中的malloc Delete的作用相当于C语言中的free 注意:在C语言中,如果内存不够…

RISC-V笔记——语法依赖

1. 前言 Memory consistency model定义了使用Shared memory(共享内存)执行多线程(Multithread)程序所允许的行为规范。RISC-V使用的内存模型是RVWMO(RISC-V Weak Memory Ordering),该模型旨在为架构师提供更高的灵活性,以构建高性能可拓展的设计&#x…

【C++栈 贪心 决策包容性】3170. 删除星号以后字典序最小的字符串|1772

本文涉及知道点 C栈 模拟 C贪心 LeetCode3170. 删除星号以后字典序最小的字符串 给你一个字符串 s 。它可能包含任意数量的 ‘’ 字符。你的任务是删除所有的 ’ 字符。 当字符串还存在至少一个 ‘’ 字符时,你可以执行以下操作: 删除最左边的 ’ 字符…

Go语言中的控制结构(四)

Go语言中的控制结构详解 控制结构是编程语言中控制代码执行流程的核心部分,Go语言通过if、for、switch等常见的控制结构,以及独有的defer、panic、recover机制,提供了强大且简洁的控制流管理。本文将详细讲解Go语言中的控制结构,包…

ASR-01和ESP32语音控制LED灯——基于VSCODE编辑器和ESP-IDF环境

一、ASR-01部分 大家不要问我软件哪里来,大家哪里买的的,就去哪里要,淘宝客服一定有,没有你就换一家。 图形化编程 原理:通过接收相匹配语音,赋值给ID,然后通过switch语句,判断ID值…

Linux内核USB3.0驱动框架分析--USB Hub代码分析

一、Linux 下USB Hub热插拔处理 1.1 Linux下USB HUB的驱动的实现和分析: USB设备是热插拔,因此在hub_probe函数中调用hub_configure函数来配置hub,在这个函数中主要是利用函数usb_alloc_urb函数来分配一个urb,利用usb_fill_int_u…

金九银十软件测试面试题(800道)

今年你的目标是拿下大厂offer?还是多少万年薪?其实这些都离不开日积月累的过程。 为此我特意整理出一份(超详细笔记/面试题)它几乎涵盖了所有的测试开发技术栈,非常珍贵,人手一份 肝完进大厂 妥妥的&#…

【Linux】操作系统基础

1.冯诺依曼体系结构介绍 冯诺依曼体系结构如下: 在上图中「输⼊设备」和「输出设备」⼀般被称为计算机的外设,⽽「存储器」在冯 诺依曼体系结构中表示「内存」 输⼊设备⼀般包括:⽹卡、磁盘、键盘、触摸屏等 输出设备⼀般包括:…