思维导图:
5.5 TCP报文段的首部格式
基本概念
- TCP报文段:包含首部和数据两部分,首部至少20字节。
- 作用:首部字段定义了TCP的功能和行为。
- 长度:首部长度可变,基础首部20字节,可添加选项。
首部字段解析
固定首部字段(20字节)
-
源端口和目的端口(各2字节)
- 作用:标识发送和接收应用的端口,用于数据分用。
-
序号(4字节)
- 作用:标记数据字节流中每个字节的位置。
- 重点:循环利用,达到2³²-1后回到0。
-
确认号(4字节)
- 作用:接收方期望的下一个数据字节的序号。
- 注意:如果确认号是N,表示到序号N-1的所有数据已被正确接收。
-
数据偏移(4位)
- 作用:标识数据部分的开始位置,实际上是首部长度。
- 单位:32位字,最大值15,表示最长首部长度为60字节。
-
保留(6位)
- 当前未使用,必须置为0。
控制位(标志位)
-
URG(紧急指针标志)
- 当URG=1,表明紧急指针字段有效,需要优先处理。
-
ACK(确认标志)
- 当ACK=1,确认号字段有效。
- 连接建立后,所有传送的报文段ACK必须置为1。
其他首部字段
- 窗口:流量控制相关,指定可接收的数据量。
- 检验和:错误检测,保证数据传输的正确性。
- 紧急指针:与URG标志搭配,指示紧急数据的结束位置。
可变长度选项
- 额外的功能性定义。
- 长度可变,最大不能超过40字节。
笔记要点
- 理解每个字段的功能是理解TCP行为的关键。
- 画图有助于理解首部结构和字段之间的关系。
- 关注控制位,它们影响TCP连接的行为和状态。
- 实践例题以加深对首部字段运作的理解。
我的理解:
-
源端口和目的端口:
- 类比:就像邮件的发件人和收件人地址,它们告诉网络这个数据包应该从哪里来到哪里去。
- 重点:端口号用于识别主机上的不同应用程序。
-
序号(Sequence Number):
- 类比:想象你发送了一系列相关的邮件,每封邮件都编号以确保收件人按正确顺序阅读它们。TCP的序号字段类似于邮件的编号。
- 重点:序号用于保证数据传输的顺序性和完整性,以及基于字节流的传输。
-
确认号(Acknowledgment Number):
- 类比:如果你接收一套多本的书籍,你会确认收到的最后一本书籍的编号,并告诉发件人你下次期待的是下一本编号的书籍。确认号类似于这个过程。
- 重点:确认号用来告诉发送方哪些数据已经被成功接收,并期望下一个字节的序号。
-
数据偏移(Data Offset):
- 类比:在一次会议中,有人会告诉你报告的正文在哪一页开始,这样你就不用浏览整个文件来找正文。数据偏移告诉接收方数据从哪里开始。
- 重点:数据偏移是首部长度的指示器,用于确定数据部分的起点。
-
保留位:
- 类比:在一个设计图纸上保留的空白区域,可能将来会用于添加额外的设计元素。在TCP头部,保留位是为未来可能的需求预留的。
- 重点:目前这些位必须设置为0,未来可能有用途。
-
控制位(例如URG, ACK等):
- 类比:这就像你手机上的设置选项,可以开启飞行模式、蓝牙等功能。每个控制位可以开启或关闭特定的TCP功能。
- 重点:控制位用于管理不同的TCP控制信息,如设置紧急数据(URG),确认收到数据(ACK)等。
理解TCP/IP协议中的各种标志和选项可能一开始会显得有些复杂
8. 推送PSH (Push)
- 定义: TCP的推送操作用于要求数据立即发送,而非等缓冲区满。
- 使用场景: 交互式通信,如命令行操作,要求立即反馈。
- 操作: 发送方TCP设置PSH位为1,并发送数据;接收方收到后立即处理数据。
- 注意: 即便可用,实际应用中并不常见。
9. 复位RST (Reset)
- 定义: 指示TCP连接中出现严重错误,必须立即释放连接。
- 使用场景: 响应非法报文段或拒绝连接请求。
- 功能: 也被称为“重置位”,用于快速断开连接。
10. 同步SYN (Synchronization)
- 定义: 在TCP连接建立时用于序号同步。
- 操作: SYN=1且ACK=0表示连接请求;响应方设置SYN=1和ACK=1表示同意。
- 关键点: 是建立连接过程的一部分,5.9节将详细讨论。
11. 终止FIN (Finish)
- 定义: 用于关闭TCP连接。
- 操作: FIN=1表示发送方数据发送完毕,请求关闭连接。
12. 窗口 (Window)
- 定义: 窗口大小指明接收方当前允许发送方发送的数据量。
- 功能: 窗口大小是动态变化的,防止接收方缓冲区溢出。
13. 检验和 (Checksum)
- 定义: 覆盖TCP首部和数据部分的错误检测码。
- 操作: 发送前计算,接收时验证,使用伪首部增强准确性。
14. 紧急指针 (Urgent Pointer)
- 定义: 仅当URG=1时有效,指示紧急数据的终止位置。
- 功能: 允许接收方处理紧急数据。
15. 选项 (Options)
- 定义: 可变长字段,用于扩展TCP功能,如设置最大报文段长度MSS。
- MSS: 定义了TCP报文段中数据部分的最大长度。
- 窗口扩大: 允许窗口字段超过原始的16位限制,以支持更大的窗口大小。
- 时间戳: 用于计算往返时间RTT和避免序号重复。
通过上面的笔记,我们可以看到TCP协议是一个非常复杂的协议,提供了可靠的、面向连接的服务。它使用序号和确认来确保数据的有序传输,并且通过窗口控制和其他机制提供流量控制和拥塞控制。每个标志和选项都有特定的用途,而理解每个部分的作用对于深入理解TCP的工作原理至关重要。
我的理解:
(8) 推送PSH (PuSH): 想象一下,你在餐厅点餐。通常,服务员会等你的菜都准备好了再统一端给你。但是如果你特别饿,你可能会要求“我点的汤一好就先给我”,服务员这时就会立即把汤端给你,而不是等所有菜都准备好。这个“先给我汤”的请求就像是PSH标志,它告诉服务员(在这里指的是TCP协议栈),不要等缓冲区满了再送数据,而是有数据就立即传输。
(9) 复位RST (ReSeT): 如果你和朋友在手机上通话,但是你突然意识到你拨错了一个不认识的人,你可能会立即挂断电话并重新拨号。在TCP连接中,如果一个设备发现它收到了不应该接收的连接请求,或者发现一个严重的错误,它会发送一个RST标志,就像是立即挂断电话一样,这个标志意味着“这个连接有误,我们得停止并重置”。
(10) 同步SYN (SYNchronization): 当两个人开始一场对话,他们通常会用“嗨”或“你好”来开场,以确保对方已经准备好交谈。在TCP中,SYN标志用于启动一个新的连接。当一台计算机想要开始和另一台计算机通信时,它会发送一个带有SYN标志的报文,好像在说“嘿,我们可以开始交谈了吗?”
(11) 终止FIN (FINis): 如果你在聚会上,到了晚上你准备离开时,你会向大家告别。在TCP连接结束时,一个设备会发送一个带有FIN标志的报文,这表示“我已经完成了发送所有我需要发送的数据,我准备结束这次会话了”。
(12) 窗口: 想象你在搬砖头,但你的搬运车每次只能装载一定数量的砖头。这里的车子就像TCP连接中的“窗口”,它定义了在需要发送确认之前可以发送多少数据。这确保了发送方不会因为接收方处理不过来而发送太多数据。
(13) 检验和: 当你收到一封重要信件时,你可能会检查信封上的邮戳和地址,以确保它没有被错误地发送或者在途中被损坏。同样,在TCP中,检验和用于验证收到的数据包是否在传输过程中出现了错误或损坏。
(14) 紧急指针: 如果你在一个会议中,有一件非常紧急的事情需要立即讨论,你可能会打断正在进行的讨论,说“抱歉打断一下,我们有一个紧急问题要处理”。在TCP中,紧急指针配合URG标志使用,它告诉接收方有紧急数据需要被优先处理。
(15) 选项: 假设你在装修房子时,可以选择各种额外的定制选项,比如颜色、装饰材料或者家电品牌。在TCP中,选项字段就像是这些额外的定制选项,它们提供了额外的功能和协议的灵活性,例如指定最大报文段大小或者用时间戳来记录发送和接收时间等。
总结:
重点:
- 首部长度:表示TCP首部的长度,这是因为TCP首部的长度是可变的,有时会包括选项字段。
- 序列号:用于确保数据的有序传输,以及重发丢失的数据包。
- 确认号:作为对收到的数据包的回应,表明接收方期望收到发送方的下一个序列号。
- 控制位:包括SYN、ACK、FIN、RST、PSH和URG,用于建立连接,数据传输的确认,终止连接,紧急数据处理等。
- 窗口大小:用于流量控制,指明了接收方能够接收的数据量。
- 校验和:用于检测数据在传输过程中的任何改变,保证数据完整性。
难点:
- 选项字段:由于可变长,处理TCP选项字段通常比较复杂,特别是如何在不同的实现中正确解析和使用这些选项。
- 流量控制与拥塞控制机制:理解窗口大小如何变化以及这如何影响TCP的性能可以是非常复杂的,它涉及到细微的调整和多个算法(如慢启动,拥塞避免等)。
易错点:
- 首部长度字段误解:首部长度字段是4位的,表示的是32位字的数量,而不是字节的数量,有时候容易忘记这一转换。
- 序列号和确认号混淆:容易混淆这两个字段的作用,尤其是在一个方向上的数据传输结束后,如何处理序列号和确认号。
- 紧急指针的误用:通常不常用,但是在需要的时候,正确地设置URG控制位和紧急指针字段是很重要的,错误地使用它们可能会导致通信双方处理紧急数据的方式不一致。
- 控制位组合的混乱:在不同的TCP状态下,哪些控制位可以一起使用,哪些不可以,尤其是在连接建立和释放阶段。
- 校验和的计算:校验和的计算包括首部和数据部分,有时在手动计算或者理解的时候容易出错。
掌握TCP报文段的首部格式对于深入理解网络协议栈中的数据流和各种网络问题的排查都是至关重要的。在实践中,经常通过网络工具和抓包软件来分析TCP报文段的细节,这有助于理解理论知识如何应用于实际网络通信中。