【Linux网络编程】UDP协议

UDP协议

  • 1.再谈端口号
    • 端口号划分
    • 认识知名端口号(Well-Know Port Number)
    • 两个问题
    • netstat
    • pidof
  • 2.UDP协议
    • 2.1UDP的特点
    • 2.2面向数据报
    • 2.3UDP的缓冲区
    • 2.4UDP使用注意事项
    • 2.5基于UDP的应用层协议

在这里插入图片描述

喜欢的点赞,收藏,关注一下把!在这里插入图片描述

1.再谈端口号

端口号(Port)标识了一个主机上进行通信的不同的应用程序。

因为不同应用程序端口号不同,尽管被部署在同一台主机上IP地址相同,但是端口号不同各自运行各自的,所以一台主机可以同时部署不同端口号不同的服务。
在这里插入图片描述
在TCP/IP协议中,用 “源IP”,“源端口号”,“目的IP”, “目的端口号”, “协议号” 这样一个五元组来标识一个通信(可以通过netstat -n查看);

这里协议号就相当于具体一个协议的名称,也就是标识客户端和服务器用什么协在通信。其实目的端口号就已经确定了用那个协议,如:22 ssh协议。

在这里插入图片描述

实际上不管是用同一个客户端上不同的请求或者不同的客户端去请求同一个服务器,都能够准确区分清楚这个请求时从哪来的。全都是得益于完整的报文。

TCP解决通信双方端口问题,IP解决通信双方IP地址问题,所以TCP/IP解决网络通信的问题。

应用层帮我们解决应用的问题,但是要解决应用问题之前要先解决通信的问题,要解决通信的问题要先通过五元组标识一段通信。五元组被分散在TCP/IP协议各自中处理的。

端口号划分

  • 0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的.
  • 1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的.

认识知名端口号(Well-Know Port Number)

有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:

  • ssh服务器, 使用22端口
  • ftp服务器, 使用21端口
  • telnet服务器, 使用23端口
  • http服务器, 使用80端口
  • https服务器, 使用443

执行下面的命令, 可以看到知名端口号

cat /etc/services

我们自己写一个程序使用端口号时, 要避开这些知名端口号

两个问题

  1. 一个进程是否可以bind多个端口号?
  2. 一个端口号是否可以被多个进程bind?

数据一定是自底向上交付的,一定是从端口号唯一交付给进程,所以我们要保持从端口号到进程的唯一关系。因此2错。

一个进程绑定多个端口号并不破坏端口号到进程的唯一性,从任何端口号到进程都是唯一的,如一个进程绑定两个端口号一个端口号用来发数据,一个端口号用来发指令,因此1对。

netstat

netstat是一个用来查看网络状态的重要工具.
语法:netstat [选项]
功能:查看网络状态

常用选项

  • n 拒绝显示别名,能显示数字的全部转化成数字
  • l 仅列出有在 Listen (监听) 的服務状态
  • p 显示建立相关链接的进程名
  • t (tcp)仅显示tcp相关选项
  • u (udp)仅显示udp相关选项
  • a (all)显示所有选项,默认不显示LISTEN相关

pidof

在查看服务器的进程id时非常方便.

语法:pidof [进程名]
功能:通过进程名, 查看进程id

在这里插入图片描述

xargs

把管道上一个进程输入的管道的内容,以命令行参数的方式拼接在后接命令的后面

在这里插入图片描述

2.UDP协议

不管我们未来学习什么协议都要带着这两个问题去学习

  1. 学习所有的协议,都有它的报头和有效载荷
  2. 如何解包(如何将报头和有效载荷进行分离),如何分用

UDP协议端格式

下面看到的就是UDP报文,报文里面有个数据,该数据就是我们从应用层交付给UDP的所有数据就称之为整个报文的有效载荷,有效载荷上面的就是UDP报头。
在这里插入图片描述

为什么我们在应用层编写代码的时候,每一次写端口号的时候,都是uint16_t呢?
因为现在所学到的传输层和网络层属于Linux操作系统内部,OS内部源端口和目的端口用的是16位的,决定了应用层的端口是16位。

校验和我们不谈,先对原始数据做校验,校验之后把值填进行,然后把数据发给对方之后,对方以同样的方式对整个报文做校验,如果校验值匹配说明报文没有发生问题。不匹配就直接丢弃。

下面具体来看UDP报文是如何封装解包、如何分用

这是我们任何地方都会告诉我们的UDP报文结构,上面4个部分加起来8个字节就是报头,下面是有效载荷,就这么简单。那是如何做到将报头和有效载荷封装和分离的呢?

在这里插入图片描述

根据之前我们学到的知识,要么规定特殊符号\r\n来表示报头和有效载荷,要么使用自描述字段,比如说之前自定义协议里的报文前面带上长度。http是用Content-Length的方案表征有效载荷的长度。

那UDP这里是怎么表征字节对应的报文,将报头和有效载荷封装和解包的呢?

UDP采用固定长度的报头,将报头和有效载荷分开。也就是说未来UDP报头向上交付的时候,传输层会固定的把前8字节报头直接移走,将剩下的有效载荷直接向上交付就行了。

如何分用呢? 因为应用层有很多协议,如http、https,所以传输层怎么知道将有效载荷交给上层哪一个协议呢?

我们有16位目的端口号,在应用层特定的进程绑定了特定的端口号,根据目的端口号交给特定的进程。

这上面的内容其实我们都知道,但是我们不了解的其实不是这个,而是你这报头到底是个什么东西?理解UDP报头

在这里插入图片描述
首先传输层网络层都属于Linux内核,而Linux内核是用C语言写的!
前面8个字节是UDP的报头,所谓的报头不就是OS层面定制的协议吗
我们以前在应用层不是定义过协议吗,不就是相当于在应用层的结构化数据吗,说白了不就是一个类或结构体吗?
所以所谓的报头其实就是一种结构化数据对象

一般在定协议的时候采用的是结构体或者位端的方式。

所谓报头定的协议就是下面这个玩意
在这里插入图片描述

所谓的添加报头,当程序员在应用层调用sendto发送数据,这个sendto其实并没有把数据直接发送到网络里,而是把数据拷贝UDP这个协议中。

在拷贝之前先做这样一个事情,我们以伪代码方式看一下这个过程,首先UDP有hdr所指向的一段空间,然后start指向hdr加一个UDP报头协议大小的地方,然后把数据拷贝到start所指向的空间,然后在UDP报头里填写对应的信息。

1.这不是把我们的有效载荷放在后面
2.我们不就把报头填写好了吗

至此不就形成了一个完整的UDP报头吗!然后继续向下进行交付!

在这里插入图片描述
未来收到UDP报文不是固定大小吗,收到报文之后指针指向开始,将指针强转成struct udp_hdr类型,前8个字节里面每一个字节不就可以直接取码吗,取完之后指针+8,不就可以拿有效载荷了吗。

在看到UDP报文这张图,脑海中要立即想到协议就是一个结构化的数据,在内核中这个协议一定有具体的实现方式,结构化或者位端。最后添加报头就是把数据放在缓冲区里然后在缓冲区前面把报头相关字段拿过来,这个报文就构建好了,继续向下交付就好了!

在这里插入图片描述

未来我们学习到所有协议,管你是什么报头,只要你是OS里的,它的所有字段划分最终都是转为某种结构体或者位端。
在这里插入图片描述
到这里UDP报头就学完了。因为UDP不提供任何可靠性,所有注定它不用为了可靠性做更多的工作。也就意味着它很简单不复杂。

2.1UDP的特点

UDP传输的过程类似于寄信

  • 无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接
  • 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息(也就是说丢包了UDP说明也不做)
  • 面向数据报: 不能够灵活的控制读写数据的次数和数量

2.2面向数据报

面向数据报可以理解成面向快递,你的朋友给你寄了一个、两个、三个快递,未来你在收的一定是一个、两个、三个快递。你朋友发了三个快递你一定是收三个快递,不会收半个、一个半、两个等,他发几个你就收几个。客户端曾经发了一个报文,你在调用recvfrom成功的时候,这个函数必定把一个完整的报文全部读上来。这叫做UDP数据报。

其一,在写udp的代码时明显可以感觉到不像写tcp网页版计数器哪里首先必须要先读到一个完整的报文,在udp哪里从来没有说过这样的话,因为用udp直接可以保证读到一个完整报文。
其二,对方调sendto发送10次报文,对方必须调用recvfrom接收10次报文,次数是1:1的。

这就是面向数据报,使用UDP协议我们不用考虑在应用层enlength增加报头,delength删除报头,用来区分数据,只用考虑序列化和反序列化就可以了。

光谈udp不太清楚,这里简单说一下tcp,它是面向字节流,特点是发数据可以发十几二十次,但接收方并不知道你曾经发了多少次,它也不知道报文和报文之间有什么边界,它只是由上层告诉我去读多少,至于怎么读到一个完整的报文是由应用层自己去定协议自己去从字节流中提取一个完整报文。所有就有写tcp要自己定制报头,然后把有效载荷提取出来,序列化。。。,这都是因为它没有报文和报文之间的边界。

应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并;

用UDP传输100个字节的数据:

  • 如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节

2.3UDP的缓冲区

我们目前已经知道,在应用层调用的read/write/sendto/recvfrom/send/recv,并没有把数据之间发到网络中也没有能力做到这个事情,而是通过这些接口把数据交给下层然后继续往下交付,每一层都有自己的协议,所有每一层都要添加对应的报头。

在这里插入图片描述

知道这个我们以TCP缓冲区为切入点谈谈UDP缓冲区的问题。

实际上我们用的网络IO接口,其实并不直接是发送和接收窗口,可是拷贝窗口!

客户端和服务器用tcp协议通信,实际上在各自的传输层里面要给自己维护发送和接收缓冲区,比如用的send/write接口,实际上并不是把我们自己在应用层定义的缓冲区里数据发送到网络里,而是拷贝到自己的发送缓冲区,传输层属于OS,所有是由OS自己控制把发送缓冲区的数据,什么时候发,发多少,从我的发送缓冲区把数据经过网络发送到对方的接收缓冲区。然后对方recv/read读取也不是从网络里把数据读取上来,而把你发过来的数据从接收缓冲区拷贝到应用层定义的缓冲区(如自己写的outbuffer),

在这里插入图片描述

所以曾经调用的read/write/sendto/recvfrom/send/recv这些接口本质是拷贝函数!

client->server:用的是c发送缓冲区、s接收缓冲区。
那同时server->client,用的s发送缓冲区,c接收缓冲区。
因为发送缓冲区,接收缓冲区我们双方都各有一对,所以我们称这样的通信方式叫做全双工(我在给你发消息的时候,你也可以给我发)。

当把这些数据拷贝到缓冲区里,应用层就直接返回了。所以这个缓冲区除了支持全双工站在应用层角度上看还帮我们提供发送数据的效率。然后应用层继续执行其他逻辑不用等了。这个缓冲区数据什么时候发送,发多少,丢包怎么办等由OS也就是传输层中TCP协议自主控制,所以TCP协议全称叫做传输控制协议。而用户不参与,只要把数据从应用层拷贝到OS内部就可以了。

有人往里面放数据,有人把数据从缓冲区里刷新到网络里,这个模式不就与生产消费者模式相似吗!天然就具备生产端和消费端解耦支持忙闲不均。 不就是在正常发送时让应用层在用拷贝行为替代发送行为减少了client时间成本问题。

什么是以TCP来讲的,那UDP呢?

  • UDP没有真正意义上的 发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作;
    UDP没有真正意义上的 发送缓冲区,这是因为它不需要,因为UDP把报头一加直接交给下层,它没有可靠性机制,也不需要把数据暂存下来。

  • UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报文的顺序和发送UDP报文的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃;

UDP的socket既能读, 也能写, 这个概念叫做 全双工

2.4UDP使用注意事项

我们注意到, UDP协议首部中有一个16位的最大长度. 说的是一个UDP能传输的最大报文长度是2^16 --> 2^10 * 2^6=64K(包括UDP首部)
在这里插入图片描述

然而64K在当今的互联网环境下, 是一个非常小的数字.
如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;

2.5基于UDP的应用层协议

  • NFS: 网络文件系统
  • TFTP: 简单文件传输协议
  • DHCP: 动态主机配置协议
  • BOOTP: 启动协议(用于无盘设备启动)
  • DNS: 域名解析协议

当然, 也包括你自己写UDP程序时自定义的应用层协议;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/309625.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

神经网络模型底层原理与实现8-BERT

首先介绍什么是自监督学习: 普通的有监督学习是每个x对应有个y,x训练得到y,将y与y作比较,而自监督是没有对应y,直接把一部分样本x作为训练目标x,训练得x后和x对比 bert中如何创造x:以文字处理为…

Python爬虫-京东商品评论数据

前言 本文是该专栏的第68篇,后面会持续分享python爬虫干货知识,记得关注。 在本专栏之前,笔者有详细介绍京东滑块验证码的解决方法,感兴趣的同学,可以直接翻阅文章《Python如何解决“京东滑块验证码”(5)》进行查看。 而本文,笔者以京东商品详情页的评论数据为例,通过…

SpringBoot - Logback 打印第三方 Jar 日志解决方案

问题描述 最近碰到一个很苦恼的问题&#xff0c;就是第三方的 Jar 在自己项目里日志可以正常输出&#xff0c;但是一旦被引用到其他项目里&#xff0c;就日志死活打不出来…… 解决方案 这是原来的配置 - logback.xml <?xml version"1.0" encoding"UTF-8…

怎么看电脑显卡?跟着这篇文章轻松掌握

电脑显卡是决定图形性能的关键硬件之一&#xff0c;对于电脑的图形处理和游戏性能有着重要的影响。了解自己电脑的显卡型号和性能可以帮助用户更好地了解自己电脑的性能状况&#xff0c;以及是否需要升级显卡以提升性能。本文将介绍怎么看电脑显卡的三种方法&#xff0c;帮助用…

JVM—jps、jstat、jinfo、jmap、jstack的使用

JVM—jps、jstat、jinfo、jmap、jstack的使用 jps jps全称&#xff1a;Java Virtual Machine Process Status Tool 可以查看Java进程&#xff0c;相当于Linux下的ps命令&#xff0c;只不过它只列出Java进程。 jps:列出Jav程序ID和Main函数名称 jps -q:只输出进程ID jps -m …

rabbitmq安装erlang环境后没生效

引言 安装erlang环境后输入erl提示无效 首先&#xff0c;确定 Erlang 的可执行文件位于什么位置。默认情况下&#xff0c;它们通常位于 /usr/local/bin 或 /usr/bin 目录中。您可以使用 find 命令来查找 erl 可执行文件 的位置&#xff0c;例如&#xff1a; find /usr -name er…

技术周刊的转变:如何平衡热爱与现实?

大家好&#xff0c;我是那个自己打脸自己的猫哥&#xff0c;本来说周刊不做订阅制的&#xff0c;现在却推出了订阅专栏。今天想为自己辩护一下&#xff0c;同时聊聊技术周刊今后的发展计划。 首先回顾一下我过去的想法吧&#xff0c;然后再解释为什么会突然出现转变。 出于对…

【Docker】docker原理及使用-1

Docker目录 1️⃣概念2️⃣使用容器的好处2️⃣docker和普通软件启动方式的区别2️⃣docker和传统虚拟机的区别 1️⃣下载安装2️⃣安装步骤 1️⃣必须要掌握的核心概念1️⃣命令2️⃣例子2️⃣练习题目2️⃣进入一下python环境(简洁) 1️⃣解释一下 redis1️⃣docker底层隔离机…

亚马逊CloudFront使用体验

前言 首先在体验CloudFront之前&#xff0c;先介绍一下什么是CDN&#xff0c;以及CDN的基本原理。 CDN是Content Delivery Network&#xff08;内容分发网络&#xff09;的缩写&#xff0c;是一种利用分布式节点技术&#xff0c;在全球部署服务器&#xff0c;即时地将网站、应…

PotPlayer 图像截取

PotPlayer 图像截取 1. PotPlayer2. PotPlayer 下载2.1. PotPlayer 240305 3. 图像截取References 1. PotPlayer http://www.potplayercn.com/ PotPlayer 是 KMPlayer 原作者姜勇囍进入新公司 Daum 之后推出的&#xff0c;继承了 KMPlayer 所有的优点&#xff0c;拥有异常强大…

得帆用户有福了!全新社区论坛携手AI助手华丽上线,积分好礼等你拿!

盼望着&#xff0c;盼望着&#xff0c;春天的脚步近了&#xff0c;得帆云社区迎来全新升级&#xff0c;社区论坛携手AI知识库助手上线了&#xff01; 得帆云官方社区论坛&#xff1a; https://edu.definesys.cn/community/community-forum 您也可以点击本文末尾左下方“阅读…

postman接口测试(入门到精通)

下载&#xff1a; postman官方地址 测试外部接口&#xff1a;测试被测系统和外部系统之间的接口。&#xff08;只需要测试正例即可&#xff09; 测试内部接口&#xff1a; 1.内部接口只提供给内部系统使用。&#xff08;只需要测试正例即可&#xff09; 2.内部接口提供给外…

Java8中JUC包同步工具类深度解析(Semaphore,CountDownLatch,CyclicBarrier,Phaser)

个人主页&#xff1a; 进朱者赤 阿里非典型程序员一枚 &#xff0c;记录平平无奇程序员在大厂的打怪升级之路。 一起学习Java、大数据、数据结构算法&#xff08;公众号同名&#xff09; 引言 在Java中&#xff0c;并发编程一直是一个重要的领域&#xff0c;而JDK 8中的java.u…

Python数据分析案例42——基于Attention-BiGRU的时间序列数据预测

承接上一篇的学术缝合&#xff0c;排列组合模型&#xff0c;本次继续缝合模型演示。 Python数据分析案例41——基于CNN-BiLSTM的沪深300收盘价预测-CSDN博客 案例背景 虽然我自己基于各种循环神经网络做时间序列的预测已经做烂了.....但是还是会有很多刚读研究生或者是别的领…

【C++】C++11 lambda表达式

&#x1f440;樊梓慕&#xff1a;个人主页 &#x1f3a5;个人专栏&#xff1a;《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》《算法》 &#x1f31d;每一个不曾起舞的日子&#xff0c;都是对生命的辜负 目录 前言 C11引入『 lambda表…

如何发布自己的Python库?

Python包发布 1、背景概述2、操作指南 1、背景概述 为什么我们要发布自己的Python库&#xff1f;如果你想让你的Python代码&#xff0c;通过pip install xxx的方式供所有人下载&#xff0c;那就需要将代码上传到PyPi上&#xff0c;这样才能让所有人使用 那么&#xff0c;如何发…

守护你的网络,防御ddos攻击的必备技能

随着互联网的普及&#xff0c;网络安全问题越来越受到人们的关注。在各种网络攻击中&#xff0c;DDoS 攻击是一种最常见的攻击方式&#xff0c;它能够使网站或网络服务站点瘫痪&#xff0c;给用户带来极大的困扰&#xff0c;给企业带来财务损失。 DDoS 是什么&#xff1f; DDoS…

第⑭讲:Ceph集群管理:守护进程管理、日志管理和端口号配置

文章目录 1.Ceph各组件守护进程的管理方式2.守护进程管理操作2.1.Ceph所有组件的守护进程列表2.2.重启当前主机中所有的Ceph组件2.3.重启主机中所有的Monitor组件2.4.重启指定主机的Monitor组件2.5.重启指定的OSD组件 3.Ceph的日志管理4.Ceph集群各组件的守护进程5.Ceph集群各组…

位像素海外仓管理系统对接ERP系统教程,一对一教学

在海外仓管理过程中&#xff0c;对接ERP系统的重要性不言而喻的。这种对接不仅能让数据实时共享&#xff0c;还能让海外仓管理者优化整个供应链管理流程。 因此&#xff0c;今天小编就来教大家&#xff0c;海外仓仓库系统是怎么对接ERP物流系统的&#xff1f; 1.分析需求 在对接…

【算法】字符串

个人主页 &#xff1a; zxctscl 如有转载请先通知 题目 1. 14. 最长公共前缀1.1 分析1.2 代码 2. 5. 最长回文子串2.1 分析2.2 代码 3. 67. 二进制求和3.1 分析3.2 代码 4. 43. 字符串相乘4.1 分析4.2 代码 1. 14. 最长公共前缀 1.1 分析 从第一个字符串开始两两比较&#xff…