1 网络通信概述
1.1 IP 和端口
所有的数据传输,都有三个要素 :源、目的、长度。
怎么表示源或者目的呢?请看图
所以,在网络传输中需要使用“IP 和端口”来表示源或目的。
1.2 网络传输中的 2 个对象:server 和 client
我们经常访问网站,这涉及 2 个对象:网站服务器,浏览器。网站服务器平时安静地呆着,浏览器主动发起数据请求。网站服务器、浏览器可以抽象成 2 个软件的概念:server 程序、client 程序。
1.3 两种传输方式:TCP/UDP
在一般的网络书籍中,网络协议被分为 5 层,如图
应用层:它是体系结构中的最高层,直接为用户的应用进程(例如电子邮件、 文件传输和终端仿真)提供服务。在因特网中的应用层协议很多,如支持万维网应用的 HTTP 协议,支持电子邮件的 SMTP 协议,支持文件传送的 FTP 协议, DNS ,POP3, SNMP , Telnet 等等。
运输层:负责向两个主机中进程之间的通信提供服务。
运输层主要使用以下两种协议:
1. 传输控制协议 TCP(Transmission Control Protocol):面向连接的,数据传输的单位是报文段,能够提供可靠的交付。
2. 用户数据包协议 UDP(User Datagram Protocol):无连接的,数据传输的单位是用户数据报,不保证提供可靠的交付,只能提供“尽最大努力交付”。
网络层:负责将被称为数据包(datagram )的网络层分组从一台主机移动到另一台主机。
链路层:因特网的网络层通过源和目的地之间的一系列路由器路由数据报。
物理层:在物理层上所传数据的单位是比特。物理层的任务就是透明地传送比特流。
这些层对于初学者来说很难理解,我们只需要知道:我们需要使用“运输层”编写应用程序,我们的应用程序位于“应用层”。
使用“运输层”时,可以选择 TCP 协议,也可以选择 UDP 协议。
1.3.1 原理上的区别
TCP 向它的应用程序提供了面向连接的服务。这种服务有 2 个特点:可靠传输、流量控制(即发送方/ 接收方速率匹配)。它包括了应用层报文划分为短报文,并提供拥塞控制机制。
UDP 协议向它的应用程序提供无连接服务。它没有可靠性,没有流量控制,也没有拥塞控制。
1.3.2 为何存在 UDP 协议
既然 TCP 提供了可靠数据传输服务,而 UDP 不能提供,那么 TCP 是否总是首选呢?
答案是否定的,因为有许多应用更适合用 UDP ,举个例子:视频通话时,使用 UDP ,偶尔的丢包、偶尔的花屏时可以忍受的;如果使用 TCP ,每个数据包都要确保可靠传输,当它出错时就重传,这会导致后续的数据包被阻滞,视频效果反而不好。
使用 UDP 时,有如下特点:
1.关于何时发送什么数据控制的更为精细
采用 UDP 时只要应用进程将数据传递给 UDP,UDP 就会立即将其传递给网络层。而 TCP 有重传机制,而不管可靠交付需要多长时间。但是实时应用通常不希望过分的延迟报文段的传送,且能容忍一部分数据丢失。
2.无需建立连接,不会引入建立连接时的延迟。
3.无连接状态,能支持更多的活跃客户。
4.分组首部开销较小。
1.3.3 TCP/UDP 网络通信大概交互图
下面我们分别画出运用 TCP 协议和运用 UDP 协议的客户端和服务器大概交互图。
面向连接的 TCP 流模式:
UDP 用户数据包模式:
2 网络编程主要函数介绍
2.1 socket 函数
int socket(int domain, int type,int protocol);
此函数用于创建一个套接字。
- domain 是网络程序所在的主机采用的通讯协族(AF_UNIX 和 AF_INET 等)。
◼ AF_UNIX 只能够用于单一的 Unix 系统进程间通信,而 AF_INET 是针对 Internet 的,因而可以允许远程通信使用。
- type 是网络程序所采用的通讯协议(SOCK_STREAM,SOCK_DGRAM 等)。
◼ SOCK_STREAM 表明用的是 TCP 协议,这样会提供按顺序的,可靠,双向,面向连接的比特流。
◼ SOCK_DGRAM 表明用的是 UDP 协议,这样只会提不可靠,无连接的通信。
- 关于 protocol,由于指定了 type,所以这个地方一般只要用 0 来代替就可以了。
此函数执行成功时返回文件描述符,失败时返回-1, 看 errno 可知道出错的详细情况。
2.2 bind 函数
int bind(int sockfd, struct sockaddr *my_addr, int addrlen);
从函数用于将地址绑定到一个套接字。
⚫ sockfd 是由 socket 函数调用返回的文件描述符。
⚫ my_addr 是一个指向 sockaddr 的指针。
⚫ addrlen 是 sockaddr 结构的长度。
sockaddr 的定义:
struct sockaddr{unisgned short as_family;char sa_data[14];
};
不 过 由 于 系 统 的 兼 容 性 , 我 们 一 般 使 用 另 外 一 个 结 构 (struct sockaddr_in) 来代替。
sockaddr_in 的定义:
struct sockaddr_in{unsigned short sin_family;unsigned short sin_port;struct in_addr sin_addr;unsigned char sin_zero[8];
}
如果使用 Internet 所以 sin_family 一般为 AF_INET 。
⚫ sin_addr 设置为 INADDR_ANY 表示可以和任何的主机通信。
⚫ sin_port 是要监听的端口号。
⚫ bind 将本地的端口同 socket 返回的文件描述符捆绑在一起 . 成功是返回 0, 失败的情况和 socket 一样。