网络——套接字编程UDP

端口号

源端口号和目的端口号

认识TCP协议和UDP协议

网络字节序

socket编程接口

socket常见接口

sockaddr结构

UDP

socket

bind

recvfrom

sendto

编写客户端

绑定INADDR_ANY

实现聊天功能

端口号

在这之前我们已经说过源IP地址和目的IP地址，还有源MAC地址和目的MAC地址。接下来我们再来谈一谈什么是端口号。

源端口号和目的端口号

首先我们要知道的是IP地址标定了主机的唯一性，当我们在打游戏或者刷视频的时候，一定是通过手机或者电脑，里面一定会有对应的App，这叫做客户端软件，运行起来后就是客户端进程，我们通过请求服务端进程来执行某种功能，通过TCP/IP协议把数据送到对方的主机，但是这不是真正的网络通信的过程，它本质上是在进行进程间通信，将数据在主机间转发只是过程，所以机器收到后需要将数据交付给指定的进程。

端口号（port）就是标识特定主机上进程的唯一性，他是一个2字节16位的整数。但是之前我们说过，进程pid也是标识进程的唯一性，那么为什么不用pid代替端口号呢？原因是，进程是进程，端口号是端口号，这两个概念本来就没有什么关系，我们不希望让两个没有关系的概念揉在一起。

所以在网络上两台主机要进行通信就要有源IP地址和源端口号，还要有目的IP和目的端口号，通过IP地址和端口号就可以标识网络中唯一一个进程，我们把他们就叫做套接字。

认识TCP协议和UDP协议

在应用层下就是传输层，传输层使用的是由操作系统提供的系统调用接口，而传输层最典型的两种协议就是TCP和UDP协议。

UDP协议：

UDP协议叫做用户数据报协议（User Datagram Pool），它无需建立连接，而且不可靠，面向数据报的传输层协议，可能会出现丢包、数据包乱序的问题。

TCP协议：

TCP协议叫做传输控制协议（Transmission Control Protocol），它是一种可连接、可靠的、面向字节流的传输层通信协议。

看着UDP是不是没有TCP可靠，但是在现在的主流网络丢包的问题概率并不大，有些是可以容忍的。可不可靠只是他们两个的一个特点，不可靠不会为了让网络通信变得可靠而做过多的工作，可靠性是需要大量的编码和数据处理的，TCP为了保证可靠性一定要设计更多的策略，这些都要用户自己去完成，虽然保证了可靠性，但是它就会更复杂，维护成本也更高。

网络字节序

在计算机中是有大小端的概念的，大端就是高字节内容放在低地址处，低字节内容放在高地址处；小端就是高字节内容放在高地址处，低字节内容放在低地址处。

如果编写的程序在本地上是不需要考虑这些问题的，如果是网络通信，就不确定对方的主机是哪种存储方式。

由于我们不能保证通信双方存储数据的方式是一样的，所以就规定网络当中传输的数据必须采用大端字节序，无论是大端机还是小端机，都必须转换成大端。

所以小端机器发送时要将数据转换成大端，接受数据时再把数据转换成小端。大端机器就不需要考虑这些。

为了解决这个问题，也有了这些接口：

h代表host，主机的意思
n代表network，网络的意思
l 代表long，32位的意思
s代表short，16位的意思

所以上面这些接口无非就是主机转网络，或者是网络转主机。

socket编程接口

socket常见接口

// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address, socklen_t address_len);// 开始监听socket (TCP, 服务器)
int listen(int socket, int backlog);// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address, socklen_t* address_len);// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

sockaddr结构

套接字不仅支持网络的进程间通信，还支持本地的进程间通信（域间套接字）。在进行网络通信时我们需要传递IP地址和端口号，而本地通信则不需要，因此套接字提供了sockaddr_in结构体和sockaddr_un结构体，其中sockaddr_in结构体是用于跨网络通信的，而sockaddr_un结构体是用于本地通信的。

因为设计师不想设计不同的结构对应不同的通信方式，于是就出现了sockaddr结构体，他们三个虽然结构不同，但是三个结构体前16位比特位都是一样的，这叫做套接字的域或者叫协议家族，之后我们也是要填充这个字段的。

在传参时统一传的都是sockaddr结构体。通过前16个比特位确定通信方式，

UDP

作为一个服务器，那就一定要有服务端和用户端，我们就先来写一下服务端。

socket

要进程网络通信，第一步就要创建socket套接字。

参数：

domain：创建套接字的域或者叫协议家族，网络通信就设置为AF_INET（IPV6折纸为AF_INET6），本地通信就设置为AF_UNIX，这其实是一个宏。
type：创建套接字的服务类型，字节流SOCK_STREAM或数据报SOCK_DGRAM。
protocol：创建套接字的协议类别，可以指明值TCP或UDP。一般只设置为0。

返回值：成功返回一个文件描述符，失败返回-1，错误码被设置。
    _sock = socket(AF_INET, SOCK_DGRAM, 0);if (_sock < 0){logMessage(FATAL, "%d:%s", errno, strerror(errno));exit(2);}

bind

作用：将ip和port在内核中和当前进程强关联。

参数：

sockfd：套接字文件描述符
addr：我们要填充的服务端网络属性信息，包括协议家族、端口号、IP地址，因为我们使用的是sockaddr_in，所以最后要取地址强转为struct sockaddr*
addrlen：addr结构体的长度

返回值：绑定成功返回0，失败返回-1，错误码被设置。

套接字文件描述符我们是有的，addrlen可以使用sizeof，那就剩addr了，除了memset可以初始化，bzero也是可以初始化的，这些接口也多用一下。

struct sockaddr_in local就是我们要填充的字段。

三个参数看着也很熟悉：

sin_family：这是域或者协议家族。
sin_port：这是端口号，16位整数。
sin_addr：这是IP地址，32位整数。
typedef unsigned short int sa_family_t;
#define	__SOCKADDR_COMMON(sa_prefix) \sa_family_t sa_prefix##familytypedef uint16_t in_port_t;typedef uint32_t in_addr_t;
struct in_addr
{in_addr_t s_addr;
};struct sockaddr_in
{__SOCKADDR_COMMON (sin_);   // 协议家族in_port_t sin_port;			// 16位端口号struct in_addr sin_addr;	// 32位IP地址// ...
};
未来要把数据发送给服务端，也要把自己的IP和端口号发送到网络，所以一定要改变网络字节序。不过我们要注意的是，IP地址通常是以字符串形式出现的，所以还要再做一下处理，使用inet_addr函数就可以把IP地址从char*类型转换成网络序列的32位整数。

至此我们初始化的工作就做好了，我们把它封装成一个类中的成员函数。
class UdpServer
{
public:UdpServer(uint16_t port, std::string ip = "0.0.0.0"):_port(port),_ip(ip),_sock(-1){} bool initServer(){// 1. 创建套接字_sock = socket(AF_INET, SOCK_DGRAM, 0);if (_sock < 0){// 这就是使用到我们进程池写的日志文件了logMessage(FATAL, "%d:%s", errno, strerror(errno));exit(2);}// 2. bind绑定，将ip和port在内核中和当前进程强关联struct sockaddr_in local;bzero(&local, sizeof(local));local.sin_family = AF_INET;// 主机到网络的转换，port是16位的使用host to net shortlocal.sin_port = htons(_port);// 把IP地址从点分十进制字符串变成4字节32位整数，再变成网络序列local.sin_addr.s_addr = inet_addr(_ip.c_str());if (bind(_sock, (struct sockaddr*)&local, sizeof local) < 0){logMessage(FATAL, "%d:%s", errno, strerror(errno));exit(2);}logMessage(NORMAL, "%s", "init udp server done ... ", strerror(errno));}private:// 服务器必须要有ip地址和端口号uint16_t _port; // 192.168.16.1std::string _ip;int _sock;
};

recvfrom

这个时候我们的服务器就已经可以启动了，UDP的初始化只需要创建套接字加绑定就可以了，服务器就是一直为用户提供某种服务，所以服务器运行起来后就永远不会退出，实际上执行的就是一个死循环代码。

由于UDP服务器是不面向连接，也不需要其他操作，而UDP服务器读取客户端数据的函数就是这个。

参数：

sockfd：套接字文件描述符
buf：读取的数据要放到的缓冲区
len：要读取的字节数
flags：读取的方式，一般设置为0，表示阻塞式读取
src_addr：输出型参数，对端网络的属性
addrlen：调用时传入的src_addr结构体的长度，返回实际读取到的实际长度，这是一个输入输出型参数

返回值：读取成功返回实际读取的字节数，读取失败返回-1，错误码被设置。

因为UDP不面向连接，所以一定要获取对方的网络信息，如IP和端口号，recvfrom函数提供的参数是struct sockaddr*类型的，所以一定要取地址强转。

使用inet_ntoa函数就可以把struct in_addr中的IP从32位整数的网络序列转化为本机的char*类型。
// 作为一款服务器来说，一定是永远不退出的
// 所以该进程一定是一个常驻进程，永远在内存中存在。除非进程终止了#define SIZE 1024char buffer[SIZE];
for (;;)
{struct sockaddr_in peer;    // 对端网络的属性信息bzero(&peer, sizeof(peer)); // 初始化socklen_t len = sizeof(peer);// 读取数据ssize_t s = recvfrom(_sock, buffer, sizeof(buffer) - 1, 0, (struct sockaddr*)&peer, &len);if (s > 0){buffer[s] = 0; // 传过来的数据// 1.输出信息// 2.是谁发的uint16_t cli_port = ntohs(peer.sin_port); // 从网络中来的数据要转换成本机字节序std::string cli_ip = inet_ntoa(peer.sin_addr); // 4字节的32位整数IP网络序列->本主机的字符串点分十进制IPprintf("[%s:%d]# %s\n", cli_ip, cli_port, buffer);}// ...
}

sendto

UDP服务器返回给客户端数据的函数

参数：

sockfd：套接字文件描述符
buffer：要把那个缓冲区中的数据返回对端
len：缓冲区字符的个数
flags：一般为0，表示阻塞写入
dest_addr：对端网络相关的属性信息
addrlen：dest_addr结构体的长度

返回值：成功返回实际写入的字节数，写入失败返回-1，错误码被设置。

// udp_server.hpp#include <iostream>
#include <string>#include <unistd.h>
#include <cerrno>
#include <cstring>
#include <cstdio>
#include <cstdio>#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>#include "log.hpp"#define SIZE 1024class UdpServer
{
public:UdpServer(uint16_t port, std::string ip = "0.0.0.0"):_port(port),_ip(ip),_sock(-1){} bool initServer(){// 1. 创建套接字_sock = socket(AF_INET, SOCK_DGRAM, 0);if (_sock < 0){logMessage(FATAL, "%d:%s", errno, strerror(errno));exit(2);}// 2. bind绑定，将ip和port在内核中和当前进程强关联struct sockaddr_in local;bzero(&local, sizeof(local));local.sin_family = AF_INET;// 主机到网络的转换，port是16位的使用host to net shortlocal.sin_port = htons(_port);// 把IP地址从点分十进制字符串变成4字节32位整数，再变成网络序列local.sin_addr.s_addr = inet_addr(_ip.c_str());if (bind(_sock, (struct sockaddr*)&local, sizeof local) < 0){logMessage(FATAL, "%d:%s", errno, strerror(errno));exit(2);}logMessage(NORMAL, "init udp server done ... %s", strerror(errno));return true;}void Start(){// 作为一款服务器来说，一定是永远不退出的// 所以该进程一定是一个常驻进程，永远在内存中存在。除非进程终止了char buffer[SIZE];for (;;){struct sockaddr_in peer;    // 对端网络的属性信息bzero(&peer, sizeof(peer)); // 初始化socklen_t len = sizeof(peer);// 读取数据ssize_t s = recvfrom(_sock, buffer, sizeof(buffer) - 1, 0, (struct sockaddr*)&peer, &len);if (s > 0){buffer[s] = 0; // 传过来的数据// 1.输出信息// 2.是谁发的uint16_t cli_port = ntohs(peer.sin_port); // 从网络中来的数据要转换成本机字节序std::string cli_ip = inet_ntoa(peer.sin_addr); // 4字节的32位整数IP网络序列->本主机的字符串点分十进制IPprintf("[%s:%d]# %s\n", cli_ip.c_str(), cli_port, buffer);}// 分析数据// 写回数据sendto(_sock, buffer, strlen(buffer), 0, (struct sockaddr*)&peer, len);}}~UdpServer(){if (_sock >= 0) close(_sock);}private:// 服务器必须要有ip地址和端口号uint16_t _port; // 192.168.16.1std::string _ip;int _sock;
};

至此，我们的UDP服务端就已经写好了，封装了一下服务端。

编写客户端

// udp_client.cc#include <iostream>
#include <string>#include <cstring>
#include <cstdio>#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <netinet/in.h>// .udp_client server_ip server_port
static void usage(std::string proc)
{std::cout << "\nUsage: " << proc << " ip port\n" << std::endl;
}int main(int argc, char* argv[])
{if (argc != 3){usage(argv[0]);exit(1);}// 1.创建套接字int sock = socket(AF_INET, SOCK_DGRAM, 0);if (sock < 0){std::cerr << "socket error" << std::endl;exit(2);}// client不需要主动bind，这是一个客户端，普通用户不知道，如果程序员写了bind，那么一定bind了一个固定的端口号// 如果这个端口号被其他进程占用了呢，所以就让OS自动随机选择端口号std::string message;struct sockaddr_in server;memset(&server, 0, sizeof(server));server.sin_family = AF_INET;server.sin_port = htons(atoi(argv[2]));server.sin_addr.s_addr = inet_addr(argv[1]);char buffer[1024];while (true){std::cout << "请输入:";std::getline(std::cin, message);// 当client首次发送消息给服务器的时候，OS会自动给client bind他的IP和PORTsendto(sock, message.c_str(), message.size(), 0, (struct sockaddr*)&server, sizeof(server));// 读取struct sockaddr_in temp;socklen_t len = sizeof(temp);ssize_t s = recvfrom(sock, buffer, sizeof(buffer), 0, (struct sockaddr*)&temp, &len);if (s > 0){std::cout << "Server echo# " << buffer << std::endl;}}return 0;
}
首先就来说一下客户端绑定的问题，网络通信中IP地址和端口号一定要的，服务器是给别人提供服务的，所以就必须要告诉别人服务器的IP和端口号。因为服务器是一个死循环的进程，选定的端口号不能轻易改变，所以服务端必须要bind。客户端不需要绑定的原因就是他在访问服务器的时候，只需要确定此时的端口号唯一，如果他绑定了，那么客户端就只能通过这个端口号访问服务器，所以写客户端的时候就不要bind，当调用sendto的时候操作系统会自动给当前客户端获取一个唯一端口号。

写好了之后就可以启动服务端和客户端了。
// udp_server.cc#include "udp_server.hpp"
#include <memory>
#include <cstdlib>// .udp_server ip port
void usage(std::string proc)
{std::cout << "\nUsage: " << proc << " ip port\n" << std::endl;
}int main(int argc, char* argv[])
{if (argc != 3){usage(argv[0]);exit(1);}std::string ip = argv[1];uint16_t port = atoi(argv[2]);std::unique_ptr<UdpServer> svr(new UdpServer(port, ip));svr->initServer();svr->Start();return 0;
}
我们通过netstat命令查看网络状态，netstat的选项：

-n：直接使用IP地址，而不通过域名服务器。
-l ：显示监控中的服务器的Socket。
-t ：显示TCP传输协议的连线状况。
-u：显示UDP传输协议的连线状况。
-p：显示正在使用Socket的程序识别码和程序名称。

我们的服务端流程，通过设置本机IP和固定端口号初始化UdpServer，创建套接字，再bind将IP和port进行强关联，编辑本机的sockaddr；运行服务器，recvfrom读取数据，接受客户端的sockaddr信息，处理过后再调用sendto给客户端发送回去。

客户端流程，设置要访问的服务端IP和端口号，编辑服务端sockaddr，再调用sendto向服务端发送信息，最后读取服务端的信息。

使用netstat -nlup查看当前网络信息。

绑定INADDR_ANY

客户端和服务端在本机中已经可以实现通信了，如果想要在网络中通过客户端访问服务端绑定自己的公网IP，但是我现在用的是一个云服务器，它的IP地址并不是真正的公网IP，所以不能被绑定，让外网访问就要绑定0，系统中提供了一个宏就是INADDR_ANY，它的值就是0。

一个服务器中，可能放了多张网卡，那么就会有多个IP地址，但是端口号只有一个，服务器在接收数据的时候，多张网卡都收到了数据，如果bind的时候是指定IP地址的，那就只能从这个IP地址中接收数据，如果bind的是INADDR_ANY，只要是发送给指定端口号的，就可以从不同的IP地址接收交给服务端。
// 2. bind绑定，将ip和port在内核中和当前进程强关联
struct sockaddr_in local;
bzero(&local, sizeof(local));
local.sin_family = AF_INET;
// 主机到网络的转换，port是16位的使用host to net short
local.sin_port = htons(_port);
// 把IP地址从点分十进制字符串变成4字节32位整数，再变成网络序列
local.sin_addr.s_addr = _ip.empty() ? INADDR_ANY : inet_addr(_ip.c_str());

实现聊天功能

我们现在想要实现一个聊天功能，一个客户端向服务端发送信息，服务端收到信息，并把这个用户对应的信息保存起来，再把消息从服务端发送回客户端；此时我们再来一个用户，一样的操作，这时候两个客户端应该可以看到两个人发送的信息。
// 添加一个成员变量
std::unordered_map<std::string, struct sockaddr_in> _users; // IP-PORT : sockaddr_in// 修改一下Start成员函数char buffer[SIZE];
char key[64]; // 将ip-port写到key中
for (;;)
{// ...ssize_t s = recvfrom(_sock, buffer, sizeof(buffer) - 1, 0, (struct sockaddr*)&peer, &len);if (s > 0){// ...snprintf(key, sizeof(key), "%s-%u", cli_ip.c_str(), cli_port);logMessage(NORMAL, "key: %s", key);auto it = _users.find(key); // 把信息写到map中if (it == _users.end()){logMessage(NORMAL, "add new user: %s", key);_users.insert({key, peer});}}// 写回数据for (auto& iter : _users){std::string sendMessage = key;sendMessage += "# ";sendMessage += buffer; logMessage(NORMAL, "push message to %s", iter.first.c_str());sendto(_sock, sendMessage.c_str(), sendMessage.size(), 0, (struct sockaddr*)&iter.second, sizeof(iter.second));}
}
想法很美好，但是现实往往和想象中的不一样，一开始还行，后面打印的都是什么东西，原因就是IO被阻塞了，就是当我们getline拿用户输入的数据的时候，后面的sendto和recvfrom都不会执行，所以现在就可以使用多线程，一个线程发数据，另一个线程负责收数据。

这就有一个要注意的点，不管是读数据还是写数据都要用sock，如果使用多线程就要把sock设置成全局的，或者再把客户端封装成一个类，成员变量对于整个类也是全局的。那会不会有线程安全的问题呢，这也是没有的，因为在多线程之前就要创建出socket，而线程只是用这个socket，并不会修改它，所以可以并发访问。

我们再把之前已经封装好的线程拿过来，这样sock会直接传入ThreadData中，所以也就不需要把sock定义成全局的。
#include "thread.hpp"// port、ip
uint16_t serverport = 0;
std::string serverip;// .udp_client ip port
static void usage(std::string proc)
{std::cout << "\nUsage: " << proc << " ip port\n" << std::endl;
}static void *udpSend(void *args)
{// 拿到sockint sock = *(int *)((ThreadData *)args)->args_;std::string name = ((ThreadData *)args)->name_;// 填充服务端信息std::string message;struct sockaddr_in server;memset(&server, 0, sizeof(server));server.sin_family = AF_INET;server.sin_port = htons(serverport);server.sin_addr.s_addr = inet_addr(serverip.c_str());while (true){// 输入数据，发送std::cerr << "请输入:";std::getline(std::cin, message);if (message == "quit")break;sendto(sock, message.c_str(), message.size(), 0, (struct sockaddr *)&server, sizeof(server));}return nullptr;
}static void *udpRecv(void *args)
{int sock = *(int *)((ThreadData *)args)->args_;std::string name = ((ThreadData *)args)->name_;char buffer[1024];while (true){struct sockaddr_in temp;socklen_t len = sizeof(temp);ssize_t s = recvfrom(sock, buffer, sizeof(buffer), 0, (struct sockaddr *)&temp, &len);if (s > 0){buffer[s] = 0;std::cout << buffer << std::endl;}}return nullptr;
}int main(int argc, char *argv[])
{if (argc != 3){usage(argv[0]);exit(1);}// 1.创建套接字int sock = socket(AF_INET, SOCK_DGRAM, 0);if (sock < 0){std::cerr << "socket error" << std::endl;exit(2);}serverport = atoi(argv[2]);serverip = argv[1];std::unique_ptr<Thread> sender(new Thread(1, udpSend, (void *)&sock)); // 发送线程std::unique_ptr<Thread> recver(new Thread(2, udpRecv, (void *)&sock)); // 接收线程sender->start();recver->start();sender->join();recver->join();close(sock);return 0;
}
至此多线程就写好了，虽然用的socket都是同一个，但是没有读写冲突的情况，因为UDP是全双工的，可以同时进行收和发，不会受到干扰。

我们在目录下使用mkfifo创建两个管道文件client1和client2，将客户端输出重定向到管道文件，再使用cat输出重定向，这就好像类似于一个输入框和一个显示框。