只要在一个电脑中的两个进程之间可以通过网络进行通信那么拥有公网ip的两个计算机的通信是一样的。但是一个局域网中的两台电脑上的虚拟机是不能进行通信的,因为这两个虚拟机在电脑中又有各自的局域网所以通信很难实现。
socket套接字是一种用于网络间进行通信的方式,通过tcp与udp以及ip的方式与另外一个主机进行通信,为什么从传输层往下进行计算,因为应用层的方式协议非常的灵活,只要是有一个头和内容即可。但是在网络层数据链路层和传输层等不仅需要满足在两端的数据,还得要满足在硬件上的规定上。
Linux在主机端都是小端存储的,在网络端是大端进行存储的,记忆方式就是那个图这个是大端存储的方式。
所以说将在主机端的信息发布到网络上的时候需要先将信息将小端的方式转化为大端的方式。
【注意】区分大小端的时候是按字节进行划分的,字节内的数据是有序的。分为高字节和低字节,所以可以通过将数据打印为char类型数据判断(ASCII)
【注意】转换端口或者是ip进行大小端的转化需要使用不同的函数因为两者的长度不同。
htonl32位的(host与net)【转化ip】将ip主机字节序转化为网络字节序。
htons16位的【转化端口】将端口的主机字节序转化为网络字节序。
当然可以转过去也可以转回来,ntohl和ntohs函数
大小端的转换并不常用,因为我们常常使用char *字符串类型,所以使用下面的函数
一般在写的时候都是char *ip字符串类型,在进行传输的不便于使用192.如果是字符串类型仅这一小部分这个就是三个字节,所以将这个点分十进制转化为32位01数转化为int类型数字
int inet_aton(char *ip, struct in_addr*inp)将char*类型转化为大端方式转化为struct in_addr,与下面的函数有区别
in_addr_t inet_addr(char *ip)将char*转化为in_addr_t类型(小端的方式)
char* inet_ntoa()将大端转化为char*
存储IP和端口定义的结构体struct sockaddr_in存储ipv4类型数据
【注意】但是一套接口接口可以适用于ipv4和ipv6的通信,所以bind等函数中使用这样一种struct sockaddr通用的一个类似的说明符实际上却没有这样的一个结构体定义,所以在实际应用的时候将sockaddr_in或者sockaddr_in6强转为sockaddr类型
【注意】sockaddr_in 是一个socket类,型的结构体存储ipv4 or 6,存储ip只是这个ipstruct in_addr类型存储用和端口号。struct in_addr 与 in_addr_t类型是一 一对应的,就是说在结构体中实际上存储的就是in_addr_t,所以说在使用的时候注意区分两者。
DNS dns将域名转化为ip
可以多个域名映射同一个ip,可以多个ip映射同一个域名(例如百度)。
gethostbyname给域名变ip,得到更多细节的函数是getaddrinfo函数可以通过一个域名得到所有的ip地址。
socket基于TCP进行通信的方式
socket设置一个socket文件对象(实际上是一个结构体)(理解为开辟一片区域,分配一个名字)
理解socket端点对象是开辟两个缓冲区:输入缓冲区和输入缓冲区。这个地方其实是和read和write系统调用函数类似将用户态的信息传递到内核态,然后将内核态中的信息传递到网卡上去然后传递到网络上,另一端同样从网卡上接收数据,读取到内核态中,然后传到用户态。
最开始创建的这个socket节点只是负责接收信号进行排队。
【注意】这个地方的出入缓冲区是recv函数,是从网卡上接收数据!!!
bind就是设置服务器监听的端口,还有ip。理解这个地方是将自己的自己的ip和端口进行绑定,确定自己要监听的端口。(服务器端是固定端口号的,所以说在进行通信的时候,客户端需要知道服务器端的ip和端口号一般的端口号(http)都是固定的什么80,443)。
在自己进行端口的绑定的时候,不要使用系统定义的预留的端口1-1024,用8080及以上
为什么需要绑定ip,一般的电脑都是一个网卡,电脑有时也可能是有多个网卡,会有多个ip地址,所以绑定ip。当然也可以两个网卡都可以接收,想让两个网卡都接收就用0.0.0.0。
如果bind连接的时候,进行测试的时候,会用到ip127.0.0.1
【注意】在服务器端是自己设置一个端口,在客户端进行随机分配端口,因为客户端如果也是固定端口,这样的话不同的服务程序可能产生冲突,所以采用固定端口的方式。
这个指令查看端口有没有在使用
listen:监听端口
bind只是绑定,但是listen才开始监听
第二个参数,套接字挂起的最大端口号。全链接队列和半链接队列的长度之和。
调用listen函数会在服务器端维护两个缓冲区,是全链接队列和半链接队列。第一次握手完成就将socket节点放到半链接队列中,当完成三次握手的时候就放在全链接队列中。
全链接队列和半链接队列维护队列的数量的多少是在工作中不断确定的。
实际上客户机和服务器是没有什么本质区别的,所以说客户机也可以是服务器,同理。一般客户端不需要bind和listen。
connect进行了三次握手
只有当服务器端进行listen之后,客户端才能与服务器端建立链接。这个时候会报错,listen refused。
【注意】可以有多个客户端与整个服务器进行通信,都是通过socket一个节点接收信息
当完成三次握手以后,就已经建立了链接,(服务器端)socket节点就放到了全链接队列中。
accept在accept的时候是将原来的socket端点进行复制一个socket节点进行通信。(下文why)
借助于文件描述符找到节点的位置。
【注意】因为有多台客户机与服务器进行连接(1.最开始创建的socket节点只是负责三次握手,四次挥手都不负责),2.在基于TCP的连接中,给每一个客户端分配一个socket节点进行服务。这个时候客户端就会和服务器端新的socket节点进行通信而不会和原来的socket节点进行通信。
可以从accept进行三次握手以后,在新的socket节点中就可以获取客户端的ip和端口。也就是accept函数中后面的两个参数,因为ipv4和ipv6是不一样的,所以还需要传一个长度。一般就是用NULL,不需要显示打印出来的时候。当需要答应的时候注意将网络大端转化为主机小端模式。
accept是一个阻塞函数,当全链接队列为空的时候,服务端会阻塞在这个位置。
会返回新建立的socket节点的文件描述符。
recv和send进行通信
send就是将数据放到输出缓冲区中,recv就是从缓冲区中取出数据。传给网卡不关这个函数的关系。内核机制找到合适时间传到网卡,不关自己的操作,同样网卡也是找合适的时机被拿出数据
所以说这个地方可能会出现毡包,粘包的问题,因为放在缓冲区中的数据可能不会直接一次发送出去,或者不会立即发送和别的一块。
【注意】最近的函数中空标志不需要的位置一般都是用0
close关闭连接
【注意】TCP在客户端只需要close一次即可,服务器端需要close两次,一次接收的socket节点,一次进行通信socket节点
close之后可能不会立即进行四次挥手,close只是一次调用,由内核进行处理。同理ctrl+c可能不会由系统执行立即挥手。
框架:
通过网络通信(网络层和传输层的标准规范比较严格,考虑传输层和网络层socket定义)(应用层的传输规定相当的灵活不需要)--------------》
将主机上的数据传递到网络上去(注意数据存储的大小端的问题)--------》
基于传输层的两种不同的TCP和UDP分为两种逻辑
TCP
客户端: socket(得知服务器的ip和端口)----------------------------------------------------》
服务器端:socket(建立一个只是监听的socket节点)-----》bind(设置监听的端口和主机进行监听的ip)-------------》
注意一些问题:
1. 在主机和网络上进行传输时注意大小端问题
2. 注意区分struct in_addr 与 in_addr_t其实一回事,struct中有in_addr_t