yolov4算法及其改进

1、yolov4介绍
2、mosaic与mish激活函数
- 2.1、mosaic数据增强
- 2.2、Mish激活函数
3、backbone网络框架的改进
4、PAN-FPN的介绍
5、样本匹配和损失函数
- 5.1、样本匹配
- 5.2、YOLOV4损失函数
- - 5.2.1、GIOU loss
  - 5.2.2、DIOU loss
  - 5.2.3、CIOU Loss

1、yolov4介绍

在这里插入图片描述
改进点：

输入端改进：Mosaic数据增加
主干网络：CSPDarkNet53
Neck:SPP、PANet
损失函数：CIOU
激活函数：Mish激活函数
样本匹配：增加了匹配样本的数量

2、mosaic与mish激活函数

2.1、mosaic数据增强

在这里插入图片描述
数据增强步骤：

首先随机取4张图片
分别对4张图片进行数据增广操作，并分别粘贴至与最终输出图像大小相等的掩模的对应位置
进行图片的组合和框的组合

优点：

丰富数据集：使用4张图片，随机缩放，随机分布进行拼接，大大丰富了目标检测的数据集，增加了很多小目标，让网络模型对小目标的稳健性变的更好
减少GPU使用：mosaic增强训练时，可以在单图像尺度的情况下直接计算4张图片的数据，使得mini-batch size并不需要很大，即使用1个GPU就可以达到比较好的收敛效果

2.2、Mish激活函数

在这里插入图片描述

mish激活函数是自带正则的非单调激活函数，平滑的激活函数可以让模型获得更好的非线性，从而得到更好的准确性和泛化，Mish激活函数的数学表达式如上式。

首先函数和relu一样都是无正向边界的，可以避免梯度饱和，其次，mish函数时光滑的，并且在绝对值较小的负值区域允许一些负值。

注意，mish激活函数的计算复杂度比relu要高，在计算资源不足的情况下，可以考虑使用leakyrelu激活函数代替mish激活函数。

3、backbone网络框架的改进

CSPNet的概念：通过分割梯度流，使梯度流在不同路径中传播，这种传播的梯度信息更加丰富，此外，CSPnet可以打打减少计算量，提高推理速度以及精度

CSPNet的主要目的：可以实现更丰富的梯度组合，同时减少计算量。

实现方法：将基础层的特征层分割成两部分，然后通过提出的跨阶段分层结构进行合并来实现

基于CSPNet的目标检测器主要有以下3个优势：
1、增强学习能力：
2、移除计算瓶颈：
3、降低内存消耗：
在这里插入图片描述
transition层的含义和densenet类似，是一个1*1的卷积层而不是使用average pool
CSPNet设计了两种变体来展示这种梯度流截断如上图C、D
fusion first方式：先将2部分进行concat，然后进行输入到transion层，采用这种方式，可以使得大量梯度信息被重用，有利于网络学习
fusion last方式：先将部分特征输入transition层，然后再进行concat，这样梯度信息将被截断，损失了部分梯度重用，但是由于transition的输入维度比图c少，因此可以减少计算量