如何运用yolov5训练自己的数据(手把手教你学yolo)

在这篇博文中,我们对YOLOv5模型进行微调,用于自定义目标检测的训练和推理。

目录

  1. 引言: YOLOv5是什么?

  2. YOLOv5提供的模型

  3. YOLOv5提供的功能

  4. 使用YOLOv5进行自定义目标检测训练

  5. 自定义训练的方法 自定义训练代码

  6. 准备数据集

  7. 克隆YOLOv5存储库

  8. 训练小模型(yolov5s)

  9. 训练YOLOv5中型模型

  10. 冻结层训练中型YOLOv5模型

  11. 性能比较

  12. 结论

引言:

深度学习领域在2012年开始快速发展。在那个时候,这个领域还比较独特,编写深度学习程序和软件的人要么是深度学习实践者,要么是在该领域有丰富经验的研究人员,或者是具备优秀编码技能的人。

而现在,仅过去10年左右,情况已经发生了巨大变化,而且变得更好。现在,只需要学习了几周的学生就可以用不到20行代码训练一个神经网络模型。而且,这不仅仅是在基准数据集上进行训练,我们可以使用一些最好的模型来训练自定义数据集。不相信吗?好的,那么我们就在这篇文章中使用YOLOV5进行自定义目标检测训练,来证明这一点。

YOLOv5是什么?

如果你在机器学习和深度学习领域已经有一段时间了,很有可能你已经听说过YOLO。YOLO是You Only Look Once的缩写。它是一系列基于单阶段深度学习的目标检测器。它们能够以超过实时的速度进行目标检测,并具有最先进的准确性。

在Darknet框架中,官方发布了四个版本。

YOLOv5是一种用于目标检测的深度学习模型。它是YOLO(You Only Look Once)系列的下一代版本,采用了PyTorch框架,并由Ultralytics组织在GitHub上开发。YOLOv5包含了多种不同大小和准确性的模型,适用于各种场景和设备。

YOLOv5一共有五个模型,

包括:

  • YOLOv5n:最小的nano模型,适用于边缘设备、物联网设备和具有OpenCV DNN支持的环境。
  • YOLOv5s:小型模型,适合在CPU上进行推断。
  • YOLOv5m:中等大小的模型,是速度和准确性之间的平衡点,适用于许多数据集和训练任务。
  • YOLOv5l:大型模型,适用于需要检测较小物体的数据集。
  • YOLOv5x:最大的模型,拥有最高的mAP指标,但相对较慢,参数数量为86.7百万。

使用YOLOv5进行自定义目标检测训练的方法如下:

  1. 准备数据集:包括标注好的图像和对应的标签文件。
  2. 克隆YOLOv5仓库:从GitHub上获取YOLOv5代码和预训练模型。
  3. 使用训练代码:根据需要选择合适的模型进行训练,并设置训练参数和路径。
  4. 运行训练:执行训练代码开始模型训练,可以根据需求选择使用GPU或CPU进行训练。
  5. 检查性能:比较不同模型的mAP、FPS和推断时间,评估训练结果。

总之,YOLOv5是一种强大的目标检测模型,在深度学习领域有着广泛的应用。它提供了多个模型可供选择,可以根据需求进行定制化训练,并能在不同设备上进行高效的目标检测。

训练自己的数据

具体来说,本文提到了使用YOLOv5进行自定义目标检测训练的步骤,并使用了Vehicle-OpenImages数据集作为示例。

mosaic数据增强

Ground truth images from the traffic vehicle dataset

数据集包含439张用于训练的图像,125张用于验证,以及63张用于测试。但在本文中,我们只会使用训练和验证集。在继续之前,这里有几张图像,上面画有真实框的标注。

Ground truth images from the traffic vehicle dataset with annotations

自定义训练的方法

让我们看一下使用YOLOv5进行自定义训练时我们将涵盖的内容。

我们将从训练小型YOLOv5模型开始。
然后我们将训练中型模型,并与小型模型进行比较,看是否有改进。
接下来,我们将冻结中型模型的几层,然后再次训练模型。
我们将在上述所有情况下进行推断,并比较推断视频过程中的mAP指标和FPS。
自定义训练代码
让我们开始编码部分。所有的代码都包含在一个Jupyter笔记本中,你可以从下载部分获取。

在这里,我们将介绍所有必要和重要的代码部分。包括:

准备数据集。

按照上面讨论的方法训练三个模型。
性能比较。
对图像和视频进行推断。
让我们仔细研究代码的所有重要部分,从导入我们在笔记本中使用的模块和库开始。

准备数据集 下一步是下载和准备数据集。我们需要一个简单的辅助函数来下载数据集并解压

if not os.path.exists('train'):#论文辅导、代码获取,作业帮助Qq——1309399183!curl -L "https://public.roboflow.com/ds/xKLV14HbTF?key=aJzo7msVta" > roboflow.zip; unzip roboflow.zip; rm roboflow.zipdirs = ['train', 'valid', 'test']for i, dir_name in enumerate(dirs):all_image_names = sorted(os.listdir(f"{dir_name}/images/"))for j, image_name in enumerate(all_image_names):if (j % 2) == 0:file_name = image_name.split('.jpg')[0]os.remove(f"{dir_name}/images/{image_name}")os.remove(f"{dir_name}/labels/{file_name}.txt")

数据结构如下


├── test
│   ├── images
│   └── labels
├── train
│   ├── images
│   ├── labels
│   └── labels.cache
├── valid
│   ├── images
│   ├── labels
│   └── labels.cache
├── data.yaml
├── README.dataset.txt
└── README.roboflow.txt

配置文件YAML设置

YOLOv5训练中最重要的一个属性可能是数据集的YAML文件。该文件包含训练和验证数据的路径,以及类别名称。在执行训练脚本时,我们需要将此文件路径作为参数提供,以便脚本可以识别图像路径、标签路径和类别名称。数据集已经包含了这个文件。以下是我们在这里用于训练的data.yaml文件的内容


train: ../train/images
val: ../valid/images
nc: 5
names: ['Ambulance', 'Bus', 'Car', 'Motorcycle', 'Truck']

克隆代码

为了使用YOLOv5代码库的任何功能,我们需要克隆他们的存储库。以下几行代码克隆了存储库,进入yolov5目录,并安装我们可能需要运行代码的所有要求


if not os.path.exists('yolov5'):!git clone https://ultralytics/yolov5.git
%cd yolov5/
!pip install -r requirements.txt

训练

现在,让我们一起了解训练脚本的所有参数。

–data:该参数接受我们之前创建的数据集YAML文件的路径。在我们的情况下,它是当前目录的上一级目录,因此为 …/data.yaml。
–weights:该参数接受我们想要用于训练的模型。由于我们使用YOLOv5系列中的小型模型,因此值为 yolov5s.pt。
–img:我们还可以在训练时控制图像大小。在将图像馈送到网络之前,图像将被调整为此值。我们将它们调整为640个像素,这也是最常用的尺寸之一。
–epochs:该参数用于指定训练的epoch数。由于我们已经在上面的EPOCHS变量中指定了epoch数,因此我们在此提供该变量。
–batch-size:这是在训练时将加载到一个批次中的样本数。虽然这里的值为16,但你可以根据可用的GPU内存进行更改。
–name:我们可以提供一个自定义目录名称,其中将保存所有结果。在我们的情况下,我们提供了刚刚通过调用set_res_dir函数创建的路径。

训练结果

   Images     Labels          P          R     mAP@.5 mAP@all        125        227      0.149      0.211     0.0944     0.0305
...
Epoch   gpu_mem       box       obj       cls    labels  img_size24/24     3.94G   0.03121   0.01958  0.009307        21       640: 100%|███Class     Images     Labels          P          R     mAP@.5 mAP@all        125        227      0.655      0.515      0.587       0.4125 epochs completed in 0.190 hours.
Optimizer stripped from runs/train/results_4/weights/last.pt, 14.5MB
Optimizer stripped from runs/train/results_4/weights/best.pt, 14.5MBValidating runs/train/results_4/weights/best.pt...
Fusing layers... 
Model summary: 213 layers, 7023610 parameters, 0 gradientsClass     Images     Labels          P          R     mAP@.5 mAP@all        125        227      0.514      0.646      0.588       0.41Ambulance        125         32      0.541      0.812      0.741      0.605Bus        125         23      0.586      0.739      0.714      0.502Car        125        119      0.521       0.58      0.531       0.34Motorcycle        125         23      0.668      0.699      0.659      0.397Truck        125         30      0.254        0.4      0.296      0.20

评价指标展示

Results after training the YOLOv5s model

推理结果展示

在训练过程中,代码库会将每个epoch的验证批次的预测保存到结果目录中。在我们查看这些预测之前,让我们编写一个辅助函数来找到结果目录中的所有验证预测并展示它们

#论文辅导、代码获取,作业帮助Qq——1309399183
def show_valid_results(RES_DIR):!ls runs/train/{RES_DIR}EXP_PATH = f"runs/train/{RES_DIR}"validation_pred_images = glob.glob(f"{EXP_PATH}/*_pred.jpg")print(validation_pred_images)for pred_image in validation_pred_images:image = cv2.imread(pred_image)plt.figure(figsize=(19, 16))plt.imshow(image[:, :, ::-1])plt.axis('off')plt.show()

YOLOv5s validation predictions from batch 0.

mAP比较

Mean Average Precision for different custom trained YOLOv5 models

结论

在本文中,我们进行了许多使用YOLOv5进行训练和推理的实验。我们从使用YOLOv5小型模型进行自定义对象检测训练和推理开始。然后,我们转向YOLOv5中型模型的训练,还尝试了部分冻结层的中型模型训练。本文让我们深入了解了YOLOv5代码库的工作原理,并了解了不同模型之间的性能和速度差异。

论文辅导、代码获取,作业帮助Qq——1309399183

[外链图片转存中…(img-MOcL0kob-1695526726081)]

结论

在这里插入图片描述

在本文中,我们进行了许多使用YOLOv5进行训练和推理的实验。我们从使用YOLOv5小型模型进行自定义对象检测训练和推理开始。然后,我们转向YOLOv5中型模型的训练,还尝试了部分冻结层的中型模型训练。本文让我们深入了解了YOLOv5代码库的工作原理,并了解了不同模型之间的性能和速度差异。

论文辅导、代码获取,作业帮助Qq——1309399183

鉴于本文中进行的大量实验,你是否注意到了什么?除了一些通用的Python函数外,我们没有编写任何深度学习代码。这表明深度学习领域变得越来越易于访问,希望未来也会朝着同样的方向发展。如果你尝试在自己的数据集上进行自定义训练并发现有趣的结果,请不要忘记在评论区分享你的成果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/140139.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对话ChatGPT:AIGC时代下,分布式存储的应用与前景

随着科技的飞速发展,我们正步入一个被称为AIGC时代的全新阶段,人工智能、物联网、大数据、云计算成为这个信息爆炸时代的主要特征。自2022年11月以来,ChatGPT的知名度迅速攀升,引发了全球科技爱好者的极大关注,其高超的…

【跟小嘉学习区块链】二、Hyperledger Fabric 架构详解

系列文章目录 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 文章目录 系列文章目录[TOC](文章目录) 前言一、Hyperledger 社区1.1、Hyperledger(面向企业的分布式账本)1.2、Hyperledger社区组织结构 二、Hype…

AI-Chat,一款集全网ai功能的应用(附下载链接)

AI-Chat是一款综合性的聊天机器人,集成了多种先进的模型和功能。它采用了GPT4.0、联网版GPT和清华模型等多种模型,使得其具备更强大的语言处理能力。同时,AI-Chat还融合了AI绘画模型,例如Stable Diffusion绘画、文生图、图生图、艺…

数据结构与算法基础-(2)

🌈write in front🌈 🧸大家好,我是Aileen🧸.希望你看完之后,能对你有所帮助,不足请指正!共同学习交流. 🆔本文由Aileen_0v0🧸 原创 CSDN首发🐒 如…

ElasticSearch - 分布式搜索引擎底层实现——倒排索引

目录 一、ElasticSearch 1.1、ElasticSearch 是什么? 1.2、ElasticStack 是什么? 1.3、正向索引和倒排索引 1.3.1、正向索引 1.3.2、倒排索引 a)倒排索引的创建过程: b)倒排索引的查询过程: c)分…

LeetCode讲解篇之347. 前 K 个高频元素

347. 前 K 个高频元素 文章目录 347. 前 K 个高频元素题目描述题解思路题解代码 题目描述 题解思路 根据数组频率倒序排序, 然后返回前k的个数据 题解代码 func topKFrequent(nums []int, k int) []int {m : make(map[int]int, 0)for i : len(nums) - 1; i > 0; i-- {m[n…

一拖三快充线(USB-C转三充)的解决方案--LDR6020P

DR6020P 是带有 3 组 6 路 DRP USB-C 及 PD 通信协议处理模块和 USB2.0 Device 功能的 16 位 RISC MCU,内置 8K16 位 MTP 程序存储器(可烧录 1000 次),512 字节的数据存储器(SRAM)。内置 LDO 5V 输出&#…

滑动窗口9.23

1876.长度为3且各字符不同的子字符串 1876. 长度为三且各字符不同的子字符串 - 力扣(LeetCode)https://leetcode.cn/problems/substrings-of-size-three-with-distinct-characters/?envTypelist&envId24zW97w8自写思路: 数组充当哈希表…

Mysql004:用户管理

前言:本章节讲解的是mysql中的用户管理,包括(管理数据用户)、(控制数据库的访问权限)。 目录 1. 查询用户 2. 创建用户 3. 修改用户密码 4. 删除用户 5. 权限控制 1. 查询用户 在mysql数据库中&#xff0…

数字IC设计系列----单端口RAM、双端口RAM

一、单端口RAM原理及实现 1.1、概念/原理 在内存空间中开辟出一段固定大小的内存用于存储数据,每一个数据所占的bit位称之为位宽,这段内存空间中数据的总数称之为深度。例如reg [7:0] mem [255:0],这段内存空间中每一个数据的位宽为8bit&am…

Nuxt 菜鸟入门学习笔记:路由

文章目录 路由 Routing页面 Pages导航 Navigation路由参数 Route Parameters路由中间件 Route Middleware路由验证 Route Validation Nuxt 官网地址: https://nuxt.com/ 路由 Routing Nuxt 的一个核心功能是文件系统路由器。pages/目录下的每个 Vue 文件都会创建一…

C语言数组和指针笔试题(四)(一定要看)

目录 二维数组例题一例题二例题三例题四例题五例题六例题七例题八例题九例题十例题十一 结果 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 🐒🐒🐒个人主页 🥸🥸🥸C语言 🐿️…

【Unity3D赛车游戏制作】开始界面场景搭建

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:Uni…

大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免

目录 前言 1.名字和描述颠倒一下,大模型就糊涂了 2.实验及结果 3.未来展望 前言 大模型的逻辑?不存在的。 我让 GPT-3 和 Llama 学会一个简单的知识:A 就是 B,然后反过来问 B 是什么,结果发现 AI 回答的正确率竟然是…

SpringCloud Alibaba - Sentinel

接上文SpringCloud Alibaba - Nacos 1.Sentinel 流量防卫兵 1.1 安装与部署 和Nacos一样,它是独立安装和部署的,下载地址https://github.com/alibaba/Sentinel/releases 下载后的jar放到目录 然后配置 启动并访问,用户名密码都是 sentinel 此时就…

2024年考研教育专业的教育综合考试大纲、样题和往年真题

根据教育部通知,2024年全国硕士研究生招生考试初试定于2023年12月23日至24日,即我们说的2024年考研时间为12月23-24日。距离现在只剩下3个月不到的时间,那么如何让我们在最后三个月内的复习和备考有效且高效呢? 结合很多清北复交研…

湖南麒麟两种修复硬盘方式

1、背景介绍 目前X86平台采用湖南麒麟3.3-3B系统,当遇到文件系统损坏时,可分下面两种情况进行文件系统修复 2、紧急模式下的修复 板子能进入系统,但是进入的是紧急模式,类似下面这种 此时可以直接输入修复命令进行系统修复 xf…

win11 允许使用脚本Set-ExecutionPolicy

目录 Set-ExecutionPolicy RemoteSigned notepad.exe $PROFILE Set-ExecutionPolicy RemoteSigned Set-ExecutionPolicy RemoteSigned 如果报错,执行: Set-ExecutionPolicy -Scope CurrentUser 然后就会提示我们输入,我们把刚刚的 Remot…

C语言每日一题(10):无人生还

文章主题:无人生还🔥所属专栏:C语言每日一题📗作者简介:每天不定时更新C语言的小白一枚,记录分享自己每天的所思所想😄🎶个人主页:[₽]的个人主页🏄&#x1f…

Ubuntu 安装 CUDA 与 OPENCL

前言:最近需要做一些GPU并行计算,因而入坑CUDA和OPENCL,两者都有用到一些,刚好有点时间,同时记录一些学习过程,排掉一些坑,这篇是环境安装篇,基本跟着走就没什么问题,环境…