【Datawhale AI夏令营】从零上手CV竞赛Task3

文章目录

  • 前言
  • 一、数据集增强
  • 二、设置 YOLO 模型训练参数
  • 三、模型微调
  • 总结


前言

本文的Task3对Task1的baseline代码继续进行优化的过程。

在这里插入图片描述


一、数据集增强

数据增强是机器学习和深度学习中常用的技术,用于通过从现有数据集中生成新的训练样本来提高模型的泛化能力。

常见的增强技术包括翻转、旋转、缩放和颜色调整。例如 Albumentations、Imgaug 和 TensorFlow的 ImageDataGenerator等多个库可以生成这些增强。

数据增强方法描述
Mosaic Augmentation将四张训练图像组合成一张,增加物体尺度和位置的多样性。
Copy-Paste Augmentation复制一个图像的随机区域并粘贴到另一个图像上,生成新的训练样本。
Random Affine Transformations包括图像的随机旋转、缩放、平移和剪切,增加对几何变换的鲁棒性。
MixUp Augmentation通过线性组合两张图像及其标签创造合成图像,增加特征空间的泛化。
Albumentations一个支持多种增强技术的图像增强库,提供灵活的增强管道定义。
HSV Augmentation对图像的色相、饱和度和亮度进行随机变化,改变颜色属性。
Random Horizontal Flip沿水平轴随机翻转图像,增加对镜像变化的不变性。

如下图所示就是数据增强的例子:

在这里插入图片描述

参数名类型默认值取值范围描述
hsv_hfloat0.0150.0 - 1.0调整图像色调,引入颜色变异性,提高不同光照下的泛化能力。
hsv_sfloat0.70.0 - 1.0调整图像饱和度,改变颜色强度,模拟不同环境条件。
hsv_vfloat0.40.0 - 1.0调整图像亮度,帮助模型在不同光照下表现良好。
degreesfloat0-180 - +180随机旋转图像,提高识别不同方向物体的能力。
translatefloat0.10.0 - 1.0平移图像,帮助模型学习检测部分可见物体。
scalefloat0.5>=0.0缩放图像,模拟物体与相机之间的不同距离。
shearfloat0-180 - +180剪切图像,模拟从不同角度观察物体的效果。
perspectivefloat00.0 - 0.001应用随机透视变换,增强模型对3D空间物体的理解能力。
flipudfloat00.0 - 1.0上下翻转图像,增加数据变异性,不影响物体特征。
fliplrfloat0.50.0 - 1.0左右翻转图像,有助于学习对称物体和增加数据集多样性。
bgrfloat00.0 - 1.0翻转图像通道从RGB到BGR,提高对通道顺序错误的鲁棒性。
mosaicfloat10.0 - 1.0合成四张图像,模拟不同场景组合和物体交互,增强复杂场景理解。
mixupfloat00.0 - 1.0混合两张图像及标签,创建合成图像,增强泛化能力。
copy_pastefloat00.0 - 1.0复制物体并粘贴到另一图像,增加实例和学习遮挡。
auto_augmentstrrandaugment-自动应用预定义增强策略,优化分类任务。
erasingfloat0.40.0 - 0.9随机擦除图像部分,鼓励模型关注不明显特征。

二、设置 YOLO 模型训练参数

YOLO 模型的训练设置包括多种超参数和配置,这些设置会影响模型的性能、速度和准确性。

微调涉及采用预先训练的模型并调整其参数以提高特定任务或数据集的性能。该过程也称为模型再训练,使模型能够更好地理解和预测在实际应用中将遇到的特定数据的结果。

通常,在初始训练时期,学习率从低开始,逐渐增加以稳定训练过程。但是,由于预训练模型已经从以前的数据集中学习了一些特征,因此立即从更高的学习率开始可能更有益。在 YOLO 中绝大部分参数都可以使用默认值。

参数描述
imgsz训练时的目标图像尺寸,所有图像在此尺寸下缩放。
save_period保存模型检查点的频率(周期数),-1 表示禁用。
device用于训练的计算设备,可以是单个或多个 GPU,CPU 或苹果硅的 MPS。
optimizer训练中使用的优化器,如 SGD、Adam 等,或 ‘auto’ 以根据模型配置自动选择。
momentumSGD 的动量因子或 Adam 优化器的 beta1。
weight_decayL2 正则化项。
warmup_epochs学习率预热的周期数。
warmup_momentum预热阶段的初始动量。
warmup_bias_lr预热阶段偏置参数的学习率。
box边界框损失在损失函数中的权重。
cls分类损失在总损失函数中的权重。
dfl分布焦点损失的权重。

三、模型微调

在Task2的基础上,我仍然使用8张4090显卡进行yolov8x更多epoch的训练,同时修改了一些超参数。

在这里插入图片描述

results = model.train(data="/mnt/sdb1/yolo-dataset/yolo.yaml", epochs=10, imgsz=1280, batch=32, device="0,1,2,3,4,5,6,7", mixup=0.4, copy_paste=0.5, mosaic=0)
results = model(path, conf=0.25, imgsz=1280, verbose=False, augment=True)

但是令人遗憾的是,可能mosaic不能设置成0,因为可能需要增加物体位置和尺度的多样性。导致最后的提升比较微小,从0.132提升到了0.137。

在这里插入图片描述

类别目标数量检测数量精度(Precision)召回率(Recall)F1 分数mAP@0.5
all2595196580.7070.2370.330.233
非机动车违停2591126660.8290.6350.7440.447
机动车违停259157370.9990.3140.5640.484
垃圾桶满溢7917911.00.00.00.0
违法经营2324640.00.00.01340.00136

在这里插入图片描述
在这里插入图片描述

而且从训练来看,训练10个epoch过程中差别不是很大,说明可能存在过拟合的问题。

在这里插入图片描述

最后我查看群友们的建议,发现比赛的数据存在严重的数据集不均衡的问题,所以我重新使用一张4090,换用了另一种训练集:验证集为4:1比例的数据划分。

在这里插入图片描述

类别目标数量检测数量精度(Precision)召回率(Recall)F1 分数mAP@0.5
all9307355610.6340.6440.6510.485
非机动车违停9306241280.9040.9310.9570.681
机动车违停9211112221.01.00.9950.774
垃圾桶满溢2112110.00.00.00.0

在这里插入图片描述

在这里插入图片描述

此时的成绩提升到了0.175,提升比较大,说明数据集的标签均衡是非常重要的影响因素。


总结

本次城市治理的违规行为识别的比赛到此就完成所有步骤了,以后有机会还会在此基础上继续深入研究,挑战更多可能!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/413282.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gitee版本控制

前置要求: 安装Git git下载地址:https://git-scm.com/download/win 注册gitee gitee官网:Gitee - 基于 Git 的代码托管和研发协作平台 创建普通项目 目录 git推送远程仓库基本操作 克隆仓库到本地 项目上传 版本管理 分支管理版本…

基于ssm的实习课程管理系统/在线课程系统

实习课程管理系统 摘 要 互联网的快速发展,给各行各业带来不同程度的影响,悄然改变人们的生活、工作方式,也倒逼很多行业创新和变革,以适应社会发展的变化。人们为了能够更加方便地管理项目任务,实习课程管理系统被人们…

55.基于IIC协议的EEPROM驱动控制(2)

升腾A7pro的EEPROM芯片为24C64芯片,器件地址为1010_011。 (1)Visio整体设计视图(IIC_SCL为250KHz,IIC_CLK为1MHz,addr_num为1,地址字节数为2字节,addr_num为0,地址字节数…

产品经理的学习笔记(全集)-持续更新

1.前言 产品经理不是一个软件,也不是一个专业技能,是一个思维量变的过程;内容介绍:P1-产品经理基础认知;P2-从0-1搭建实战项目(电商) 2.产品经理基础 2.1产品经理定义 产品管理--产品的设计…

【手撕数据结构】二叉树oj题

目录 单值二叉树题目描述题目思路及代码 相同的树题目描述题目思路及代码 对称二叉树题目描述题目思路及代码 另一棵树的子树题目描述题目思路及代码 二叉树的前序遍历题目描述题目思路及代码 二叉树的构建与遍历题目描述题目思路及代码 单值二叉树 题目描述 题目思路及代码 …

SAP LE学习笔记07 - MM与WM跨模块收货到仓库的流程中 如何实现 先上架再入库

上一章讲了LE中收货的一些特殊情况: 1,MM模块收货时,特别移动指标来标识的物料直接产生TO 2,MM中直接收货到仓库的固定Storage Bin(棚番)上 SAP LE学习笔记06 - MM与WM跨模块收货到仓库的流程中 带特别移动指标的物料也可以直接…

怎么将日常的文件做成二维码?文件二维码的在线转换方法

文件做成二维码来展示的应用场景越来越多,可以通过二维码在存储文件的同时,提供文件预览以及下载服务,并且二维码没有时效限制,能够长期提供内容展示服务,更符合现在的展示需求。那么文件生成二维码比较简单的方法可以…

黑屏环境下,如何利用OBD部署OceanBase企业版集群

一、前言 OBD,作为OceanBase官方推出的部署工具,显著简化了OB单机及集群的部署流程。此前,OBD能够支持对社区版OB进行一键部署,那OBD是否同样支持OB企业版的部署呢? 本文为大家介绍通过OBD,在OB企业版集群…

(最新)华为 2024 届秋招-硬件技术工程师-单板硬件开发—机试题—(共12套)(每套四十题)

(最新)华为 2024 届秋招-硬件技术工程师-单板硬件开发—机试题—(共12套)(每套四十题) 岗位——硬件技术工程师 岗位意向——单板硬件开发 真题题目分享,完整版带答案(有答案和解析&#xff0…

「青鸟」作家导演起飞计划,助人才转型,共铸电影市场新活力

2024年6月,《上海市电影高质量发展三年行动计划》发布「青鸟」作家导演起飞计划应运而生(下文简称「青鸟计划」)。作为全国首个协助作家跨界转型、用画面讲好故事的扶持平台,青鸟计划重视电影的文学性,通过专业人士搭建…

关于lua调用DLL的c/c++动态库(相关搜索:数据库)

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

访问者模式详解

访问者模式 简介: 类的内部结构不变的情况下,不同的访问者访问这个对象都会呈现出不同的处理方式。 人话: 其实就是为了解决类结构不变但操作处理逻辑易变的问题,把对数据的操作都封装到访问者类中, 我们只需要调用不同的访问者,…

python脚本开头怎么写

在python开发的过程中,脚本开头非常重要。 第一行:告诉操作系统python装在哪里(是通过env中查询,然后再调到对应的解析器完成运行)。 第二行:是声明文件的编码格式以utf-8。 其他则为这个文件信息&#…

RTX5源码全家桶集成emWin6.40, Modbus主从,含FreeRTOS版, 探讨一种移植第3方组件通用方法以及使用注意事项2024-08-30

视频: https://www.bilibili.com/video/BV1tFHuenESf RTX5源码全家桶集成emWin6.40, Modbus主从,含FreeRTOS版, 探讨一种移植第3方组件的通用方法以及多任务使用注意事项 提纲: 参考资料: 1、例程下载 RTX5 All In One(2024-08-30 V2.0).7…

上海大面积断网?原因已查明

8月26日晚,上海电信向记者透露,2024年8月26日17:30许,上海电信城域网设备故障,导致上海电信部分宽带业务发生异常,影响全市范围部分云宽带用户业务,上海电信其他业务均不受影响。 经过上海电信全力抢修&…

医院建筑的电气设计——保障医疗质量与安全的坚固基石

医疗资源与水平的提升成为了衡量民生福祉的重要标尺。随着一批批新建医院及既有医院的华丽蜕变,从社区医院到综合医院,再到医疗城、医疗集聚区的崛起,不仅彰显了政府对民生健康的深切关怀,也预示着我国医疗体系正迈向智能化、高效…

PMP–知识卡片--迭代型生命周期

迭代指的是多次循环。例如,软件开发按照版本发布,每一个版本内部都是一个小的瀑布开发,都会经历“需求分析—设计—开发—测试—发布”周期,下一个迭代在此基础上重复这些步骤,对软件进行优化升级,发布新的…

Stable Diffusion majicMIX_realistic模型的介绍及使用

一、简介 majicMIX_realistic模型是一种能够渲染出具有神秘或幻想色彩的真实场景的AI模型。这个模型的特点是在现实场景的基础上,通过加入一些魔法与奇幻元素来营造出极具画面效果和吸引力的图像。传统意义的现实场景虽然真实,但通常情况下缺乏奇幻性&a…

信息技术(科技)老师资料大本营2024-8-31

(https://img-blog.csdnimg.cn/87e46b33da9640838ab2a76e3c7c9541.jpg)(https://img-blog.csdnimg.cn/e3099a265ef44365a50ec67acef35787.jpg)

5W爆了,建议紧盯这个方向!!

随着Python编程语言在各行业中的应用不断增加,Python程序员的需求也随之增长。 而爬虫技术可以说是Python应用最广泛也最实用的一个领域。在《2024python岗位调查报告》中,爬虫开发就有超过40%的占比。 近两年业界对爬虫技术服务的需求量一直在涨&#…