通过albumentation对目标检测进行数据增强(简单直接)

albumentation官方文档看不懂?xml文件不知道如何操作?下面只需要修改部分代码即可上手使用

要使用这个方法之前需要按照albumentation这个库还有一些辅助库,自己看着来安装就行

pip install albumentation
pip install opencv-python
pip install json
pip install xml
import os
import cv2
import json
import xml.etree.ElementTree as ET
import albumentations as Adef data_aug(source_annotated, data_aug_annotated, times=3):transform = A.Compose([A.RandomBrightnessContrast(p=0.3),  # 随机亮度对比度A.OneOf([A.GaussNoise(), ], p=0.5),  # 高斯噪声A.OneOf([A.MotionBlur(p=0.2),  # 运动模糊A.MedianBlur(blur_limit=3, p=0.5),  # 中值模糊A.Blur(blur_limit=3, p=0.2),  # 模糊], p=0.5),A.RandomBrightnessContrast(p=0.5),   A.RandomCrop(300, 300, p=0.5),  # 随机裁剪A.RandomRotate90(p=0.5),  # 随机旋转90度A.HorizontalFlip(p=0.5),  # 水平翻转A.VerticalFlip(p=0.5),  # 垂直翻转], bbox_params=A.BboxParams(format='pascal_voc', min_area=0., min_visibility=0., label_fields=['class_labels']))for xml_file in os.listdir(source_annotated):if xml_file.endswith(".xml"):for nth in range(times):tree = ET.parse(os.path.join(source_annotated, xml_file))root = tree.getroot()image_file = root.find('filename').textimage_path = os.path.join(source_annotated, image_file)image = cv2.imread(image_path)bboxes = []class_labels = []for obj in root.findall('object'):label = obj.find('name').textbbox = obj.find('bndbox')xmin = int(bbox.find('xmin').text)ymin = int(bbox.find('ymin').text)xmax = int(bbox.find('xmax').text)ymax = int(bbox.find('ymax').text)bboxes.append([xmin, ymin, xmax, ymax])class_labels.append(label)transformed = transform(image=image, bboxes=bboxes, class_labels=class_labels)transformed_image = transformed['image']transformed_bboxes = transformed['bboxes']save_base_name = os.path.splitext(image_file)[0] + "_" + str(nth)cv2.imwrite(os.path.join(data_aug_annotated, save_base_name + ".jpg"), transformed_image)# 更新XML文件中的变换数据root.find('filename').text = save_base_name + ".jpg"root.find('path').text = os.path.join(data_aug_annotated, save_base_name + ".jpg")for obj, tb in zip(root.findall('object'), transformed_bboxes):bbox = obj.find('bndbox')bbox.find('xmin').text = str(int(tb[0]))bbox.find('ymin').text = str(int(tb[1]))bbox.find('xmax').text = str(int(tb[2]))bbox.find('ymax').text = str(int(tb[3]))tree.write(os.path.join(data_aug_annotated, save_base_name + ".xml"))if __name__ == "__main__":source_annotated = "data_annotated/"  # 原始的图片、标签路径data_aug_annotated = "data_aug_annotated" # 处理后的图片、标签路径times = 3  data_aug(source_annotated, data_aug_annotated, times)

1.需要增强的图片标签文件存放形式

 

标签和文件放在统一文件夹下,同一图片和标签命名对应相同 

2.修改需要增强的要求,如旋转,切割等

            A.RandomBrightnessContrast(p=0.3),  # 随机亮度对比度A.OneOf([A.GaussNoise(), ], p=0.5),  # 高斯噪声A.OneOf([A.MotionBlur(p=0.2),  # 运动模糊A.MedianBlur(blur_limit=3, p=0.5),  # 中值模糊A.Blur(blur_limit=3, p=0.2),  # 模糊], p=0.5),A.RandomBrightnessContrast(p=0.5),   A.RandomCrop(300, 300, p=0.5),  # 随机裁剪A.RandomRotate90(p=0.5),  # 随机旋转90度A.HorizontalFlip(p=0.5),  # 水平翻转A.VerticalFlip(p=0.5),  # 垂直翻转

上述已经列出常见增强方式,可通过注释方式对方法进行取舍,代码中的p代表概率,即每一次增强有多少概率使用到这个方法,可通过自己的爱好进行调增,其他方法查询一下均可容易上手使用,这里不作过多的一一讲解了。

3.创建新的文件夹,用作输出路径

通过修改time这个增强倍数,最后写入要输出的文件夹运行即可

最后结果如图所示:

同时会生成对应的xml,简单快捷。 

增强后可通过以下方法将xml转化成训练需要的txt格式

将目标检测标签中的xml转化成训练输入的txt(简单直接)-CSDN博客

希望这篇博文对你有帮助!!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/381294.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昇思25天学习打卡营第25天 | RNN实现情感分类

学习心得:RNN实现情感分类 在自然语言处理(NLP)的领域中,情感分类是一个极具挑战性的任务,它要求模型能够准确地从文本中识别出情感倾向。通过使用MindSpore框架和RNN模型进行情感分类,我获得了许多有关构…

Springboot项目远程部署gitee仓库(docker+Jenkins+maven+git)

创建仓库 创建一个Springboot项目,勾选web将该项目创建git本地仓库,再创建远程仓库推送上去 创建TestController RestControllerRequestMapping("/test")public class TestController {GetMapping("/hello")public String sayHell…

linux进程优先级——优先值、调度算法、进程性质

前言:本篇内容主要讲解linux下进程的优先级。 优先级的内容相对较少, 最重要的内容就是cpu的调度方法。 内容相对容易理解。 ps:本节内容适合了解冯诺依曼和操作系统的管理方式以及进程PCB的友友们进程观看 进程的优先级是什么 进程的优先级…

智汇云舟:双引擎模式,为合作伙伴带来实在的利润和回报

2024年是智汇云舟新渠道政策的元年,今年上半年,智汇云舟基于视频孪生产品的升级,对合作伙伴的共创模式进行了升级,从以往的“渠道模式”升级为“合伙模式”,从而实现能力升级,为智汇云舟渠道业务的发展带来…

08 模型演化根本 深度学习推荐算法的五大范式

易经》“九三:君于终日乾乾;夕惕若,厉无咎”。九三是指阳爻在卦中处于第三位,已经到达中位,惕龙指这个阶段逐渐理性,德才已经显现,会引人注目;但要反思自己的不足,努力不…

ABAP打印WORD的解决方案

客户要求按照固定格式输出到WORD模板中,目前OLE和DOI研究了均不太适合用于这种需求。 cl_docx_document类可以将WORD转化为XML文件,利用替换字符串方法将文档内容进行填充同 时不破坏WORD现有格式。 首先需要将WORD的单元格用各种预定义的字符进行填充…

《昇思25天学习打卡营第23天|RNN实现情感分类》

使用RNN进行情感分类:基于IMDB数据集的LSTM应用 引言 情感分析是自然语言处理(NLP)中的一个重要应用,广泛用于电影评论、社交媒体等文本数据的情感分类任务。本文将介绍如何使用递归神经网络(RNN)实现情感…

使用IDEA编写lua脚本并运行

下载lua https://github.com/rjpcomputing/luaforwindows/releases 是否创建桌面快捷方式:我们的目标是使用IDEA编写lua脚本,所以不需要勾选。后面需要的话,可以到安装目录下手动创建快捷方式 环境变量自动配置 安装后会自动配置好环境变量…

基于Java的校园交友网站系统

你好,我是专注于计算机技术研究的学姐码农小野。如果你对校园交友网站系统的构建或者相关技术感兴趣,欢迎私信交流。 开发语言 Java 数据库 MySQL 技术 Java语言、SpringBoot框架、B/S结构 工具 MyEclipse、Navicat、Maven 系统展示 首页 个人…

Docker启动PostgreSql并设置时间与主机同步

在 Docker 中启动 PostgreSql 时,需要配置容器的时间与主机同步。可以通过在 Dockerfile 或者 Docker Compose 文件中设置容器的时区,或者使用宿主机的时间来同步容器的时间。这样可以确保容器中的 PostgreSql 与主机的时间保持一致,避免在使…

基于电鸿(电力鸿蒙)的边缘计算网关,支持定制

1 产品信息 边缘计算网关基于平头哥 TH1520 芯片,支持 OpenHarmony 小型系统,是 连接物联网设备和云平台的重要枢纽,可应用于城市基础设施,智能工厂,智能建筑,营业网点,运营 服务中心相关场…

网站及图片字体商用侵权怎么办

如果您的网站因为使用了商业字体而遭到举报,这可能意味着您未经授权就使用了受版权保护的字体,这构成了版权侵权。 boosstrap默认字体是否含商用字体? body {font-family: "Helvetica Neue",Helvetica,Arial,sans-serif;font-size…

公司技术栈用到了RocketMQ,我对此块知识进行了回顾(初始RocketMQ)

前言 作为24届的校招生,不知道大伙儿们是否都已经到了工作岗位上。为了以后更方便的接触到公司的业务,我司为我们安排了将近一个月的实操。虽然不用敲代码,但是… 了解到我司使用到的技术栈,在空闲时间正好对RocketMQ这块技术做个…

金蝶云星空与金蝶云星空对接集成发货通知单查询打通库存状态转换单

金蝶云星空与金蝶云星空对接集成发货通知单查询打通库存状态转换单 数据源系统:金蝶云星空 金蝶K/3Cloud结合当今先进管理理论和数十万家国内客户最佳应用实践,面向事业部制、多地点、多工厂等运营协同与管控型企业及集团公司,提供一个通用的ERP服务平台…

在RK3568上如何烧录MAC?

这里我们用RKDevInfoWriteTool 1.1.4版本 下载地址:https://pan.baidu.com/s/1Y5uNhkyn7D_CjdT98GrlWA?pwdhm30 提 取 码:hm30 烧录过程: 1. 解压RKDevInfoWriteTool_Setup_V1.4_210527.7z 进入解压目录,双击运行RKDevInfo…

Nexus3 批量上传 jar 包、pom文件

Nexus3 Maven 私服搭建及各种使用 详见**Maven私服搭建及各种使用汇总2020** Maven 配置 Nexus 私服 在 Maven 项目中配置 Nexus 私服,需要在项目的 pom.xml 或 maven 的 settings.xml 文件中添加 Nexus 仓库的配置。 示例: 以下是一个项目的 pom.xml…

车载音视频App框架设计

简介 统一播放器提供媒体播放一致性的交互和视觉体验,减少各个媒体应用和场景独自开发的重复工作量,实现媒体播放链路的一致性,减少碎片化的Bug。本文面向应用开发者介绍如何快速接入媒体播放器。 主要功能: 新设计的统一播放U…

Facebook Dating:社交平台的约会新体验

随着社交媒体的普及和技术的发展,传统的社交方式正在经历革新,尤其是在约会这个领域。Facebook作为全球领先的社交平台,推出了Facebook Dating,旨在为用户提供一个全新的约会体验。本文将探讨Facebook Dating如何重新定义社交平台…

Gettler‘s Screep World 笔记 Ⅰ

夏促时候刚刚入坑,写个笔记叭~ 环境配置 参考 HoPGoldy 大佬的简书,先配置下开发环境 萌新去看大佬的详细教程,我这里比较简单,有前端基础的可以直接抄 VSCode 跳过 node 我配的是v18.18.2 换源 npm config set registry h…

层次分析法模型【清风数模学习笔记】

视频学习:【强烈推荐】清风:数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili 适用于:评价类问题 评价目标 可选方案 评价的准则 如何确定评价标准 题目 文献搜索(知网) 网站搜索…