Python等比例缩放图片并修改对应的Labelme标注文件(v2.0)

Python等比例缩放图片并修改对应的Labelme标注文件(v2.0)

  • 前言
  • 前提条件
  • 相关介绍
  • 实验环境
  • Python等比例缩放图片并修改对应的Labelme标注文件
    • Json文件
    • 代码实现
    • 输出结果

在这里插入图片描述

前言

  • 此版代码,相较于Python等比例缩放图片并修改对应的Labelme标注文件,将无标注文件的数据集处理方法(异常跳过),也考虑进去了。
  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • YOLOv8 Ultralytics:使用Ultralytics框架训练RT-DETR实时目标检测模型
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

  • 熟悉Python

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
  • Python OS模块是负责程序与操作系统的交互,提供了访问操作系统底层的接口和非常丰富的方法用来处理文件和目录。
  • PyTorch 是一个深度学习框架,封装好了很多网络和深度学习相关的工具方便我们调用,而不用我们一个个去单独写了。它分为 CPU 和 GPU 版本,其他框架还有 TensorFlow、Caffe 等。PyTorch 是由 Facebook 人工智能研究院(FAIR)基于 Torch 推出的,它是一个基于 Python 的可续计算包,提供两个高级功能:1、具有强大的 GPU 加速的张量计算(如 NumPy);2、构建深度神经网络时的自动微分机制。
  • YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。它是一个在COCO数据集上预训练的物体检测架构和模型系列,代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。
  • Labelme是一款图像标注工具,由麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发。它是用Python和PyQT编写的,开源且免费。Labelme支持Windows、Linux和Mac等操作系统。
  • 这款工具提供了直观的图形界面,允许用户在图像上标注多种类型的目标,例如矩形框、多边形、线条等,甚至包括更复杂的形状。标注结果以JSON格式保存,便于后续处理和分析。这些标注信息可以用于目标检测、图像分割、图像分类等任务。
  • 总的来说,Labelme是一款强大且易用的图像标注工具,可以满足不同的图像处理需求。
  • Labelme标注json文件是一种用于存储标注信息的文件格式,它包含了以下几个主要的字段:
    • version: Labelme的版本号,例如"4.5.6"。
    • flags: 一些全局的标志,例如是否是分割任务,是否有多边形,等等。
    • shapes: 一个列表,每个元素是一个字典,表示一个标注对象。每个字典包含了以下几个字段:
      • label: 标注对象的类别名称,例如"dog"。
      • points: 一个列表,每个元素是一个坐标对,表示标注对象的边界点,例如[[10, 20], [30, 40]]。
      • group_id: 标注对象的分组编号,用于表示属于同一组的对象,例如1。
      • shape_type: 标注对象的形状类型,例如"polygon",“rectangle”,“circle”,等等。
      • flags: 一些针对该标注对象的标志,例如是否是难例,是否被遮挡,等等。
    • lineColor: 标注对象的边界线颜色,例如[0, 255, 0, 128]。
    • fillColor: 标注对象的填充颜色,例如[255, 0, 0, 128]。
    • imagePath: 图像文件的相对路径,例如"img_001.jpg"。
    • imageData: 图像文件的二进制数据,经过base64编码后的字符串,例如"iVBORw0KGgoAAAANSUhEUgAA…"。
    • imageHeight: 图像的高度,例如600。
    • imageWidth: 图像的宽度,例如800。

以下是一个Labelme标注json文件的示例:

{"version": "4.5.6","flags": {},"shapes": [{"label": "dog","points": [[121.0,233.0],[223.0,232.0],[246.0,334.0],[121.0,337.0]],"group_id": null,"shape_type": "polygon","flags": {}}],"lineColor": [0,255,0,128],"fillColor": [255,0,0,128],"imagePath": "img_001.jpg","imageData": "iVBORw0KGgoAAAANSUhEUgAA...","imageHeight": 600,"imageWidth": 800
}

实验环境

  • Python 3.x (面向对象的高级语言)

Python等比例缩放图片并修改对应的Labelme标注文件

Json文件

{"version":"5.0.1","flags":{},"shapes":[{"label":"1","points":[[551.3333333333339,17],[1144.666666666667,843.6666666666667]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[206.48387096774195,1022.5806451612904],[111,0]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[2364.666666666667,17],[2704.666666666667,1823.666666666667]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[698.272727272727,3475.818181818182],[1167.759862778731,841.8233276157805]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[293.1515151515159,4000.818181818181],[707.363636363636,848.5454545454545]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"4","points":[[109.70967741935465,1025.8064516129032],[193.58064516129025,2103.2258064516127]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[1895.3243243243242,13.513513513513514],[2360.189189189189,1208.1081081081081]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[1654.7837837837842,710.8108108108108],[2351.7692307692305,3007.6923076923076]],"group_id":null,"shape_type":"rectangle","flags":{}}],"imagePath":"1.jpg","imageData":null,"imageHeight":4000,"imageWidth":8320
}

代码实现

  • 此版代码,相较于Python等比例缩放图片并修改对应的Labelme标注文件,将无标注文件的数据集处理方法(异常跳过),也考虑进去了。
import os
import cv2
import jsondef resize_img_equal_proportion(in_img_path,out_img_path,resized_pix):'''in_img_path:图片输入路径out_img_path:图片结果保存路径resized_pix: 缩放后分辨率'''ori_img = cv2.imread(in_img_path) # 读取图片print(ori_img.shape)height, width = ori_img.shape[:2] # 原始分辨率# 等比例缩放到pix=400scale = resized_pix / height# 缩放后分辨率resized_height = resized_pix resized_width = int(width * scale)img = cv2.resize(ori_img, (resized_width, resized_height))print(img.shape)cv2.imwrite(out_img_path, img)return resized_height,resized_width,scaledef alter_json_equal_proportion(img_name,in_json_path,out_json_path,resized_height,resized_width,scale):'''in_json_path: json文件输入路径out_json_path: json文件保存路径resized_height: 缩放后的高resized_width: 缩放后的宽scale: 图片缩放比例'''file_in = open(in_json_path, "r", encoding='utf-8')# json.load数据到变量json_datajson_data = json.load(file_in)# 修改json中的内容json_data["imageHeight"] = resized_heightjson_data["imageWidth"] = resized_widthjson_data["imagePath"] = img_namefor LabelBox in json_data['shapes']:for point in LabelBox['points']:point[0] = point[0]*scalepoint[1] = point[1]*scalefile_in.close()# 创建一个写文件file_out = open(out_json_path, "w", encoding='utf-8')# 将修改后的数据写入文件file_out.write(json.dumps(json_data))file_out.close()if __name__ =="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'out_dir_name = 'output/'if not os.path.exists(out_dir_name):os.mkdir(out_dir_name)img_name_list = os.listdir(in_img_dir)# print(img_name_list)json_name_list = os.listdir(in_json_dir)# print(json_name_list)img_list  = [i for i in img_name_list if i.endswith('.jpg') or i.endswith('.bmp') or i.endswith('.png') ] # print(img_list)json_list = [i for i in json_name_list if i.endswith('.json')]# print(json_list)for img_name in img_list:try:# print(img_name)in_img_path =in_img_dir +  img_name # 获取文件路径in_json_path = in_json_dir + img_name[:-4]+'.json'out_img_path = out_dir_name +  img_nameout_json_path = out_dir_name + img_name[:-4]+'.json'print(out_img_path,out_json_path)if os.path.exists(in_json_path): # 输入图片所对应的json文件存在,则为True。resized_height,resized_width,scale = resize_img_equal_proportion(in_img_path,out_img_path,resized_pix=2048)alter_json_equal_proportion(img_name,in_json_path,out_json_path,resized_height,resized_width,scale)except Exception as e:print(e)

输出结果

{"version":"5.0.1","flags":{},"shapes":[{"label":"1","points":[[141.14133333333348,4.352],[293.03466666666674,215.9786666666667]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[52.85987096774194,261.78064516129035],[28.416,0]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[605.3546666666667,4.352],[692.3946666666668,466.85866666666675]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[178.75781818181812,889.8094545454546],[298.94652487135517,215.5067718696398]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[75.04678787878808,1024.2094545454543],[181.08509090909084,217.22763636363635]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"4","points":[[28.08567741935479,262.60645161290324],[49.556645161290305,538.4258064516129]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[485.203027027027,3.4594594594594597],[604.2084324324325,309.2756756756757]],"group_id":null,"shape_type":"rectangle","flags":{}},{"label":"1","points":[[423.62464864864876,181.96756756756758],[602.052923076923,769.9692307692308]],"group_id":null,"shape_type":"rectangle","flags":{}}],"imagePath":"1.jpg","imageData":null,"imageHeight":1024,"imageWidth":841
}
  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • YOLOv8 Ultralytics:使用Ultralytics框架训练RT-DETR实时目标检测模型
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/218105.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nodejs微信小程序+python+PHP血液中心管理平台的设计与实现-计算机毕业设计推荐

在二十一世纪的今天,我国献血总量已经不容小觑,在全国人民的不懈努力下,贫血、缺血的病人已经有了足够的血液保障。与此同时,采血工作和血液入库、出库等工作也日愈繁重。为进一步提高采血工作和血液中心的工作效率,开…

架构设计系列之常见架构(二)

五、DDD(领域驱动设计) 领域驱动设计(Domain-Driven Design,DDD)是一种开发思想,强调将软件系统的注意力集中在业务领域上,将领域视为应用的核心。在架构设计中,DDD 提供了一种不同…

IDEA debug窗口左边工具栏隐藏与显示

今天在debug排查代码的时候一不小心点到哪里,结果变成这样 我们可以这样恢复,右键Debug 点击show Toolbar

Excel实现字母+数字拖拉自动递增,步长可更改

目录 1、带有字母的数字序列自增加(步长可变) 2、仅字母自增加 3、字母数字同时自增 1、带有字母的数字序列自增加(步长可变) 使用Excel通常可以直接通过拖拉的方式,实现自增数字&#xf…

牛客后端开发面试题2

微软2021 1、给你一个凸多边形,你怎么用一条线,把它分成面积相等的两部分 将凸多边形的任意一个顶点作为顶点,然后连接另外两个相邻的顶点,将凸多边形划分成多个三角形。 计算每个三角形的面积,并且累加面积&#xff…

安恒明御安全网关 aaa_local_web_preview文件上传漏洞复现

0x01 产品简介 明御安全网关秉持安全可视、简单有效的理念,以资产为视角,构建全流程防御的下一代安全防护体系,并融合传统防火墙、入侵检测、入侵防御系统、防病毒网关、上网行为管控、VPN网关、威胁情报等安全模块于一体的智慧化安全网关。 0x02 漏洞概述 明御安全网关在…

[css] flex wrap 九宫格布局

<div class"box"><ul class"box-inner"><li>九宫格1</li><li>九宫格2</li><li>九宫格3</li><li>九宫格4</li><li>九宫格5</li><li>九宫格6</li><li>九宫格7&l…

Axure之动态面板轮播图

目录 一.介绍 二.好处 三.动态面板轮播图 四.动态面板多方式登录 五.ERP登录 六.ERP的左侧菜单栏 七.ERP的公告栏 今天就到这了哦&#xff01;&#xff01;&#xff01;希望能帮到你了哦&#xff01;&#xff01;&#xff01; 一.介绍 Axure中的动态面板是一个非常有用的组…

案例066:基于微信小程序的家政预约设计与实现

文末获取源码 开发语言&#xff1a;Java 框架&#xff1a;SSM JDK版本&#xff1a;JDK1.8 数据库&#xff1a;mysql 5.7 开发软件&#xff1a;eclipse/myeclipse/idea Maven包&#xff1a;Maven3.5.4 小程序框架&#xff1a;uniapp 小程序开发软件&#xff1a;HBuilder X 小程序…

Qt容器QMdiArea 小部件提供一个显示 MDI 窗口的区域

## QMdiArea ## 控件简介 QMdiArea 继承 QAbstractScrollArea。QMdiArea 小部件提供一个显示 MDI 窗口的区域。QMdiArea的功能本质上类似于MDI窗口的窗口管理器。大多数复杂的程序,都使用MDI框架,在 Qt designer 中可以直接将控件 MDI Area 拖入使用。 ## 用法示例 例 qm…

Linux系统中如何开启和配置OpenGauss数据库的远程连接

文章目录 前言1. Linux 安装 openGauss2. Linux 安装cpolar3. 创建openGauss主节点端口号公网地址4. 远程连接openGauss5. 固定连接TCP公网地址6. 固定地址连接测试7. 结语 前言 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍…

「Swift」Xcode多Target创建

前言&#xff1a;我们日常开发中会使用多个环境&#xff0c;如Dev、UAT&#xff0c;每个环境对应的业务功能都不同&#xff0c;但每个环境之间都只存在较小的差异&#xff0c;所以此时可以使用创建多个Target来实现&#xff0c;每个Target对应这个一个App&#xff0c;可以实现一…

(WPF)Serilog 使用demo实例

Serilog 日志效果&#xff1a; 引入的Serilog库文件 实现代码 xaml 代码&#xff1a; <Window x:Class"Wpf_demo_Serilog.MainWindow" xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation" xmlns:x"http://sche…

Python语言学习笔记之十一(DotEnv)

本课程对于有其它语言基础的开发人员可以参考和学习&#xff0c;同时也是记录下来&#xff0c;为个人学习使用&#xff0c;文档中有此不当之处&#xff0c;请谅解。 1、认识Python DotEnv dotenv是Python中的一个工具包&#xff0c;它主要用于谈取项目中的.env文件&#xff0…

语音机器人话术设计重点

要使用语音机器人&#xff0c;首先得要先准备一套业务的话术脚本&#xff0c;这个话术脚本的设计&#xff0c;可能直接决定了语音机器人后续的使用效果。这个脚本的编写一般不是机器人厂家直接能完成的&#xff0c;只有业务的使用方&#xff0c;他们才最了解自己的业务&#xf…

ACT、NAT、NATPT和EASY-IP

目录 一、ACL 1.ACL 2.ACL的两种应用匹配机制 3.ACL的基本类型 4.ACL命令操作 5.ACL实验&#xff1a; 4.ACL的应用原则&#xff1a; 5.匹配原则&#xff1a; 二、NAT 1.NAT的原理及作用&#xff1a; 2.NAT分类 3.NAT配置 三、EASY-ip实验 四、NATPT 五、通配符 …

本地项目添加到gitlab命令操作

gitlab上面创建一个跟项目名同名的文件夹 创建文件夹&#xff0c;填写信息 添加readme文档&#xff0c;先保存下创建的文件夹 回到项目&#xff0c;复制项目的git 地址 然后进入到本地项目的文件夹&#xff0c;如d:/workspace/spring-demo&#xff0c;右键打开git bash弹框 命令…

浅入浅出理解MySQL和InnoDB

目录 数据库的定义 数据库和实例 MySQL 的架构 数据的存储 如何存储表 如何存储记录 数据页结构 索引 索引的数据结构 聚集索引和辅助索引 索引的设计 锁 并发控制机制 锁的种类 锁的粒度 锁的算法 死锁的发生 事务与隔离级别 几种隔离级别 脏读 不可重复读 幻读 总结 Innodb与…

对BIOS进行简单快速的设置更改,就能启用安全引导来安装Windows 11

本文介绍如何在UEFI/BIOS中启用安全引导&#xff0c;以便继续安装Windows 11。 如何启用安全引导 启用安全引导最简单的方法是通过UEFI/BIOS进行。它通常被列为BIOS中的众多选项之一&#xff0c;因此你只需打开它即可启用它。 1、启动&#xff0c;或重新启动你的电脑或笔记本…

【Android】在Android上使用mlKit构建人脸检测程序

在Android上构建人脸检测程序 目录 1、导入mlKit依赖包2、配置人脸检测器并且获取人脸检测器3、加载图片资源4、调用人脸检测器5、绘制矩形边框6、完整代码7、效果展示 1、导入mlKit依赖包 dependencies {// ...// Use this dependency to bundle the model with your appi…