按类别调整目标检测标注框的写入顺序以优化人工审核效率

引言

在目标检测数据标注审核过程中,我们常常会遇到以下情况:某些小目标的检测框嵌套在大目标检测框内,而在模型进行预标注后,这些小目标的框可能被写入到了大目标框的下层。在人工审核阶段,标注审核人员需要手动移动或删除上层的大目标框以调整小目标框的位置,导致效率低下。

为了解决这一问题,我们可以通过自动化调整标注框的写入顺序,使小目标的检测框优先显示在上层,提升人工审核的效率。

本文将通过一个 Python 脚本展示如何实现这一功能,并对代码逻辑进行讲解和优化。

问题描述

在 XML 格式的标注文件中,标注信息是以 object 标签的形式存储的。每个 object 标签包含了目标类别、位置信息等内容。标注框的显示顺序通常与 XML 文件中标签的写入顺序一致。因此,调整标注框的写入顺序即可改变显示顺序。

为了解决小目标框被覆盖的问题,我们需要:

  • 确定需要调整顺序的类别(如小目标类别)。
  • 将这些类别的标注框写入到 XML 文件的后面,从而显示在上层。

代码实现

import os
import xml.etree.ElementTree as ET
from tqdm import tqdm
import xml.dom.minidom as minidomdef reorder_annotation_boxes(xml_folder: str, prioritized_categories: list):"""调整目标检测标注框的顺序,使指定类别的标注框显示在上层。参数:xml_folder (str): 存储标注文件(XML格式)的文件夹路径。prioritized_categories (list): 需要优先显示(后写入)的目标类别列表。"""# 获取文件夹中所有 XML 文件xml_files = [file for file in os.listdir(xml_folder) if file.endswith('.xml')]for xml_file in tqdm(xml_files, desc="Processing XML files"):xml_path = os.path.join(xml_folder, xml_file)# 解析 XML 文件tree = ET.parse(xml_path)root = tree.getroot()# 获取所有目标标注框all_objects = root.findall('object')# 按类别分类标注框prioritized_boxes = [obj for obj in all_objects if obj.find('name').text in prioritized_categories]other_boxes = [obj for obj in all_objects if obj.find('name').text not in prioritized_categories]# 清空原来的标注框for obj in all_objects:root.remove(obj)# 按顺序重新写入标注框for box in other_boxes:  # 非优先类别的框先写入root.append(box)for box in prioritized_boxes:  # 优先类别的框后写入root.append(box)# 使用 minidom 美化并保存 XML 文件xml_str = ET.tostring(root, encoding='utf-8')pretty_xml = minidom.parseString(xml_str).toprettyxml(indent="\t")with open(xml_path, 'w', encoding='utf-8') as output_file:output_file.write(pretty_xml)if __name__ == "__main__":# 输入文件夹路径xml_folder_path = '/data/inxml'# 需要优先显示的类别列表prioritized_categories = ['cls_1', 'cls_2']# 调用函数处理 XML 文件reorder_annotation_boxes(xml_folder_path, prioritized_categories)

总结

本文通过优化目标检测标注框的写入顺序,解决了人工审核中因标注框层级问题造成的低效问题。脚本简单易用,具有良好的扩展性,可以根据不同需求调整优先类别或处理逻辑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/492050.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java学习笔记】多线程基础

并行:同一时刻,多任务同时进行 多任务分别进行 一、线程相关概念 1.程序 是为完成特定任务、用某种语言编写的一组指令的集合。 简单的说:就是我们写的代码 2.进程 (1)进程指的就是运行中的程序,比如我们使用QQ,就…

PyTorch基础入门

目录 前言一、[张量的广播&基本运算](https://www.bilibili.com/video/BV1Gg411u7Lr/?spm_id_from333.999.0.0)1. 张量的广播特性2. 逐点&规约&比较运算 二、张量的线性代数运算1. BLAS & LAPACK2. 矩阵形变及特殊矩阵构造3. 矩阵基本运算4. 矩阵的线性代数运…

XXE靶机攻略

XXE-Lab靶场 1.随便输入账号密码 2.使用bp抓包 3.插入xml代码,得到结果 xxe靶机 1.安装好靶机,然后输入arp-scan -l,查找ip 2.输入ip 3.使用御剑扫描子域名 4.输入子域名 5.输入账号密码抓包 6.插入xml代码 7.使用工具解码 8.解码完毕放入文…

计算机知识笔试

一、计算机网络 1.网络分类 树型、总线型、环型一般是局域网所用的拓扑结构,广域网和远程计算机网络普遍采用网状拓扑结构。 2.OSI模型各层功能 比特、帧、端到端 3.传输层协议 TCP:传输控制协议 UDP:用户数据报协议 传输层、可靠、连接 4.网络层协议 IP协议是…

设计规规范:【App 配色】

文章目录 引言I App 配色组成色彩象征 & 联想II 知识扩展设计流程图UI设计交互设计UI交互设计引言 设计规范,保持设计一致性,提高设计效率。宏观上对内统一,管理与合作变得容易。 按类型管理颜色、文本样式、图标、组件(symbol)。 蓝湖设计规范云 https://lanhuapp.co…

计算生物学与系统生物学

计算生物学 计算生物学是一个利用数学、统计学、计算机科学和生物学知识来解决生物学问题的学科。它的核心目标是通过开发和应用计算方法来分析和解读大量的生物数据,以揭示生命现象的规律和机制。 1. 基因组学分析 计算生物学在基因组学中的应用主要集中在基因的…

timestamp 时间戳转换成日期的方法 | java.util

时间戳通常是一个long数据(注意java中赋值时需要带上L标识是long整型,否则int过长报错) 代码实现 常用工具类: java.util.Datejava.time.Instantjava.time.format.DateTimeFormatter toInstant() 方法的功能是将一个 Date 对象…

【OpenCV计算机视觉】图像处理——平滑

本篇文章记录我学习【OpenCV】图像处理中关于“平滑”的知识点,希望我的分享对你有所帮助。 目录 一、什么是平滑处理 1、平滑的目的是什么? 2、常见的图像噪声 (1)椒盐噪声 ​编辑(2) 高斯噪声 &a…

在IDE中使用Git

我们在开发的时候肯定是经常使用IDE进行开发的,所以在IDE中使用Git也是非常常用的,接下来以IDEA为例,其他的VS code ,Pycharm等IDE都是一样的。 在IDEA中配置Git 1.打开IDEA 2.点击setting 3.直接搜索git 如果已经安装了会自…

数据可视化-1. 折线图

目录 1. 折线图适用场景分析 1. 1 时间序列数据展示 1.2 趋势分析 1.3 多变量比较 1.4 数据异常检测 1.5 简洁易读的数据可视化 1.6 特定领域的应用 2. 折线图局限性 3. 折线图代码实现 3.1 Python 源代码 3.2 折线图效果(网页显示) 1. 折线图…

Linux -- 线程控制相关的函数

目录 pthread_create -- 创建线程 参数 返回值 代码 -- 不传 args: 编译时带 -lpthread 运行结果 为什么输出混杂? 如何证明两个线程属于同一个进程? 如何证明是两个执行流? 什么是LWP? 代码 -- 传 args&a…

es 开启slowlog

在 Elasticsearch 中,slowlog(慢日志)是用来记录查询和索引操作的性能数据,帮助你诊断性能瓶颈。你可以为查询 (search slowlog) 和索引 (index slowlog) 配置慢日志。 数据准备 POST /products/_doc/1 {"product_name&quo…

【韩顺平 Java满汉楼项目 控制台版】MySQL+JDBC+druid

文章目录 功能界面用户登录界面显示餐桌状态预定显示所有菜品点餐查看账单结账退出满汉楼 程序框架图项目依赖项目结构方法调用图功能实现登录显示餐桌状态订座显示所有菜品点餐查看账单结账退出满汉楼 扩展思考多表查询如果将来字段越来越多怎么办? 员工信息字段可…

知道一个服务器IP地址如果attack服务器地址

CSDN提醒:亲爱的用户:你好! 你的账号于2024-12-17 19:04:04在美国美国登录,登录IP为:47.238.159.124。若非本人登录,请及时修改密码。 莫名其妙显示美国登录了我的CSDN博客 卧槽 服务器的IP地址是一个用于…

3大Excel免费功能

推荐几个免费excel图表绘制工具 Power Map Power Map是Excel的内置功能 Power Map可在Windows用户的Excel 2013或者Excel 2016或者Office 365中使用,如下图, 看案例 动态地图1 动态地图2

前端面试问题集合

0 HTML5相关 websocket WebSocket 使用ws或wss协议,Websocket是一个持久化的协议,相对于HTTP这种非持久的协议来说。WebSocket API最伟大之处在于服务器和客户端可以在给定的时间范围内的任意时刻,相互推送信息。WebSocket并不限于以Ajax(或X…

强化学习路径规划:基于SARSA算法的移动机器人路径规划,可以更改地图大小及起始点,可以自定义障碍物,MATLAB代码

一、SARSA算法概述 SARSA(State-Action-Reward-State-Action)是一种在线强化学习算法,用于解决决策问题,特别是在部分可观测的马尔可夫决策过程(POMDPs)中。SARSA算法的核心思想是通过与环境的交互来学习一…

通过基于几何的网格自适应增强 CFD 网格划分

CFD 仿真中的网格质量问题 在 CFD 仿真中,网格质量直接影响分析精度和效率。结构良好的网格可以准确地捕捉物理现象,确保可靠的结果,而质量差会导致错误和代价高昂的设计缺陷。高质量的网格在复杂的几何体中至关重要,因为流体行为…

Dockerfile文件编写

目录 Dockerfile文件编写 1.什么是Dockerfile 2. Dockerfile作用 3.dockerfile 的基本结构: 4.dockerfile指令: FROM 指定基础镜像,dockerfile构建镜像的第一个指令 LABEL 指定镜像维护人信息 ADD/COPY 复制本地文件/目录到镜像中 …

ARM学习(38)多进程多线程之间的通信方式

ARM学习(38)ARM学习(38)多进程多线程之间的通信方式 一、问题背景 笔者在调试模拟器的时候,碰到进程间通信的问题,一个进程在等另外一个进程ready的时候,迟迟等不到,然后通过调试发现,另外一个进程变量已经变化了,但是当前进程变量没变化,需要了解进程间通信的方式…