轮椅拐杖残疾人检测数据集 4400张 轮椅拐杖 标voc yolo

 轮椅拐杖残疾人检测数据集 4400张 轮椅拐杖 标voc yolo

2

分类名: (图片张数, 标注个数)
whee Ichair: (3766, 4460)
person_ crutch: (682, 693)
总数: (4448, 5153) .
总类(nc): 2类

轮椅拐杖残疾人检测数据集介绍

数据集概述
  • 名称:轮椅拐杖残疾人检测数据集
  • 用途:适用于从图像中检测和分类使用轮椅或拐杖的人
  • 格式:VOC和YOLO格式
  • 图像数量:4,448张
  • 标注数量:5,153个
  • 类别:包括轮椅(whee_chair)和使用拐杖的人(person_crutch)两类
数据集特点
  • 多样性:包含不同姿势、距离、角度的轮椅用户和使用拐杖的人,适应各种环境下的图像。
  • 高质量标注:每个图像都经过精确标注,提供边界框信息,适用于目标检测任务。
  • 实际应用场景:数据来自真实的场景,具有很高的实用价值,可用于无障碍设施设计、智能交通系统等领域。
  • 专注性:专注于轮椅和拐杖用户的检测,适合特定领域的研究和应用。

数据集结构

wheelchair_crutch_dataset/
├── images/  # 存放图像
│   ├── image1.jpg
│   ├── image2.jpg
│   └── ...
├── labels_voc/  # 存放对应的VOC格式标签文件
│   ├── image1.xml
│   ├── image2.xml
│   └── ...
├── labels_yolo/  # 存放对应的YOLO格式标签文件
│   ├── image1.txt
│   ├── image2.txt
│   └── ...
└── README.md  # 数据集说明文档

标注格式

VOC格式

每个图像都有一个对应的XML文件,存储在labels_voc/目录下。XML文件的结构如下:

<annotation><folder>images</folder><filename>image1.jpg</filename><size><width>640</width><height>480</height><depth>3</depth></size><object><name>whee_chair</name><bndbox><xmin>100</xmin><ymin>200</ymin><xmax>300</xmax><ymax>400</ymax></bndbox></object><!-- 更多对象 -->
</annotation>
YOLO格式

每个图像都有一个对应的文本文件,存储在labels_yolo/目录下。文本文件的每一行代表一个检测对象,格式如下:

<class_id> <x_center> <y_center> <width> <height>
  • class_id:类别ID,对应以下类别:
    • 0: whee_chair
    • 1: person_crutch
  • x_center 和 y_center:边界框中心点的归一化坐标(相对于图像宽度和高度)。
  • width 和 height:边界框的宽度和高度的归一化值。

类别统计

  • Whee_chair:
    • 图片张数: 3,766
    • 标注个数: 4,460
  • Person_crutch:
    • 图片张数: 682
    • 标注个数: 693
  • 总数:
    • 图片张数: 4,448
    • 标注个数: 5,153

项目实现

1. 数据加载器
import torch
from torchvision import transforms
from PIL import Image
import osclass WheelchairCrutchDataset(torch.utils.data.Dataset):def __init__(self, img_dir, label_dir, transform=None):self.img_dir = img_dirself.label_dir = label_dirself.transform = transformself.images = [f for f in os.listdir(img_dir) if f.endswith('.jpg') or f.endswith('.png')]def __len__(self):return len(self.images)def __getitem__(self, idx):img_path = os.path.join(self.img_dir, self.images[idx])label_path = os.path.join(self.label_dir, self.images[idx].replace('.jpg', '.txt').replace('.png', '.txt'))image = Image.open(img_path).convert("RGB")with open(label_path, 'r') as f:labels = f.readlines()boxes = []class_ids = []for line in labels:class_id, x_center, y_center, width, height = map(float, line.strip().split())boxes.append([x_center, y_center, width, height])class_ids.append(int(class_id))boxes = torch.tensor(boxes, dtype=torch.float32)class_ids = torch.tensor(class_ids, dtype=torch.int64)if self.transform:image, boxes, class_ids = self.transform(image, boxes, class_ids)return image, {'boxes': boxes, 'labels': class_ids}# 数据增强
transform = transforms.Compose([transforms.Resize((640, 480)),transforms.ToTensor(),
])dataset = WheelchairCrutchDataset(img_dir='wheelchair_crutch_dataset/images', label_dir='wheelchair_crutch_dataset/labels_yolo', transform=transform)
dataloader = torch.utils.data.DataLoader(dataset, batch_size=4, shuffle=True, num_workers=2, collate_fn=lambda x: tuple(zip(*x)))
2. 模型定义与训练

这里以YOLOv5为例展示模型定义和训练过程:

2.1 安装依赖

确保你已经安装了YOLOv5及其依赖库:

pip install -r requirements.txt
2.2 训练脚本
import torch
from yolov5.models.yolo import Model
from yolov5.utils.loss import ComputeLoss
from yolov5.utils.general import non_max_suppression
from utils.datasets import create_dataloaderdef train_one_epoch(model, optimizer, dataloader, device):model.train()for images, targets in dataloader:images = list(image.to(device) for image in images)targets = [{k: v.to(device) for k, v in t.items()} for t in targets]loss_dict = model(images, targets)losses = sum(loss for loss in loss_dict.values())optimizer.zero_grad()losses.backward()optimizer.step()print(f"Loss: {losses.item()}")# 初始化模型
model = Model('yolov5s.yaml')
model.load_state_dict(torch.load('models/yolov5s.pt'), strict=False)
model.to(device)# 优化器
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)# 数据加载器
dataloader = create_dataloader('wheelchair_crutch_dataset/images', 'wheelchair_crutch_dataset/labels_yolo', batch_size=4, img_size=640)# 训练
num_epochs = 10
for epoch in range(num_epochs):train_one_epoch(model, optimizer, dataloader, device)torch.save(model.state_dict(), f'models/wheelchair_crutch_yolov5_epoch_{epoch}.pt')
3. 模型测试
import torch
import cv2
from yolov5.models.yolo import Model
from yolov5.utils.general import non_max_suppressiondef detect_wheelchair_crutch(image_path, model, device):model.eval()image = cv2.imread(image_path)image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)image = cv2.resize(image, (640, 480))image = torch.from_numpy(image).permute(2, 0, 1).float().div(255.0).unsqueeze(0).to(device)with torch.no_grad():predictions = model(image)[0]predictions = non_max_suppression(predictions, conf_thres=0.5, iou_thres=0.4)return predictions# 加载模型
model = Model('yolov5s.yaml')
model.load_state_dict(torch.load('models/wheelchair_crutch_yolov5_best.pt'))
model.to(device)# 预测
predictions = detect_wheelchair_crutch('path/to/image.jpg', model, device)
print(predictions)

项目总结

本项目利用一个大规模的轮椅拐杖残疾人检测数据集,通过图像实现了对使用轮椅和拐杖的人的自动检测。数据集已经调整为VOC和YOLO格式,可以直接用于模型训练。实验结果表明,这些模型在轮椅和拐杖用户检测任务上表现出色,能够有效地辅助无障碍设施设计、智能交通系统等领域的应用。

未来的研究方向包括:

  • 进一步优化模型:探索更高效的网络结构和训练策略,提高检测精度和速度。
  • 扩展应用场景:将该方法应用于其他类型的辅助设备检测任务,如助听器、导盲犬等。
  • 实时检测系统:开发实时检测系统,实现在线监测和预警功能。
  • 多模态融合:结合多种传感器数据(如摄像头、激光雷达等),提高检测的准确性和鲁棒性。

希望这个项目能为轮椅和拐杖用户的检测带来实际的价值,并推动相关技术的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/447058.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Laravel Filament 如何配置多语言支持

演示 一、安装拓展包outerweb/filament-translatable-fields composer require outerweb/filament-translatable-fields配置模型 该套件包含一个名为 HasTranslations 的特性&#xff0c;用于使 Eloquent 模型具备多语言功能。翻译值以 JSON 格式存储&#xff0c;并不需要额外…

【数据采集工具】Flume从入门到面试学习总结

国科大学习生活&#xff08;期末复习资料、课程大作业解析、大厂实习经验心得等&#xff09;: 文章专栏&#xff08;点击跳转&#xff09; 大数据开发学习文档&#xff08;分布式文件系统的实现&#xff0c;大数据生态圈学习文档等&#xff09;: 文章专栏&#xff08;点击跳转&…

ROS2 Jazzy(二) ROS相关工具 概念

以下demo都是出自官方教程urdf_tutorial Link CLI ros2命令行,可以使用ros2 --help来查看指南 ros2 --help # 包括ros2 pkg/topic等等&#xff0c;基础且常用VScode vscode老朋友了&#xff0c;但是要配置好适合ros2开发的vscode&#xff0c;还是有点麻烦的。 配置C语言相关…

ChatTTS在Windows电脑的本地部署与远程生成音频详细实战指南

文章目录 前言1. 下载运行ChatTTS模型2. 安装Cpolar工具3. 实现公网访问4. 配置ChatTTS固定公网地址 前言 本篇文章主要介绍如何快速地在Windows系统电脑中本地部署ChatTTS开源文本转语音项目&#xff0c;并且我们还可以结合Cpolar内网穿透工具创建公网地址&#xff0c;随时随…

使用scss生成旋转圆圈

图片 html代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title>…

Windows下MYSQL8.0如何恢复root权限

误操作把root权限清掉导致数据库无法登录&#xff08;确实很难受&#xff09;&#xff0c;在网上找了很多方法&#xff0c;发现没有很行之有效的方法&#xff0c;在多方尝试终于找到了适合敏感宝宝体质的方法。 C:\Users\Administrator>mysql -u root -P3307 ERROR 1045 (2…

通信工程学习:什么是USB通用串行总线

USB&#xff1a;通用串行总线 USB&#xff0c;全称Universal Serial Bus&#xff08;通用串行总线&#xff09;&#xff0c;是一种外部总线标准&#xff0c;用于规范电脑与外部设备的连接和通讯。以下是关于USB的详细介绍&#xff1a; 一、USB的定义与特点 USB的定义&#xff…

rtsp协议:rtsp协议参数介绍

目的&#xff1a; 实时流协议&#xff08;RTSP&#xff09;用于建立和控制单个或多个时间同步的连续媒体流&#xff0c;例如音频和视频。RTSP 通常不负责实际传输这些连续的媒体流&#xff0c;但可以将连续媒体流与控制流进行交错传输&#xff08;参见第 10.12 节&#xff09;。…

Xcode报错:Undefined symbols,Linker command failed with exit code1

这种编译报错点击Xcode左侧的小红叉这两行点击没反应&#xff0c;不知道具体报错原因怎么弄&#xff1f; 解决办法&#xff1a; 第一步&#xff1a;点周Xcode左侧工具栏的编译log日志按钮 第二步&#xff1a;第一步点击完Xcode左侧出现了编译历史列表&#xff0c;可以看到有报…

每个程序员都应该了解的硬件知识

作者:shizhaoyang 在追求高效代码的路上,我们不可避免地会遇到代码的性能瓶颈。为了了解、解释一段代码为什么低效,并尝试改进低效的代码,我们总是要了解硬件的工作原理。于是,我们可能会尝试搜索有关某个架构的介绍、一些优化指南或者阅读一些计算机科学的教科书(如:计…

taozige/Java语言的Netty框架+云快充协议1.5+充电桩系统+新能源汽车充电桩系统源码

云快充协议云快充1.5协议云快充1.6云快充协议开源代码云快充底层协议云快充桩直连桩直连协议充电桩协议云快充源码 介绍 云快充协议云快充1.5协议云快充1.6云快充协议开源代码云快充底层协议云快充桩直连桩直连协议充电桩协议云快充源码 软件架构 1、提供云快充底层桩直连协…

Kubernetes--深入理解Service与CoreDNS

文章目录 Service功能Service 的常见使用场景 Service的模式iptablesIPVS Service类型ClusterIPNodePortLoadBalancerExternalName Service的工作机制EndpointEndpoint 与 Service 的关系Endpoint 的工作原理命令操作 CoreDNSCoreDNS 的配置CoreDNS 的典型插件Corefile 示例Cor…

msvcr100.dll丢失的解决方法,如何安全下载 msvcr100.dll 文件:完全指南

在使用 Windows 操作系统的电脑上运行某些程序或游戏时&#xff0c;可能会遇到一个常见的错误消息&#xff0c;提示缺少 msvcr100.dll 文件。这个 DLL 文件是 Microsoft Visual C 2010 Redistributable Package 的一部分&#xff0c;对于运行依赖于 C 的软件来说至关重要。如果…

图文深入理解Oracle DB Scheduler(续)-调度的创建

List item 今天是国庆假期最后一天。窗外&#xff0c;秋雨淅淅沥沥淅淅下个不停。继续深宅家中&#xff0c;闲来无事&#xff0c;就多写几篇博文。 本篇承接前一篇&#xff0c;继续图文深入介绍Oracle DB Scheduler。本篇主要介绍调度的创建。 1. 创建基于时间的作业 • 可以…

嵌入式硬件设计:从原理到实践

嵌入式硬件设计&#xff1a;从原理到实践 嵌入式硬件设计在物联网、智能设备、工业自动化等领域中扮演着至关重要的角色。随着技术的发展&#xff0c;越来越多的设备依赖于嵌入式系统进行实时控制与数据处理。本文将详细介绍嵌入式硬件设计的各个方面&#xff0c;从设计原理到…

<Project-8 pdf2tx-MM> Python Flask应用:在浏览器中翻译PDF文件 NLTK OCR 多线程 指定翻译器 改进后的P6

项目概述 名字解释 缩写&#xff1a; pdf2tx-MM pdf file transfer to text content with Multi-threads and Multi-translators pdf2tx-MM 是一个基于 Flask 的 Web 应用程序&#xff0c;提供将 PDF 文件中的内容提取、翻译并展示。使用者上传 PDF 文件&#xff0c;应用程序…

cenos没有ens33网卡或网卡突然消失解决

目录 一、问题 二、解决方案 情况1:一直没有网卡,需要配置,参考往期: 情况2:之前配置成功过,ens33网卡突然没有了,如下解决方案: 三、内容 四、总结 🧐 问题 今天发现服务器连接不上了,然后输入ifconfig发现是没有网卡了,以下是解决方案: 没有ens33网卡: ✅…

全面讲解C++

数据类型 1.1 基本数据类型 1.1.1 整型&#xff08;Integer Types&#xff09; 整型用于表示整数值&#xff0c;分为以下几种类型&#xff1a; int&#xff1a;标准整数类型&#xff0c;通常为4字节&#xff08;32位&#xff09;。short&#xff1a;短整型&#xff0c;通常…

quic-go源码一---server启动

前言&#xff1a; 走马观花地看了RFC 9000:QUIC: A UDP-Based Multiplexed and Secure Transport&#xff0c; 感受不是那么直观&#xff0c;所以再来看看这个协议的golang语言实现&#xff1a;quic-go,加强学习。 https://quic-go.net/docs/quic/quic-go文档 本篇准备的代…

九寨沟,智慧旅游新名片

九寨沟属于自然类景区&#xff0c;以优美的自然风光取胜&#xff0c;景区文化内涵相对缺失。智慧化和文旅融合是智慧文旅景区的两个必备条件&#xff0c;九寨沟在智慧文旅景区建设过程中&#xff0c;经历了两个阶段&#xff0c;先是从传统景区迈向智慧景区&#xff0c;然后是充…