夜间道路目标检测数据集 5000张 夜间道路 带标voc yolo
夜间道路目标检测数据集 5000张 夜间道路 带标voc yolo
label | pic_ num | box_ num
car: (4907, 43417)
pedestrian: (1039, 3520)
traffic light: (3276, 15271)
traffic sign: (4072, 15821)
bicycle: (155, 233)
bus: (355, 405)
truck: (645, 850)
motorcycle: (101, 116)
rider: (133, 154)
other vehicle: (12, 12)
train: (6, 7)
total: (5000, 79806)
夜间道路目标检测数据集
名称
夜间道路目标检测数据集 (Nighttime Road Object Detection Dataset)
规模
- 图像数量:共5000张图像。
- 类别:包括汽车、行人、交通灯、交通标志等多种常见夜间道路场景的目标。
数据划分
- 训练集 (Train):通常占总数据的80%左右,约4000张图像。
- 验证集 (Validation):通常占总数据的20%左右,约1000张图像。
数据特点
- 夜间环境:专为夜间道路场景设计,挑战模型在弱光条件下的性能表现。
- 标注格式多样:既有VOC XML格式的标注,也有适用于YOLO的TXT格式标注。
应用领域
- 自动驾驶:帮助车辆在夜间环境中准确识别各种物体,提升驾驶安全性。
- 智能交通系统:用于监测夜间道路交通状况。
- 科研应用:为计算机视觉和模式识别领域的研究提供有价值的数据资源。
1. 安装依赖库
首先,确保安装了必要的依赖库。可以在项目目录中的requirements.txt
文件中列出这些依赖库,然后运行以下命令进行安装:
pip install -r requirements.txt
requirements.txt
文件内容示例:
torch==1.10.0
torchvision==0.11.1
pandas==1.3.4
cv2
albumentations==1.1.0
2. 创建数据集
定义一个自定义的数据集类,并创建数据加载器。
import os
import pandas as pd
import cv2
from torch.utils.data import Dataset, DataLoader
from torchvision.transforms import Compose, ToTensor, Normalize, Resize
from albumentations import HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate, BboxFromMasks, BBoxFormatPASCAL
from albumentations.pytorch import ToTensorV2# 自定义数据集类
class NighttimeRoadDataset(Dataset):def __init__(self, data_root, annotations_file, transforms=None):self.data_root = data_rootself.annotations = pd.read_csv(annotations_file)self.transforms = transformsdef __len__(self):return len(self.annotations)def __getitem__(1, idx):img_path = os.path.join(self.data_root, self.annotations.iloc[idx, 0])image = cv2.imread(img_path)bboxes = self.annotations.iloc[idx, 1:].values.reshape(-1, 4) # bounding box coordinateslabels = self.annotations.columns[1:]if self.transforms:augmented = self.transforms(image=image, bboxes=bboxes)image = augmented['image']bboxes = augmented['bboxes']return image, bboxes, labels# 图像预处理
def get_transforms():"""构建预处理函数"""_transform = [Resize(height=416, width=416, interpolation=cv2.INTER_LINEAR),HorizontalFlip(p=0.5),RandomBrightnessContrast(p=0.2),ShiftScaleRotate(p=0.5, shift_limit=0.0625, scale_limit=0.2, rotate_limit=15),Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),ToTensorV2(),BboxFromMasks(format=BBoxFormatPASCAL)]return Compose(_transform)# 创建数据加载器
train_dataset = NighttimeRoadDataset(data_root='path_to_your_train_images',annotations_file='path_to_your_train_annotations.csv',transforms=get_transforms()
)
val_dataset = NighttimeRoadDataset(data_root='path_to_your_val_images',annotations_file='path_to_your_val_annotations.csv',transforms=get_transforms()
)train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)
3. 训练YOLOv5模型
使用YOLOv5进行训练。
!git clone https://github.com/ultralytics/yolov5 # 下载YOLOv5代码仓库
cd yolov5# 使用YOLOv5训练模型
python train.py --weights yolov5s.pt --data path_to_your_data.yaml --name nighttime_road_detection --img 416 --batch 16 --epochs 100 --device 0
- 数据配置文件:创建一个名为
data.yaml
的数据配置文件,其中包含训练和验证数据集的信息。
train: path_to_your_train_images
val: path_to_your_val_images
nc: 10
names: ['car', 'pedestrian', 'traffic light', 'traffic sign', 'bicycle', 'bus', 'truck', 'motorcycle', 'rider', 'other vehicle', 'train']
4. 调整模型
- 超参数调整:根据实际情况调整模型的超参数,例如学习率、批大小等。
- 数据增强:增加数据增强策略,如旋转、缩放、翻转等,以提高模型鲁棒性。
5. 预测与评估
完成训练后,可以使用训练好的模型对新的图片进行预测和评估。
from models.experimental import attempt_load
from utils.datasets import ImageList
from utils.torch_utils import select_device, time_synchronized
from utils.plots import plot_results# 加载模型
device = select_device('0')
model = attempt_load('runs/train/exp/weights/best.pt', map_location=device) # 加载最佳权重# 新建数据集
test_dataset = ImageList('path_to_test_images', transform=get_transforms())
test_loader = DataLoader(test_dataset, batch_size=1, shuffle=False, num_workers=4)# 进行预测
results = []
with torch.no_grad():t0 = time_synchronized()for i, (x, path) in enumerate(test_loader):x = x.to(device) # 将输入图像转换到设备上pred = model(x)[0] # 获取预测结果results += plot_results(pred, path, save=True, show=False) # 绘制预测结果图print(f'Time {time_synchronized("start") - t0:.3f} s')