YOLOv8环境搭建、创建数据集、训练推理教程(超级详细)

yolov8和yolov10 是一个流派,和yolov5区别还挺大,所以尝试使用yolov8来进行模型训练,下面是详细使用流程:

一、环境搭建

1.1 Anaconda安装

Anaconda是一个强大的开源数据科学平台,它将很多好的工具整合在一起,极大地简化了使用者的工作流程,并能够帮助使用者解决一系列数据科学难题。anaconda安装在windows上安装简单,在Linux系统如麒麟系统还需要做一些权限设置,如sduo chmod +x命令。

Win+R输入cmd命令弹出对话框后输入命令,验证Anaconda是否安装成功

conda --version
conda info
python
exit()

具体安装步骤可参考:

Anaconda安装-超详细版(2023)_anaconda安装哪个版本好-CSDN博客

1.2创建虚拟环境

在anaconda中,可以为每个项目创建独立的环境,确保项目之间的依赖关系互不干扰,也避免包冲突问题,例如yolov5项目就单独创建yolov5的环境,yolov8就单独创建yolov8的独立环境。

启动Anaconda,创建yolov8独立环境,命令如下:

(1)查看当前有哪些环境

conda env list

(2)创建新的独立环境,一般python版本>=3.8,需要等待一段时间,还要手动选择“y”继续安装

conda create -n yolov8 python=3.8.10

(3)激活yolov8环境

conda activate yolov8

(4)查看当前安装了哪些依赖

pip list 

 (5)安装项目的requirement.txt依赖文件,可用豆瓣加速器下:https://pypi.douban.com/simple

 pip install -r requirements.txt  -i https://pypi.douban.com/simple

(6)退出当前环境

conda deactivate 

1.3安装CUDA

CUDA是NVIDIA发明的并行计算平台和编程模型。它通过利用图形处理单元 (GPU) 的强大功能,大幅提高计算性能。简单来说,CUDA 是一个通用的GPU编程平台,而cuDNN则是基于CUDA之上的一个专门用于深度学习的优化库。安装前提:必须有一块支持CUDA的英伟达显卡,如果电脑没有英伟达显卡,那没办法使用。

首先,Win+R输入cmd命令弹出对话框后输入命令,查看显卡驱动最高支持的CUDA版本。若版本过低需要更新显卡驱动地址

nvidia-smi

CUDA下载地址,点击CUDA Toolkit 11.8.0跳转页面后依次选择 。

Win+R输入cmd命令弹出对话框后输入命令,验证cuda是否安装成功

nvcc -V

具体安装步骤参考:cuda和cudnn的安装教程(全网最详细保姆级教程)_安装cuda cudnn-CSDN博客

1.4安装CUDNN

NVIDIA CUDA® 深度神经网络库 (cuDNN) 是一个 GPU 加速的深度神经网络基元库,能够以高度优化的方式实现标准例程(如前向和反向卷积、池化层、归一化和激活层)。

cudnn下载网址,选择对应11.x的版本即可,将下载解压后将所有文件拷贝到CUDA目录里即可。

 安装步骤参考:cuda和cudnn的安装教程(全网最详细保姆级教程)_安装cuda cudnn-CSDN博客

1.5安装pytorch

pytorch官网地址,找到cuda11.X对应的命令进行安装。

安装时需要激活yolov8环境,在里面进行安装:

1.6Pycharm工具安装和配置

安装地址:Download PyCharm: The Python IDE for data science and web development by JetBrains

可下载社区免费版本。

1.7下载yolov8源代码下载

可以去github官网下载,但是需要梯子,其实国内网站同步更新,可在国内网站进行下载使用:

GitCode - 全球开发者的开源社区,开源代码托管平台

yolov8源码地址往下翻,找到权重文件,点击下载顺便一同放入之前下载的源码里 ,可以下载yolov8s.pt文件放在根目录中。

1.8安装requirements.txt

对于旧版本的yolov8项目,自带的有requirement.txt文件,可以用命令下载相关依赖:

 pip install -r requirements.txt  -i https://pypi.douban.com/simple

对于最新版本的yolov8项目,没有requirement.txt文件,可以在yolov8环境中,输入如下命令:

pip install ultralytics

1.9安装标注工具labelImg

可以重新创建一个LabelImg独立环境,在独立环境中进行单独安装

conda create -n labelImg python=3.8.10
pip install labelImg  https://pypi.mirrors.ustc.edu.cn/simple

 启动Labelmg

LabelImg

如何标注自己的数据集?请参考这个链接:

LabelImg 安装与使用_labelimg安装-CSDN博客
将准备好的图片以.jpg的格式放入images文件夹中
利用labelimg进行标注后将生成的.xml文件保存至Annotations文件夹中

二、创建个人数据集

2.1建数据文件夹

(1)在ultralytics-main目录下新建data文件夹;

(2)再在data目录下新建四个文件夹:Annotations文件夹,images文件夹,ImageSets文件夹,labels文件夹。

其中:

  1. Annotations文件夹存放的是标注图片产生xml文件;
  2. images文件夹存放的是原始图片文件;
  3. ImageSets文件夹是将数据集划分为训练集train.txt、验证集val.txt、测试集test.txt,里面存放的就是用于训练、验证、测试的图片名称;
  4. labels文件夹存放的是图片的txt文件,还会在data文件夹下得到三个包含数据集路径的txt文件,train.txt,test.txt,val.txt这3个txt文件为划分后图像所在位置的绝对路径。

如下图所示:

2.2数据集划分 

在ultralytics-main目录下创建数据集划分类(split.py),运行该类,数据集将进行划分。

import os
import randomtrainval_percent = 0.9
train_percent = 0.9
xmlfilepath = 'data/Annotations'
txtsavepath = 'data/ImageSets'
total_xml = os.listdir(xmlfilepath)num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)ftrainval = open('data/ImageSets/trainval.txt', 'w')
ftest = open('data/ImageSets/test.txt', 'w')
ftrain = open('data/ImageSets/train.txt', 'w')
fval = open('data/ImageSets/val.txt', 'w')for i in list:name = total_xml[i][:-4] + '\n'if i in trainval:ftrainval.write(name)if i in train:ftrain.write(name)else:fval.write(name)else:ftest.write(name)ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

 运行结果如下:

2.3转化数据集格式

在ultralytics-main目录下创建一个voc_label.py文件,运行下面代码后会生成转换后labels文件夹下图片的txt文件。

txt文件是yolo训练使用的专用格式文件,而我们用LabelImg标注产生的文件是xml文件,所以需要把xml文件转换为txt文件。

其中classes字段需要填写自己的训练类别,和xml文件中的<object>下面的<name>标签保持一致,有几个类别就写几个。比如标签是dog,就填写classes = ['dog']

import xml.etree.ElementTree as ET
import os
from os import getcwdsets = ['train', 'val', 'test']
classes = ['填写自己的类别']
abs_path = os.getcwd()
print(abs_path)def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = (box[0] + box[1]) / 2.0 - 1y = (box[2] + box[3]) / 2.0 - 1w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn x, y, w, hdef convert_annotation(image_id):in_file = open('data/Annotations/%s.xml' % (image_id), encoding='UTF-8')out_file = open('data/labels/%s.txt' % (image_id), 'w')tree = ET.parse(in_file)root = tree.getroot()size = root.find('size')w = int(size.find('width').text)h = int(size.find('height').text)for obj in root.iter('object'):# difficult = obj.find('difficult').textdifficult = obj.find('difficult').textcls = obj.find('name').textif cls not in classes or int(difficult) == 1:continuecls_id = classes.index(cls)xmlbox = obj.find('bndbox')b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),float(xmlbox.find('ymax').text))b1, b2, b3, b4 = b# 标注越界修正if b2 > w:b2 = wif b4 > h:b4 = hb = (b1, b2, b3, b4)bb = convert((w, h), b)out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')wd = getcwd()
for image_set in sets:if not os.path.exists('data/labels/'):os.makedirs('data/labels/')image_ids = open('data/ImageSets/%s.txt' % (image_set)).read().strip().split()list_file = open('data/%s.txt' % (image_set), 'w')for image_id in image_ids:list_file.write(abs_path + '/data/images/%s.jpg\n' % (image_id))convert_annotation(image_id)list_file.close()

 2.4创建数据集配置yaml文件

在ultralytics-main目录下创建 yolov8s_demo.yaml,nc和names字段要自己进行填写,names要和2.3的classes字段保持一致。代码内容如下:

train: D:/ultralytics-main/data/train.txt
val: D:/ultralytics-main/data/val.txt
test: D:/ultralytics-main/data/test.txtnc: 5 # 填写类别数names: ["填写自己的类别"]  # 要和voc_label.py中的类别数目顺序一模一样# train,val,test的路径根据自己情况而定

 以上就是创建个人数据集的全部内容。

三、训练数据集

打开pycharm终端,运行以下代码,可以自己修改代码参数:

yolo train data=wheat.yaml model=yolov8s.pt epochs=300 imgsz=640 batch=8 workers=0 device=cpu

其中:

  1. data为yaml配置文件,后边填写自己的配置文件的相对/绝对路径
  2. model为下载的预训练模型,之前下载的 yolov8s.pt 权重文件。
  3. epochs为训练轮数
  4. imagez为训练时ai看到的图片大小,检查大图片建议使用640,小图片可以320 越大越吃性能
  5. batch为一轮训练中每一次放入图片数量,越大越快效果越好,但是对性能要求越高
  6. device为使用的设备,使用cpu练就写cpu,使用显卡大多数都是0 

运行代码后,执行结果如下图所示,开始训练

训练完成后,生成的的权重文件如下图所示:

 

四、模型推理

用刚才自己训练的模型进行推理,model为自己模型的地址,source为测试的图片地址,可自行替换,代码如下:

yolo predict model=yolov8n.pt source='ultralytics/assets/bus.jpg'

 使用代码进行推理:

# -*- coding: utf-8 -*-
from ultralytics import YOLO#导入已经训练好的模型
model=YOLO('runs/detect/train6/weights/best.pt')#图片或视频数据都可以,直接将数据传入接口即可
model.predict('datasets/phoneandmouse/test/images/4543aa199a884d46e28345e3835cc6b1.jpg',save=True)
model.predict('datasets/phoneandmouse/test/images/611576d261acf0f080a0ff226d9687a6.jpg',save=True)
model.predict('datasets/phoneandmouse/test/images/672368864be9e37074513e6e0acf3830.mp4',save=True)

推理结果保存路径:

 

后续继续更新yolov8的训练优化和部署内容。 

期待下次更新吧!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/412819.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为海思招聘-芯片与器件设计工程师-数字芯片方向- 机试题——(共九套)(每套四十题)

华为海思招聘-芯片与器件设计工程师-数字芯片方向- 机试题-题目分享——共九套&#xff08;每套四十题&#xff09; 岗位——芯片与器件设计工程师 岗位意向——数字芯片 真题题目分享&#xff0c;完整版带答案(有答案和解析&#xff0c;答案非官方&#xff0c;未仔细校正&am…

论文阅读:VideoMamba: State Space Model for Efficient Video Understanding

论文地址&#xff1a;arxiv 摘要 为了解决视频理解中的局部冗余与全局依赖性的双重挑战。作者将 Mamba 模型应用于视频领域。所提出的 VideoMamba 克服了现有的 3D 卷积神经网络与视频 Transformer 的局限性。 经过广泛的评估提示了 VideoMamba 的能力&#xff1a; 在视觉领…

Hbuilder创建的项目(uniApp + Vue3)中引入UnoCSS原子css引擎

这里是UnoCSS的官网介绍 UnoCS通过简化和优化CSS的编写过程来提高Web开发的效率和可维护性。好处是&#xff1a; 提升开发效率提升开发效率提高一致性增强灵活性易于维护方便的集成与配置 同时还支持预设变量和规则。这些可参看官网进行配置。Unocss通过其原子化方法、高度的…

第二证券:静态市盈率与动态市盈率有什么区别?

市盈率&#xff08;PE&#xff09;&#xff0c;是指投资者愿意为每一元净利润所支付的价格。 股票的市盈率股票价格&#xff08;P&#xff09;/每股净利润&#xff08;EPS&#xff09;&#xff0c;或者用公司其时总市值/公司上一年总净利润。 动态市盈率与静态市盈率的区别&a…

<数据集>遥感航拍飞机和船舶和识别数据集<目标检测>

数据集格式&#xff1a;VOCYOLO格式 图片数量&#xff1a;19973张 标注数量(xml文件个数)&#xff1a;19973 标注数量(txt文件个数)&#xff1a;19973 标注类别数&#xff1a;2 标注类别名称&#xff1a;[ship,plane] 序号类别名称图片数框数1ship17575416292plane239815…

对比 PDAF、CDAF 和 LAAF 自动对焦技术

深入解析相位检测自动对焦&#xff08;PDAF&#xff09; 相位检测自动对焦&#xff08;PDAF&#xff0c;Phase Detection Auto Focus&#xff09;是一种高效的自动对焦技术&#xff0c;广泛应用于现代数码相机、无反相机和智能手机摄像头中。为了更好地理解 PDAF&#xff0c;我…

基于协同过滤算法的电影推荐系统的设计与实现(论文+源码)_kaic

摘 要 现在观看电影已逐渐成为人们日常生活中最常见的一种娱乐方式&#xff0c;人们通常会在周末或在休息、吃饭时间不由自主地在各种视频软件中搜索当前火热的影视节目。但是现在的视频软件电影推荐功能不够完善&#xff0c;所以需要开发出一套系统来使用户只需要简单操作就能…

华为云征文|部署私有云和文档管理系统 Kodcloud

华为云征文&#xff5c;部署私有云和文档管理系统 Kodcloud 一、Flexus云服务器X实例介绍1.1 云服务器介绍1.2 应用场景1.3 对比普通ECS 二、Flexus云服务器X实例配置2.1 重置密码2.2 服务器连接2.3 安全组配置 三、部署 Kodcloud3.1 Jellyfin 介绍3.2 Docker 环境搭建3.3 Jell…

【智能算法改进】路径规划问题的多策略改进樽海鞘群算法研究

目录 1.算法原理2.改进点3.结果展示4.参考文献5.代码获取 1.算法原理 【智能算法】樽海鞘群算法&#xff08;SSA)原理及实现 2.改进点 无标度网络策略 复杂网络在图论中可以用边和节点表示&#xff0c; Barabasi 等于1999年通过分析大量的数据提出了无标度网络模型. 该网络…

人像比对-人证比对-人脸身份证比对-人脸身份证实名认证-人脸三要素对比-实人认证

​ 人证比对API接口&#xff0c;全称为人脸身份证比对API接口&#xff0c;也被称为人脸实名认证API接口或实人认证API接口。这种接口服务主要用于将提供的人脸图片和对应的身份证照片、姓名、身份证号码进行比对&#xff0c;以此验证用户的身份。以下是关于人证比对API接口的详…

[易聊]软件项目测试报告

一、项目背景 随着互联网发展&#xff0c;各种各样的软件&#xff0c;比如游戏、短视频、购物软件中都有好友聊天功能&#xff0c;这是一个可在浏览器中与好友进行实时聊天的网页程序。“ 易聊 ”相对于一般的聊天软件&#xff0c;可以让用户免安装、随时随地的通过浏览器网页…

UDP英译汉网络词典

这里我们用UDP实现一个简单的英译汉小词典。我们还是仿照前一篇的UDP编程&#xff0c;将各自的组件封装起来&#xff0c;实现高内聚低耦合。 一. 字典翻译功能实现 首先我们将我们的字典知识库放在txt文本中。 apple: 苹果 banana: 香蕉 cat: 猫 dog: 狗 book: 书 pen: 笔 ha…

浮毛粘毛器可以彻底去除吗?独家揭秘值得入手浮毛空气净化器

有没有养猫五年以上还是单猫的铲屎官&#xff1f;能不能分享一下怎么才能控制住不养新猫。 从我养第一只猫开始&#xff0c;每次看到别人家的小幼猫&#xff0c;就控制不住的想养。到现在&#xff0c;家里已经有了7只猫&#xff0c;而前段时间楼下那只小三花又差点让我破例。不…

Keil5 Debug模式Watch窗口添加的监控变量被自动清除

Keil5 Debug模式Watch窗口添加的监控变量被自动清除 问题解决记录 问题描述&#xff1a;每次进入Debug模式时&#xff0c;watch窗口里面上一次调试添加的监控变量都会被全部清掉 如图&#xff1a; 退出Debug模式后&#xff0c;重新进入Debug模式&#xff1a; 解决方法&…

INFO:一种基于向量加权平均的高效优化算法【免费获取Matlab代码】

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2022年&#xff0c;I Ahmadianfar受到基于向量加权平均方法启发&#xff0c;提出了加权平均向量优化算法&#xff08;weIghted meaN oF vectOrs, INFO&#xff09;。 2.算法原理 2.1算法…

在线任务分发系统开发架构分析

在线任务分发系统的架构分析是一个综合性的过程&#xff0c;涉及多个技术层面和功能模块的设计。以下是对在线任务分发系统架构的详细分析&#xff1a; 一、系统概述 在线任务分发系统是一个集任务发布、分配、执行、监控及反馈于一体的综合平台&#xff0c;它通过互联网技术实…

超详细带你学习go高性能web框架----fiber

go-fiber-fast go-fiber 主要定位为一个轻量级、高性能的 Web 框架&#xff0c;但其灵活性使得它可以通过与其他库的集成&#xff0c;构建出强大而多功能的应用程序&#xff0c;满足不同的业务需求,和gin一样轻量级别的路由,但是性能特别是极端性能比gin好一些,都可以通过整合其…

【Gradle】window下安装gradle及idea配置

gradle安装与配置 背景基本概念下载配置环境变量idea配置构建命令配置全局的镜像仓库 背景 最近在看spring源码时&#xff0c;Spring5 以后都是采用 Gradle 来编译&#xff0c;所以构建源码前先安装 Gradle 环境。 基本概念 Gradle是一个基于Apache Ant和Apache Maven概念的…

优化农业项目流程 10款实用管理系统推荐

国内外主流的 10 款农业建设管理系统对比&#xff1a;PingCode、Worktile、建米农业工程项目管理系统、泛普软件的农业项目管理系统、开创云数字农业管理平台、Trimble Ag Software、Agworld、FarmLogs、Granular、Conservis。 在管理复杂的农业建设项目时&#xff0c;选择合适…

LuaJit分析(三)luajit字节码文件格式

Luajit字节码文件格式的完整信息如上图所示&#xff0c;包括文件头Header和原型Proto&#xff0c;一个原型可以对应lua源码中的一个函数或源文件。一、文件头文件标志&#xff1a;占用三个字节&#xff0c;始终是0x1B4C4A&#xff0c;表示这是一个luajit文件版本&#xff1a;占…