在线教程丨YOLO系列10年更新11个版本,最新模型在目标检测多项任务中达SOTA

YOLO (You Only Look Once) 是计算机视觉领域中最具影响力的实时目标检测算法之一,以其高精度与高效性深受业界青睐,广泛应用于自动驾驶、安防监控、医疗影像等领域。

该模型最早于 2015 年由华盛顿大学研究生 Joseph Redmon 发布,开创了将目标检测视为单一回归问题的先河,实现了端到端的目标检测,并迅速获得了开发者的广泛认可。随后,Alexey Bochkovskiy、Glenn Jocher(Ultralytics 团队)以及美团视觉智能部等团队分别推出了多个重要版本。

截至目前,YOLO 系列模型在 GitHub 上的 Star 数已达数十万,展现了其在计算机视觉领域的影响力。

在这里插入图片描述

YOLO 模型任务示例图

YOLO 系列模型的特点在于其单阶段 (One-Stage) 检测架构,无需复杂的区域候选框生成,能够在单次前向传播中完成目标检测,极大提升了检测速度。相比于传统的双阶段检测器(如 Faster R-CNN),YOLO 具备更快的推理速度,能够实现高帧率图像实时处理,并且优化了硬件适配能力,广泛应用于嵌入式设备和边缘计算场景。

目前,HyperAI超神经官网的「教程」板块已上线 YOLO 系列的多个版本,一键部署即可体验~

本文将在最后以最新版本 YOLOv11 为例为大家讲解一键部署教程。

1、YOLOv2

发布时间:2017 年

重要更新:提出了 Anchor Boxes(锚框),采用 Darknet-19 作为骨干网络,提高了速度和精度。

用 TVM 在 DarkNet 模型中编译 YOLO-V2:

https://go.hyper.ai/LiOio

2、YOLOv3

发布时间:2018 年

重要更新:使用 Darknet-53 作为骨干网络,在保持实时速度的同时显著提高了准确性,提出了多尺度预测(FPN 结构),在检测不同大小的目标和处理复杂图像方面取得了显著改进。

用 TVM 在 DarkNet 模型中编译 YOLO-V3:

https://go.hyper.ai/LiOio

3、YOLOv5

发布时间:2020 年

重要更新:引入自动锚框调整机制,保持了实时检测能力,提高了准确性。采用更轻量化的 PyTorch 实现,使其更易于训练和部署。

一键部署:https://go.hyper.ai/jxqfm

4、YOLOv7

发布时间:2022 年

重要更新:基于扩展高效层聚合网络 (Expanded Efficient Layer Aggregation Network),提高参数利用率和计算效率,以更少的计算资源实现了更好的性能。增加了额外的任务,如 COCO 关键点数据集的姿势估计。

一键部署:https://go.hyper.ai/d1Ooq

5、YOLOv8

发布时间:2023 年

重要更新:采用新的骨干网络,引入新的无锚点 (Ancher-Free) 检测头和损失函数,在平均精度、大小和延迟方面皆优于之前版本。

一键部署:https://go.hyper.ai/Cxcnj

6、YOLOv10

发布时间:2024 年 5 月

重要更新:消除了非最大抑制 (Non-Maximum Suppression, NMS) 要求,减少推理延迟。纳入大核卷积和部分自注意模块,在不增加大量计算成本的情况下提高性能。全面优化了各种组件,提高了效率和准确性。

一键部署 YOLOv10 目标检测:

https://go.hyper.ai/TQH1f

一键部署 YOLOv10 物体检测:

https://go.hyper.ai/RcLWj

7、YOLOv11

发布时间:2024 年 9 月

重要更新:在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

一键部署:https://go.hyper.ai/Nztnq

YOLOv11 一键部署教程

HyperAI 超神经教程板块现已上线「一键部署 YOLOv11」,该教程已经为大家搭建好了环境,无需输入任何命令,点击克隆即可快速体验 YOLOv11 的强大功能!

教程地址:https://go.hyper.ai/Nztnq

Demo 运行

  1. 登录 hyper.ai,在「教程」页面,选择「一键部署 YOLOv11」,点击「在线运行此教程」。

在这里插入图片描述
在这里插入图片描述
2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

在这里插入图片描述

  1. 点击右下角「下一步:选择算力」。

在这里插入图片描述

  1. 页面跳转后,选择「NVIDIA RTX 4090」以及「PyTorch」镜像,用户可以按照自身需求选择「按量计费」或 「包日/周/月」,完成选择后,点击「下一步:审核」。

在这里插入图片描述

  1. 确认无误后,点击「继续执行」,等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁的跳转箭头,即可跳转至 Demo 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

效果演示

  1. 打开 YOLOv11 物体检测 Demo 页面,小编上传了一张动物叠罗汉的图片,调整参数,点击「Submit」,可以看到 YOLOv11 已经精准检测出了图中所有动物。原来右下角还藏着一只小鸟!大家有没有注意到呢~

下方参数分别表示:

  • Model:指选择使用的 YOLO 模型版本。

  • Image Size:输入图像的尺寸,模型在检测时会将图片调整为这个大小。

  • Confidence Threshold:置信度阈值,表示模型在进行目标检测时,只有置信度超过这个设定值的检测结果才会被认为是有效目标。

在这里插入图片描述
在这里插入图片描述
2. 进入实例分割 Demo 页面,上传图片并调整参数后,点击「Submit」,就可以完成分割操作。即使存在遮挡,YOLOv11 也能完成得非常出色,准确分割人物并勾勒出巴士的轮廓。

在这里插入图片描述

  1. 进入物体分类 Demo 页面,小编上传了一张狐狸图片,YOLOv11 即可精准地检测出图片中狐狸具体品种为红狐。

在这里插入图片描述

  1. 进入姿态识别 Demo 页面,上传图片,根据图片调整参数,点击「Submit」,即可完成姿态动作分析。可以看到它准确的分析出了人物夸张的肢体动作。

在这里插入图片描述

  1. 在定向物体检测 Demo 页面,上传图片并调整参数,点击「Submit」,可以识别出物体的具体位置和分类情况。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13317.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IOPS与吞吐量、读写块大小及延迟之间的关系

IOPS(每秒输入/输出操作次数)、吞吐量、读写块大小及延迟是衡量存储系统性能的四个关键指标,它们之间存在密切的关系。以下从多个方面详细说明这些指标之间的关系: 1. IOPS与吞吐量的关系 公式关系:吞吐量&#xff0…

DeepSeek 部署过程中的问题

文章目录 DeepSeek 部署过程中的问题一、部署扩展:docker 部署 DS1.1 部署1.2 可视化 二、问题三、GPU 设置3.1 ollama GPU 的支持情况3.2 更新 GPU 驱动3.3 安装 cuda3.4 下载 cuDNN3.5 配置环境变量 四、测试 DeepSeek 部署过程中的问题 Windows 中 利用 ollama 来…

DeepSeek RAGFlow构建本地知识库系统

学习目标 DeepSeek RAGFlow 构建本地知识库系统 学习内容 下载安装Docker 1.1 Docker 是什么 1.2 下载Docker 1.3 安装Docker配置DockerRAGFlow 配置 3.1 下载RAGFlow 3.2 RAGFlow配置 3.3 启动RAGFlow Docker新建知识库 4.1 查看本机IP 4.2 OLLAMA_HOST 变量配置 4.3 添加模…

11 享元(Flyweight)模式

享元模式 1.1 分类 (对象)结构型 1.2 提出问题 做一个车管所系统,将会产生大量的车辆实体,如果每一个实例都保存自己的所有信息,将会需要大量内存,甚至导致程序崩溃。 1.3 解决方案 运用共享技术有效…

arcgis for js范围内天地图高亮,其余底图灰暗

在GIS地图开发中,有时我们需要突出显示某个特定区域,而将其他区域灰暗处理,以达到视觉上的对比效果。本文将介绍如何使用ArcGIS for JavaScript实现这一功能,具体效果为:在指定范围内,天地图高亮显示&#…

Spring AI + Ollama 实现 DeepSeek-R1 API 服务和调用

随着大语言模型的快速发展,越来越多的开发者开始探索如何将这些强大的推理模型本地化运行。DeepSeek-R1,作为一款性能卓越的开源AI模型,以其低成本和出色的推理能力在技术圈内引起了广泛关注。本文将详细介绍如何使用Ollama部署DeepSeek-R1&a…

Ubuntu 20.04配置网络

1,检查自己网络是否配通。 网络配置成功显示的网络图标 不成功的网络图标 如果看不见网络图标,可以使用ping命令。连接一下百度网。 ping www.baidu.com ping失败的样子 ping成功的样子 2,接下来进入正题,我们开始配置网络。 这…

ElasticSearch入门

目录 1._cat 2.索引一个 document 3.查询document 4.更新document 5.删除document 或 index 6.批量_bulk API 1._cat Get/_cat/nodes 查看所有节点 Get/_cat/indices 查看所有索引(indices :index的复数) Get/_cat/master 查看…

java练习(8)

ps:题目来自力扣 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素。元素的顺序可能发生改变。然后返回 nums 中与 val 不同的元素的数量。 假设 nums 中不等于 val 的元素数量为 k,要通过此题,您需要执行以下操作…

Java常用类

文章目录 包装类(Wrapper)包装类的继承体系装箱和拆箱包装类与String类型的相互转换 String类创建 String 对象的两种方式String 类的常见方法案例演示 StringBuffer类类的继承体系String VS StringBufferStringBuffer构造器String 和 StringBuffer 相互转换StringBuffer 类常见…

算法设计与分析三级项目--管道铺设系统

摘 要 该项目使用c算法逻辑,开发环境为VS2022,旨在通过Prim算法优化建筑物间的连接路径,以支持管线铺设规划。可以读取文本文件中的建筑物名称和距离的信息,并计算出建筑物之间的最短连接路径和总路径长度,同时以利用…

【C语言系列】深入理解指针(5)

深入理解指针(5) 一、sizeof和strlen的对比1.1sizeof1.2strlen1.3sizeof和strlen的对比 二、数组和指针笔试题解析2.1 一维数组2.2 字符数组2.2.1代码1:2.2.2代码2:2.2.3代码3:2.2.4代码4:2.2.5代码5&#…

设计模式——策略模式

设计模式——策略模式 简单介绍一个例子 策略模式是设计模式里面比较简单的设计模式,其特点简单又实用,并且可以让你的代码看起来高大上,维护代码时还方便扩张 多重条件语句不易维护,而使用策略模式可以避免使用多重条件语句&…

【玩转 Postman 接口测试与开发2_018】第14章:利用 Postman 初探 API 安全测试

《API Testing and Development with Postman》最新第二版封面 文章目录 第十四章 API 安全测试1 OWASP API 安全清单1.1 相关背景1.2 OWASP API 安全清单1.3 认证与授权1.4 破防的对象级授权(Broken object-level authorization)1.5 破防的属性级授权&a…

MySQL的 MVCC详解

MVCC是多版本并发控制,允许多个事务同时读取和写入数据库,而无需互相等待,从而提高数据库的并发性能。 在 MVCC 中,数据库为每个事务创建一个数据快照。每当数据被修改时,MySQL不会立即覆盖原有数据,而是生…

【Uniapp-Vue3】z-paging插件组件实现触底和下拉加载数据

一、下载z-paing插件 注意下载下载量最多的这个 进入Hbuilder以后点击“确定” 插件的官方文档地址: https://z-paging.zxlee.cn 二、z-paging插件的使用 在文档中向下滑动,会有使用方法。 使用z-paging标签将所有的内容包起来 配置标签中的属性 在s…

UG NX二次开发(Python)-API函数介绍与应用实例(三)-UFLayer类操作

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1 前言2、UFLayer类说明3、获取当前工作图层4、移动对象到特定的图层1 前言 采用Python语言进行UG NX二次开发的帮助材料很少,采用录制的方法是一种比较容易实现的方式,但是使用UFun函数更容易上…

免费PDF 转换成 Word、PPT、Excel 格式的工具

在当今数字化办公的时代,文件格式的转换需求日益频繁。我们的软件应运而生,它是一款专业的 PDF 转换成 Word、PPT、Excel 格式的工具,为您的办公流程带来极大便利。 下载地址:https://pan.quark.cn/s/8c42ac2e4bf5 核心功能&…

deepseek从网络拓扑图生成说明文字实例

deepseek对话页面中输入问题指令: 我是安全测评工程师,正在撰写系统测评报告,现在需要对系统网络架构进行详细说明,请根据附件网络拓扑图输出详细说明文字。用总分的段落结构,先介绍各网络区域,再介绍网络…

排序算法--希尔排序

希尔排序是插入排序的改进版本,适合中等规模数据排序,性能优于简单插入排序。 // 希尔排序函数 void shellSort(int arr[], int n) {// 初始间隔(gap)为数组长度的一半,逐步缩小for (int gap n / 2; gap > 0; gap …