YOLOv1–v11: 版本演进及其关键技术解析

最新消息:Yolo11发布最新版本2024.10

YOLO (You Only Look Once) 是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。

1. YOLOv1 (2016)

发布日期: 2016年6月
作者: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
论文: "You Only Look Once: Unified, Real-Time Object Detection"
项目地址: YOLOv1 GitHub
主要功能:

  • 创新思想:YOLOv1 首次将目标检测任务转化为一个单次前向传播的问题,显著提升了检测速度。
  • 检测速度快:能够以 45 FPS 的速度处理图像,并且有一个更快的版本可以达到 155 FPS。
  • 限制:YOLOv1 在小物体检测上的精度较差,且定位误差较高。

2. YOLOv2 (2017)

发布日期: 2017年12月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLO9000: Better, Faster, Stronger"
项目地址: YOLOv2 GitHub
主要功能:

  • YOLO9000:YOLOv2 被称为 YOLO9000,能够检测 9000 种类别物体。
  • 多尺度训练:通过不同分辨率的训练图像增强模型的鲁棒性。
  • Anchor Boxes:引入 anchor boxes 改进了对小物体的检测能力。

3. YOLOv3 (2018)

发布日期: 2018年4月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLOv3: An Incremental Improvement"
项目地址: YOLOv3 GitHub
主要功能:

  • 改进的网络结构:引入了 Darknet-53 作为主干网络,结合残差网络提高检测精度。
  • 多尺度预测:在不同尺度上进行预测,改善对小物体的检测。
  • 分类器移除:取消了软分类器,使用独立的二元分类器来提高性能。

4. YOLOv4 (2020)

发布日期: 2020年4月
作者: Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
论文: "YOLOv4: Optimal Speed and Accuracy of Object Detection"
项目地址: YOLOv4 GitHub
主要功能:

  • Bag of Freebies 和 Bag of Specials:提出了一系列的免费(Freebies)和特效(Specials)优化策略,大幅提高了模型精度。
  • CSPDarknet53:更高效的主干网络,提升了网络的推理速度和精度。
  • CIoU 损失函数:引入 CIoU 损失,提高了边界框回归的性能。

5. YOLOv5 (2020)

发布日期: 2020年6月
作者: Glenn Jocher
项目地址: YOLOv5 GitHub
主要功能:

  • Pytorch 实现:YOLOv5 转向了 Pytorch 框架,便于开发者使用和扩展。
  • 自动学习的 anchor boxes:通过自适应的 anchor box 学习机制,进一步提高检测效率。
  • 丰富的预训练模型:提供了多种尺寸的预训练模型,满足不同场景的需求。

6. YOLOv6 (2022)

发布日期: 2022年6月
作者: Meituan 技术团队
项目地址: YOLOv6 GitHub
主要功能:

  • 行业应用优化:YOLOv6 是针对行业应用优化的版本,尤其注重推理速度。
  • 改进的网络结构:引入 EfficientRep 带来了更高效的网络架构。
  • 支持部署:优化模型部署性能,适合工业环境中的大规模应用。

7. YOLOv7 (2022)

发布日期: 2022年7月
作者: Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
论文: "YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors"
项目地址: YOLOv7 GitHub
主要功能:

  • 精度和速度的新突破:YOLOv7 在 COCO 数据集上达到了新的速度与精度平衡。
  • 跨尺度特征融合:通过跨尺度的特征融合,提高了对不同尺度物体的检测能力。
  • 动态标签分配:改进了训练过程中的标签分配方式,使得训练效率更高。

8. YOLOv8 (2023)

发布日期: 2023年1月
作者: Ultralytics 团队
项目地址: YOLOv8 GitHub
主要功能:

  • 模块化设计:提供了可定制的模块化设计,方便用户根据需求进行扩展。
  • 自动化训练和优化:内置了多种训练和超参数优化策略,简化了模型调优过程。
  • 集成检测、分割和跟踪:YOLOv8 不仅支持目标检测,还集成了语义分割和目标跟踪功能。

YOLOv9(2024.02)

  • 版本名称: YOLOv9
  • 发布日期: 2024年2月
  • 作者/贡献者: WongKinYiu, 可能还有其他贡献者
  • 项目地址: GitHub - WongKinYiu/yolov9
  • 主要功能:
    • 引入了可编程梯度信息(PGI)的概念。
    • 设计了一种新的轻量级网络架构—基于梯度路径规划的通用高效层聚合网络(GELAN)。
    • 提高了模型的学习能力,并在整个检测过程中保留关键信息。
    • 改进了GhostNet主干网络以提高效率。
    • 融合了Involution新卷积算子来增强上下文信息提取能力。
    • 为道路缺陷检测等特定应用场景引入了DCNv4、自研BSAM注意力机制及极简的神经网络VanillaBlock等技术。
    • 替换MobileNetV2作为主干网络实现轻量化。

10. YOLOv10 (2024.05)

发布日期: 2024.05
作者: 清华大学

论文:https://arxiv.org/pdf/2405.14458
项目地址: https://github.com/THU-MIG/yolov10
主要功能:实时端到端的对象检测。主要是速度和性能方面的提升。

11. YOLOv11 (2024)

发布日期: 2024.09
作者: Ultralytics 团队
项目地址: https://github.com/ultralytics/
主要功能:
Ultralytics YOLO11 is a cutting-edge, state-of-the-art (SOTA) model that builds upon the success of previous YOLO versions and introduces new features and improvements to further boost performance and flexibility. YOLO11 is designed to be fast, accurate, and easy to use, making it an excellent choice for a wide range of object detection and tracking, instance segmentation, image classification and pose estimation tasks.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/436899.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谨防火灾!电瓶车检测算法助力城市/小区/园区多场景安全管理精细化、智能化

随着人工智能技术的快速发展,AI智能分析网关V4在电瓶车检测领域的应用日益广泛。这一技术通过深度学习、计算机视觉等先进算法,实现了对电瓶车及其相关行为的智能识别和分析,为电瓶车的管理和应用提供了强大的技术支持。 一、电瓶车检测算法…

测试用例的进阶二

1. 按开发阶段划分 1.1 测试金字塔 从上到下,对于测试人员代码就是要求越来越低; 从下到上,越来越靠近用户; 从下到上,定位问题的成本越来越高; 1.2 单元测试(Unit Testing) 单元测试是对软件组成单元进…

1.8 物理层下的传输媒体

欢迎大家订阅【计算机网络】学习专栏,开启你的计算机网络学习之旅! 文章目录 1 导引型传输媒体1.1 双绞线1.2 同轴电缆1.3 光缆 2 非导引型传输媒体2.1 无线电微波通信2.2 多径效应2.3 卫星通信2.4 无线局域网 在数据通信系统中,传输媒体是发…

在线PDF怎么转换成JPG图片?分享14种转换操作!

作为一名社畜,俺也经常要将PDF转换为图片格式! 如何进行快速转换,包括电脑端、在线端和手机端,今天俺就测评了50款工具,给你得出了下面这些渠道,不少也是免费的,相信对你有帮助哦! …

25考研咨询周开启,西安电子科技大学是否改考408??

学长这几天帮大家问了西安电子科技大学是否会从833、834、953改考为408? 西电老师回复:根据上级文件要求,招生简章以及专业目录会在网上报名开始前公布,专业课不会又大变动! 因为大家安心复习即可,保证今…

Python 基于 flask 的前程无忧招聘可视化系统,Python大数据招聘爬虫可视化分析

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

谷歌网站收录查询,帮助您快速准确地查询网站在谷歌的收录情况的3个方法

谷歌网站收录查询,帮助您快速准确地查询网站在谷歌的收录情况的3个方法。 一、使用GoogleSearchConsole(谷歌搜索控制台) 1.注册并验证网站 -首先,确保您的网站已注册并验证在GoogleSearchConsole中。这是一个免费的工具&…

2-109 基于matlab-GUI的BP神经网络

基于matlab-GUI的BP神经网络,10种不同分布的数据样本,9种不同的激活函数,可更改升级网络结构参数,对比各种方法参数下的训练测试效果,实时显示预测过程。程序已调通,可直接运行。 下载源程序请点链接&…

C++ 游戏开发

C游戏开发 C 是一种高效、灵活且功能强大的编程语言,因其性能和控制能力而在游戏开发中被广泛应用。许多著名的游戏引擎,如 Unreal Engine、CryEngine 和 Godot 等,都依赖于 C 进行核心开发。本文将详细介绍 C 在游戏开发中的应用&#xff0…

ireport 5.1 中文生辟字显示不出来,生成PDF报字体找不到

ireport生成pdf里文字不显示。本文以宋体中文字不显示为例。 问题:由浅入深一步一步分析 问题1、预览正常,但生成pdf中文不显示 报告模板编辑后,预览正常,但生成pdf中文不显示。以下是试验过程: 先编辑好一个报告单模…

苹果荔枝柠檬梨柿子数据集 水果数据集 树上1500张 带标注 voc yolo 5类

苹果荔枝柠檬梨柿子数据集 水果数据集 树上1500张 带标注 voc yolo 5类 苹果荔枝柠檬梨柿子数据集 名称 苹果荔枝柠檬梨柿子数据集 (Apple, Litchi, Lemon, Pear, Persimmon Dataset) 规模 图像数量:1498张图像。类别:5种水果类别。标注个数&#xff…

成都网安周暨CCS2024 | 大模型安全与产业应用创新研讨活动成功举办

9月11日-12日,作为2024年国家网络安全宣传周成都系列活动的重磅活动之一,CCS 2024成都网络安全系列活动在成都举行。“大模型安全与产业应用创新研讨活动”同期举办,本场活动由百度安全、成都无糖信息联合承办,特邀云安全联盟CSA大…

数据权限的设计与实现系列11——前端筛选器组件Everright-filter集成功能完善2

‍ 筛选条件数据类型完善 文本类 筛选器组件给了一个文本类操作的范例,如下: Text: [{label: 等于,en_label: Equal,style: noop},{label: 等于其中之一,en_label: Equal to one of,value: one_of,style: tags},{label: 不等于,en_label: Not equal,v…

Gin框架简易搭建(3)--Grom与数据库

写在前面 项目地址 个人认为GORM 指南这个网站是相比较之下最为清晰的框架介绍 但是它在环境搭建阶段对于初学者而言不是很友好,尤其是使用mysql指令稍有不同,以及更新的方法和依赖问题都是很让人头疼的,而且这些报错并非逻辑上的&#xf…

【Redis】如何在 Ubuntu 上安装 Redis 5

🥰🥰🥰来都来了,不妨点个关注叭! 👉博客主页:欢迎各位大佬!👈 本期内容主要介绍如何在 Ubuntu 上安装 Redis5 一些碎碎念: 本来这期内容介绍如何在 Centos 安装 Redis …

TypeScript 设计模式之【状态模式】

文章目录 状态模式:优雅切换的交通信号灯状态模式的奥秘状态模式有什么利与弊?如何使用状态模式来优化你的系统代码实现案例状态模式的主要优点状态模式的主要缺点状态模式的适用场景总结 状态模式:优雅切换的交通信号灯 当你站在繁忙的十字路口&#…

Android AMS介绍

注:本文为作者学习笔记,如有误,请各位大佬指点 系统进程运行环境的初始化 Context是一个抽象类,它可以访问application环境的全局信息和各种资源信息和类 context功能: 对Activity、Service生命周期的管理通过Intent发…

Rust 语言开发 ESP32C3 并在 Wokwi 电子模拟器上运行(esp-hal 非标准库、LCD1602、I2C)

文章目录 esp-rs 简介GithubRust 包仓库Rust 教程Wokwi 电子模拟器开发环境Rust 环境esp-rs 环境创建 ESP32C3 项目项目结构编译项目命令运行模拟器ESP32C3 烧录 esp-rs 简介 esp-rs 是一个专注于为 Espressif 系列芯片(如 ESP32、ESP32-S2、ESP32-C3 等&#xff0…

可视化图表与源代码显示配置项及页面的动态调整功能分析

可视化图表与源代码显示配置项及页面的动态调整功能分析 文章目录 可视化图表与源代码显示配置项及页面的动态调整功能分析1.分析图表源代码2.分析源代码显示功能**完整代码参考:** 3.分析源代码显示及动态调整**完整代码参考:** 4.分析代码编辑器及运行…

中国电信解锁万亿参数大模型:TeleAI的创新与突破

首个由万卡集群训练出来的万亿参数大模型,已被一家央企解锁。 具体而言,为了推动纯国产人工智能的探索,带来这条新路径的正是中国电信人工智能研究院(TeleAI)。 该研究院由中国电信集团的CTO、首席科学家兼院长李学龙…