最新消息:Yolo11发布最新版本2024.10
YOLO (You Only Look Once) 是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。
1. YOLOv1 (2016)
发布日期: 2016年6月
作者: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
论文: "You Only Look Once: Unified, Real-Time Object Detection"
项目地址: YOLOv1 GitHub
主要功能:
- 创新思想:YOLOv1 首次将目标检测任务转化为一个单次前向传播的问题,显著提升了检测速度。
- 检测速度快:能够以 45 FPS 的速度处理图像,并且有一个更快的版本可以达到 155 FPS。
- 限制:YOLOv1 在小物体检测上的精度较差,且定位误差较高。
2. YOLOv2 (2017)
发布日期: 2017年12月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLO9000: Better, Faster, Stronger"
项目地址: YOLOv2 GitHub
主要功能:
- YOLO9000:YOLOv2 被称为 YOLO9000,能够检测 9000 种类别物体。
- 多尺度训练:通过不同分辨率的训练图像增强模型的鲁棒性。
- Anchor Boxes:引入 anchor boxes 改进了对小物体的检测能力。
3. YOLOv3 (2018)
发布日期: 2018年4月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLOv3: An Incremental Improvement"
项目地址: YOLOv3 GitHub
主要功能:
- 改进的网络结构:引入了 Darknet-53 作为主干网络,结合残差网络提高检测精度。
- 多尺度预测:在不同尺度上进行预测,改善对小物体的检测。
- 分类器移除:取消了软分类器,使用独立的二元分类器来提高性能。
4. YOLOv4 (2020)
发布日期: 2020年4月
作者: Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
论文: "YOLOv4: Optimal Speed and Accuracy of Object Detection"
项目地址: YOLOv4 GitHub
主要功能:
- Bag of Freebies 和 Bag of Specials:提出了一系列的免费(Freebies)和特效(Specials)优化策略,大幅提高了模型精度。
- CSPDarknet53:更高效的主干网络,提升了网络的推理速度和精度。
- CIoU 损失函数:引入 CIoU 损失,提高了边界框回归的性能。
5. YOLOv5 (2020)
发布日期: 2020年6月
作者: Glenn Jocher
项目地址: YOLOv5 GitHub
主要功能:
- Pytorch 实现:YOLOv5 转向了 Pytorch 框架,便于开发者使用和扩展。
- 自动学习的 anchor boxes:通过自适应的 anchor box 学习机制,进一步提高检测效率。
- 丰富的预训练模型:提供了多种尺寸的预训练模型,满足不同场景的需求。
6. YOLOv6 (2022)
发布日期: 2022年6月
作者: Meituan 技术团队
项目地址: YOLOv6 GitHub
主要功能:
- 行业应用优化:YOLOv6 是针对行业应用优化的版本,尤其注重推理速度。
- 改进的网络结构:引入 EfficientRep 带来了更高效的网络架构。
- 支持部署:优化模型部署性能,适合工业环境中的大规模应用。
7. YOLOv7 (2022)
发布日期: 2022年7月
作者: Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
论文: "YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors"
项目地址: YOLOv7 GitHub
主要功能:
- 精度和速度的新突破:YOLOv7 在 COCO 数据集上达到了新的速度与精度平衡。
- 跨尺度特征融合:通过跨尺度的特征融合,提高了对不同尺度物体的检测能力。
- 动态标签分配:改进了训练过程中的标签分配方式,使得训练效率更高。
8. YOLOv8 (2023)
发布日期: 2023年1月
作者: Ultralytics 团队
项目地址: YOLOv8 GitHub
主要功能:
- 模块化设计:提供了可定制的模块化设计,方便用户根据需求进行扩展。
- 自动化训练和优化:内置了多种训练和超参数优化策略,简化了模型调优过程。
- 集成检测、分割和跟踪:YOLOv8 不仅支持目标检测,还集成了语义分割和目标跟踪功能。
YOLOv9(2024.02)
- 版本名称: YOLOv9
- 发布日期: 2024年2月
- 作者/贡献者: WongKinYiu, 可能还有其他贡献者
- 项目地址: GitHub - WongKinYiu/yolov9
- 主要功能:
- 引入了可编程梯度信息(PGI)的概念。
- 设计了一种新的轻量级网络架构—基于梯度路径规划的通用高效层聚合网络(GELAN)。
- 提高了模型的学习能力,并在整个检测过程中保留关键信息。
- 改进了GhostNet主干网络以提高效率。
- 融合了Involution新卷积算子来增强上下文信息提取能力。
- 为道路缺陷检测等特定应用场景引入了DCNv4、自研BSAM注意力机制及极简的神经网络VanillaBlock等技术。
- 替换MobileNetV2作为主干网络实现轻量化。
10. YOLOv10 (2024.05)
发布日期: 2024.05
作者: 清华大学
论文:https://arxiv.org/pdf/2405.14458
项目地址: https://github.com/THU-MIG/yolov10
主要功能:实时端到端的对象检测。主要是速度和性能方面的提升。
11. YOLOv11 (2024)
发布日期: 2024.09
作者: Ultralytics 团队
项目地址: https://github.com/ultralytics/
主要功能:
Ultralytics YOLO11 is a cutting-edge, state-of-the-art (SOTA) model that builds upon the success of previous YOLO versions and introduces new features and improvements to further boost performance and flexibility. YOLO11 is designed to be fast, accurate, and easy to use, making it an excellent choice for a wide range of object detection and tracking, instance segmentation, image classification and pose estimation tasks.