本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。
原文链接:YOLOv11来了:将重新定义AI的可能性
Ultralytics YOLOv11的问世标志着人工智能领域,尤其是计算机视觉领域的一个突破性时刻。随着 Ultralytics YOLOv11 的发布,人工智能历史上的一个分水岭已经到来。这在计算机视觉领域尤其如此。延续 YOLO(You Only Look Once)系列的强大传统,这一新版本旨在提高实时对象检测和图片分割能力,实现前所未有的效率和性能水平。
https://www.ultralytics.com/zh/blog/ultralytics-yolo11-has-arrived-redefine-whats-possible-in-ai
YOLO 进化简述
YOLO 系列自诞生以来,不断推动着物体检测技术的前沿发展。每次迭代都有实质性的改进:
-
-
YOLOv1(2016):首个将对象检测概念化为单一回归问题的模型。
-
YOLOv2(2017):使用批量标准化和锚框提高精度。
-
YOLOv3(2018):通过更高效的主干架构提高功效。
-
YOLOv4(2020):引入了 Mosaic 数据增强和新颖的损失函数等进步。
-
YOLOv5(2020):强调性能和以用户为中心的功能的增强。
-
YOLOv6(2022):美团开源,专门针对自动配送应用进行了优化。
-
YOLOv7(2022):引入了增强功能,包括姿势估计。
-
YOLOv8(2023):提高了对各种视觉 AI 应用的适应性。
-
Ultralytics 致力于通过结合最先进的方法来提高速度、精度和用户友好性,从而增强 YOLOv11 的进步。
探索 YOLO11
YOLO11 是一种更强大、更灵活的模型,可将计算机视觉提升到新的水平,它为 YOLO 家族开启了新纪元。该模型在计算机视觉任务(如姿势估计和实例分割)的性能和准确性方面比 Ultralytics YOLOv8 有所改进。它的架构经过了微调,功能也得到了扩展。“我们的目标是开发 YOLO11,创建一个为实际应用提供强大功能和实用性的模型,”Ultralytics 创始人兼首席执行官 Glenn Jocher 解释道。由于其精度和效率的提高,它是一种多功能工具,可以根据不同行业的特定需求进行调整。我热切期待 Vision AI 社区将使用 YOLO11 开发和实施独特的解决方案,以提升计算机视觉。
YOLO11支持的计算机视觉任务的概述:
-
-
对象检测:识别并精确定位图片或视频帧中的对象,用边界框勾勒出它们,用于监控、自动驾驶和零售分析等用途。实例分割需要在像素级别识别和勾勒出图像中的离散对象。它对医学成像和制造业缺陷识别等应用大有裨益。
-
图像分类:将整张照片分配到已建立的类别,使其适用于电子商务中的产品分类或野生动物监视等应用。
-
姿势估计:识别图像或视频帧中的某些重要点以监控运动或姿势,有利于健身追踪、运动分析和医疗保健应用。
-
定向物体检测:(OBB)识别具有特定方向角的物体,有助于更准确地定位旋转物体,特别有利于航空成像、机器人和仓库自动化应用。
-
对象跟踪:观察并追踪连续视频帧中对象的动作,这对于众多实时应用来说至关重要。
-
YOLOv11 的主要特点
1. 无与伦比的速度和精度:
YOLOv11 的设计目标是在不牺牲精度的情况下实现快速运行。自动驾驶汽车、安全系统和工业自动化只是实时应用的几个例子,这些应用可以从该模型架构优化的快速推理时间中受益。需要快速决策的情况需要在速度和准确性之间取得平衡。
其次,卓越的物体检测技能。
2. 高级物体检测功能:
YOLOv11 的一个显著改进是其在复杂环境中的物体检测功能。得益于其广泛的特征提取技术,该模型能够容忍遮挡并比早期版本更好地区分重叠物体。拥挤环境中的应用(如城市监控或事件监控)依赖于此功能。
3. 应用多功能性:
-
-
实例分割:区分图像中的各个对象。
-
姿势估计:识别人体姿势以用于体育分析和医疗保健应用。
-
跟踪:跨框架跟踪移动物体,以进行交通监控或库存管理。
-
这种多功能性使 YOLOv11 可应用于从医疗保健到农业的各个领域。
YOLO11 有何不同?
YOLO11 在 YOLOv9 和 YOLOv10 的创新基础上进行了扩展,集成了卓越的架构框架、精炼的特征提取方法和优化的训练协议。YOLO11 以其速度、准确性和效率的出色结合而著称,是 Ultralytics 迄今为止开发的最熟练的模型之一。YOLO11 凭借其增强的设计,提供了卓越的特征提取,能够精确识别图像中的重要模式和细节,从而更正确地捕捉复杂元素,尤其是在困难条件下。
值得注意的是,YOLO11m 在 COCO 数据集上获得了更高的平均精度 (mAP) 得分,尽管使用的参数比 YOLOv8m 少 22%,这使其在不影响性能的情况下具有更高的计算效率。这表明它在以更高的效率运行的同时产生了更精确的结果。此外,YOLO11 的处理速度有所提高,推理时间比 YOLOv10 快了约 2%,使其适用于实时应用。
它旨在管理复杂的活动,同时优化资源利用率并提高广泛模型的性能,使其非常适合严格的 AI 计划。增强管道的改进优化了训练过程,使 YOLO11 能够适应各种任务,无论项目规模如何。
YOLO11 的处理能力极其高效,非常适合部署在云端和边缘设备上,可在多种情况下提供灵活性。YOLO11 不仅是一种增强功能;它是一种明显更精确、更高效、适应性更强的模型,经过优化设计,可应对各种计算机视觉挑战。YOLO11 具有足够的适应性,可适应各种计算机视觉应用,包括自动驾驶、监控、医疗成像、智能零售和工业用例。
详细介绍可参考:
https://www.ultralytics.com/zh/blog/ultralytics-yolo11-has-arrived-redefine-whats-possible-in-ai
THE END !
文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。