行为识别实战第二天——Yolov5+SlowFast+deepsort: Action Detection(PytorchVideo)

Yolov5+SlowFast+deepsort

一、简介

YoloV5+SlowFast+DeepSort 是一个结合了目标检测、动作识别和目标跟踪技术的视频处理框架。这一集成系统利用了各自领域中的先进技术,为视频监控、体育分析、人机交互等应用提供了一种强大的解决方案。

1. 组件说明:

  • YoloV5: Yolo(You Only Look Once)是一个流行的实时目标检测系统,其第五代版本YoloV5通过深度学习模型快速准确地识别和定位图像中的多个对象。它适用于实时场景,因为可以快速处理图像并给出高精度的结果。
  • SlowFast: 这是一个视频动作识别网络,由 Facebook AI 研究院开发。它通过同时使用两个处理流——一个慢速流捕捉空间特征,一个快速流捕捉时间动态——来识别视频中的动作。这种结构使得SlowFast在处理复杂动作时能够更好地理解视频内容。
  • DeepSort: DeepSort 是一个轻量级的跟踪算法,它在简单的Sort(Simple Online and Realtime Tracking)算法基础上增加了深度学习特征。这使得DeepSort在保持跟踪对象的同时,能够有效处理遮挡和交互场景。

2. 技术运用:

在 YoloV5+SlowFast+DeepSort 集成系统中:

  • YoloV5 负责实时检测视频帧中的对象,为后续的动作识别和目标跟踪提供必要的前处理。
  • SlowFast 接收YoloV5的输出,即识别出的对象,并对这些对象执行动作识别。通过分析对象随时间的动态变化,SlowFast能够判断对象正在进行的动作。
  • DeepSort 则在此基础上进行目标跟踪,通过连续帧中的动作和位置变化,持续跟踪各个对象,即使在复杂场景中也能维持较高的跟踪准确性。

3. 比单独使用SlowFast的优点:

  • 实时性和综合分析:相比于单独的SlowFast,集成系统通过YoloV5提供实时目标检测,可以在每一帧中都识别和标注出目标,而不仅仅是动作识别。这对于需要实时反应和处理的应用来说,提供了更大的灵活性和实用性。
  • 动作和目标的精确跟踪:通过DeepSort,系统不仅可以识别动作,还可以精确地跟踪动作的执行者,即使在目标快速移动或部分遮挡的情况下也能持续追踪。这对于需要长时间监控特定个体或对象的场景尤为重要。

4. 意义:

这种集成的技术方案极大地扩展了视频分析的应用范围,使其不仅限于简单的动作识别,还包括了复杂环境中的实时多目标检测与追踪。对于安全监控、体育比赛分析、交互式媒体等领域,YoloV5+SlowFast+DeepSort 提供了一个高效、精确的工具,能够满足这些领域对实时性、准确性和鲁棒性的高要求。

二、环境配置

环境配置见:行为识别实战第一天——Slowfast行为识别部署-CSDN博客

三、文件准备

下载下面文件备用:

文件分享

 GitHub - Whiffe/yolov5-slowfast-deepsort-PytorchVideo

将 yolov5-master.zip放在yolov5-file,

将SLOWFAST_8x8_R50_DETECTION.pyth放在slowfast_file,

将yolov5l6.pt放在根目录yolov5-slowfast-deepsort-PytorchVideo-main。

 

sudo cp yolov5-file/yolov5-master.zip /home/ps/.cache/torch/hub/master.zipsudo cp slowfast_file/SLOWFAST_8x8_R50_DETECTION.pyth /home/ps/.cache/torch/hub/checkpoints/SLOWFAST_8x8_R50_DETECTION.pyth

四、运行

1.mp4 放在根目录下,

python yolo_slowfast.py --input 1.mp4

最后结果视频保存在output.mp4.

配置好的完整代码分享,100%可以运行:

 https://download.csdn.net/download/qq_34717531/89682626?spm=1001.2014.3001.5503

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/413589.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何通过住宅代理进行高效SSL检查

引言 什么是SSL检查?有哪些内容? 为什么要使用SSL检查? SSL检查是如何进行的? 总结 引言 在现代互联网环境中,SSL/TLS协议已成为确保网络通信安全的基石。随着网络攻击手段的不断演进,仅仅依赖于基础的…

数据中心和算力中心的区别

数据中心(Data Center)和算力中心(Computing Power Center 或 HPC Center)虽然都涉及数据处理和存储,但它们的重点和用途有所不同。下面将详细介绍两者之间的区别: 数据中心(Data Center&#x…

torch、torchvision、torchtext版本兼容问题

1、torch与torchtext版本兼容 参考torchtext PyPI 2、 torch与torchvision版本兼容 参考torchvision PyPI

【最新华为OD机试E卷】最长连续方波信号(200分)-多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-E/D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,…

从跟跑到领跑:AIGC时代国产游戏的崛起与展望

引言 在人工智能技术快速发展的背景下,AIGC(人工智能生成内容)时代的到来正在重新定义游戏产业的未来。人工智能技术,尤其是生成对抗网络(GAN)、自然语言处理(NLP)、深度学习等领域的突破,正在为游戏开发带来前所未有的机会和挑战。这些技术不仅改变了游戏内容的创作…

51单片机-定时器介绍

时间:2024.8.31 作者:Whappy 目的:手撕51 代码: 现象:

UnrealEngine学习(01):安装虚幻引擎

1. 下载安装 Epic Games 目前下载UE引擎需要先下载Epic Games,官网为我们提供了下载路径: https://www.unrealengine.com/zh-CN/downloadhttps://www.unrealengine.com/zh-CN/download 我们点击图中步骤一即可进行下载。 注释:Unreal Engi…

揭秘扩散模型:DDPM的数学基础与代码实现全攻略!

(DDPM) denoising diffusion probabilistic models 理论学习 本文价值 本文是 Diffusion 这一类模型的开山之作,首次证明 diffusion 模型能够生成高质量的图片,且奠定了所有后续模型的基本原理:加噪 --> 去噪。DDPM 模型的效果如下&#x…

驾驭高效编程:一探C++ STL的奥秘

1.什么是STL 2.:STL的版本 2.1:原始版本 2.2:P.J版本 2.3:RW版本 2.4:SGI版本 3:STL的六大组件 4:如何学习STL 5:STL的缺陷 1.什么是STL STL(standdard template library-标准模板库):是C标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包含数据结构与算法软…

海康二次开发学习笔记9-通讯触发及模块列表获取

通讯触发及模块列表获取 模块列表获取 获取流程中所有模块的模块名,添加下拉框用于显示模块名 1. 处理Combox2的DropDown事件 /// <summary>/// 模块列表获取/// </summary>/// <param name"sender"></param>/// <param name"e&q…

OpenCV绘图函数(3)判断点一条直线是否在一个矩形范围内的函数clipLine()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 裁剪线段与图像矩形相交的部分。 cv::clipLine 函数计算出完全位于指定矩形内的线段部分。如果线段完全位于矩形之外&#xff0c;则返回 false。…

【Python报错】AttributeError`:`‘NoneType‘ object has no attribute ‘XXXX‘`

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 引言 在Python编程中&#xff0c;AttributeError是一个常见的错误类型&#xff0c;它表示尝试访问的对象没有该属性。本文将探讨…

Stable Diffusion绘画 | 插件-宽高比调整助手:让计算器毕业

在调整图片宽高时&#xff0c;如果每次都需要用计算器根据比例算好&#xff0c;再手工输入&#xff0c;非常影响效率。 推荐使用以下的插件&#xff0c;来实现高效准确地调整图片宽高比例。 Aspect Ratio Helper 安装地址&#xff1a;https://github.com/thomasasfk/sd-webui…

Spring 是什么

首先我们先看一个例子。以下是代码的结构。 public interface UserDAO {/*** 根据id删除用户*/void deleteById(); } public class UserDAOImplForMySQL implements UserDAO {Overridepublic void deleteById() {System.out.println("使用MySQL数据库删除信息....")…

DexclassLoader读取dex在Android14上遇到问题

报错如下&#xff1a; 在Android 14&#xff08;API 级别 34&#xff09;及以后版本中&#xff0c;DexClassLoader 被进一步限制&#xff0c;只能用于加载只读文件中的代码。这意味着你不能再使用 DexClassLoader 来加载从应用的内部存储空间中读取的文件。 我想通过JNI来修改…

新160个crackme - 043-riijj_cm_20041121

运行分析 除了主程序还有一个dll文件&#xff0c;应该是要加载pf1.dll这个动态链接库运行主程序&#xff0c;需破解Name和Serial&#xff0c;点击注册无反应 PE分析 C程序&#xff0c;32位&#xff0c;无壳 静态分析&动态调试 尝试ida动调加载动态链接库pf1.dll&#xff0c…

【SAM】Segment Anything网络结构详解

Segment Anything网络结构详解 论文链接&#xff1a;http://arxiv.org/abs/2304.02643 代码链接&#xff1a;https://github.com/facebookresearch/segment-anything 一、整体框架 二、图像编码器image encoder 使用一个MAE预训练好的ViT模型&#xff08;ViT-H/16 使用了 14…

如何在JPG文件中隐写数据

概述 最近在做资源管理器背景的一个功能时&#xff0c;需要将信息传递到DLL中去&#xff0c; 主要就是传递一些比较简单的参数&#xff0c;包括图片的契合度&#xff0c;透明度之类的。通信方式有多种&#xff0c;毕竟是练手的功能&#xff0c;就想找一些以前没用过的方式。 …

基于STM32校车安全监控系统的设计(论文+源码+实物)

1 方案设计 根据设计要求&#xff0c;本设计校车安全监控系统的设计以STM32F103单片机作为主控制器&#xff0c;通过MQ传感器实现异常气体的检测&#xff0c;当异常气体浓度异常时会通过继电器打开车窗进行通风&#xff0c;以保证舒适的环境&#xff0c;通过红外传感器用于监…

BUUCTF PWN wp--jarvisoj_level0

第一步 checksec &#xff0c;该题为64位。 分析一下二进制保护机制&#xff1a; Arch: amd64-64-little 这个字段表示二进制程序的架构是 64 位的小端序的 x86-64 架构。小端序意味着低位字节存储在内存中的低地址上&#xff0c;高位字节存储在高地址上。RELRO: No RELRO …