深度学习在人体动作识别领域的应用：开源工具、数据集资源及趋动云GPU算力不可或缺

深度学习在人体动作识别领域的应用：开源工具、数据集资源及趋动云GPU算力不可或缺

news/2024/12/23 17:52:08/文章来源:https://blog.csdn.net/m0_49711991/article/details/134929923

人体动作识别检测是一种通过使用计算机视觉和深度学习技术，对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息，以便更深入地识别和理解人的活动。

人体动作识别检测的基本步骤包括：

数据采集：收集包含人体动作的图像或视频数据，这可以通过摄像头、深度传感器或其他传感器来完成。
预处理：对采集到的数据进行预处理，包括图像去噪、颜色调整等，以确保输入数据质量。
特征提取：提取图像或视频中的关键特征，例如人体关节点的位置、姿势等信息。
模型训练：使用深度学习模型，如卷积神经网络（CNN）或循环神经网络（RNN），对提取的特征进行训练，使模型能够识别和学习不同的人体动作。
实时检测：部署训练好的模型，对实时图像或视频进行检测，识别人体的姿态和动作。

上述步骤通常需要大规模 GPU 计算的支持。

为了更好地支持研究人员和开发者深入研究动作识别、检测、分类技术，本文将介绍一系列相关的开源工具箱、项目以及数据集资源。这些资源的综合使用将为动作相关技术的发展提供全面而有力的支持。

工具箱

MMSkeleton

MMSkeleton 是由香港中文大学多媒体实验室（MMLab）发布的一个基于骨架动作识别的视频分析开源工具箱，拥有领先的在视频中进行人体骨骼识别的能力，支持框架预训练模型，并提供多数据集。

开源地址：https://github.com/open-mmlab/mmskeleton

MMAction2

MMAction2 同样是由 MMLab 发布的一款基于 PyTorch 的视频理解开源工具箱，是 MMAction 的升级版，目前支持四大主流视频理解任务，分别是 Action Recognition、Skeleton based Action Recognition、Spatio-Temporal Action Detection 和 Temporal Action Localization。MMAction2 支持了 28 类视频理解模型和 22 类视频理解数据集。

开源地址：https://github.com/open-mmlab/mmaction2

PYSKL

PYSKL 是在开源项目 MMAction2 的基础上进行构建的，使用 PYTorch 对骨架数据进行动作识别的工具箱。该工具箱支持多种骨架动作识别算法，包括基于 GCN 和 CNN 方法。

开源地址：https://github.com/kennymckormick/pyskl

数据集

EPIC-KITCHENS-100

EPIC-KITCHENS-100 是一个大规模的有关于厨房内第一视角活动的数据集，也是 Epic-kitchens-55 数据集的扩充版，视频总时长从 55 小时增加到了 100 小时，共包含超过 9 万个动作片段，97 个动词类别和 300 个名词类别。

论文链接：https://arxiv.org/abs/2006.13256

下载地址：https://epic-kitchens.github.io/2023

COIN

COIN 是由清华和美图共同开源的一个大规模视频分析数据集，包含 11827 条教程类视频，涉及日常生活中 12 个领域里的 180 个任务的视频内容。可以用于复杂场景下视频动作时序定位（temporal localization）、视频行为分析与理解问题的研究。

论文链接：https://arxiv.org/abs/1903.02874
下载地址：https://coin-dataset.github.io/

HOLLYWOOD2

HOLLYWOOD2 是一个人类行为动作视频数据集，内含 3669 个剪辑视频，视频总长度约为 20.1 小时，其中包括 12 类不同的人类行为动作，10 个场景，这些视频剪辑内容均来自 69 部好莱坞电影。

动作如：接电话、开车、吃饭、拥抱、接吻等。

场景如：户外、车内、厨房、办公室、商场、酒店等。

下载地址：https://www.di.ens.fr/~laptev/actions/hollywood2/

UCF Sports

UCF Sports 是一个主要关于运动的数据集，收集自 BBC 和 ESPN 的电视新闻，包含 150 段视频剪辑，视频分辨率为 720x480。

运动种类为：Diving、Golf Swing、Kicking、Lifting 、Riding Horse、Running、SkateBoarding、Swing-Bench、Swing-Side、Walking。

下载地址：https://www.crcv.ucf.edu/data/UCF_Sports_Action.php

UCF101

UCF101 数据集收集自 YouTube，是 UCF50 数据集的扩充版，从 50 个动作类别增加到 101 个类别，共 13320 个视频，这些视频都是由用户真实上传的，包含相机运动、各种照明条件、部分遮挡、低质帧等特点。

另外，该数据集主要包括 5 大类动作：人与物体交互，单纯的肢体动作，人与人交互，乐器演奏，体育运动。

下载地址：https://www.crcv.ucf.edu/data/UCF101.php

趋动云作为领先的算力服务提供商，不仅致力于提供灵活而成本可控的算力，同时还具备可扩展的存储解决方案。除此之外，趋动云还为用户提供了丰富多样的数据集资源，包括大规模的动作识别数据集如Kinetics-400和UCF101等。

对于像Kinetics-400这样超过 100GB 的数据集，本地下载和训练需耗费大量时间，而在趋动云上，用户只需一键即可使用，极大地提升了用户的使用体验。

总体而言，GPU 算力在 AI 技术的发展中起到了至关重要的作用。它不仅推动了技术的创新，也为AI技术在各个领域的广泛应用奠定了基础。随着 GPU 算力的不断提升，我们可以期待看到更加强大、智能的动作识别技术，为我们的生活带来更丰富、便捷的体验。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/218318.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

[已解决】uniapp内置插件，editor富文本报错（附quill.min.js、image-resize.min.js文件）

[已解决】uniapp内置插件，editor富文本报错（附quill.min.js、image-resize.min.js文件）

在使用uni-app运行内置插件editor时，无法输入内容，控制台报错原因：查看官网得知，需动态引入quill.min.js、image-resize.min.js文件解决方法： 1.下载quill.min.js、image-resize.min.js到项目static/eidtor文件中链…

阅读更多...

2024生化仪器与实验室装备创新发展论坛将于3月6日济南召开

2024生化仪器与实验室装备创新发展论坛将于3月6日济南召开

2024生化仪器与实验室装备创新发展论坛 2024年3月6日 | 山东国际会展中心一、会议介绍近年来，制药及生物制药行业的高速成长，生化仪器与实验室装备作为科学研究的重要组成部分，同时也在不断的更新和升级。伴随生物制药、CRO等下游行业的…

阅读更多...

js 数组 slice() 浅拷贝与sort()数组的排序

js 数组 slice() 浅拷贝与sort()数组的排序

slice() slice()方法将从数组中浅拷贝指定开始位置和结束位置之间的数组元素到一个新的数组，并返回新数组。结束位置不在浅拷贝的范围 [1, 2, 3, 4, 5].slice(2，3); 结果时 3 从数组第二位开始拷贝 ，到第三位为止注意返回内容是一个数…

阅读更多...

超燃超欢乐！修仙喜剧动画《师兄啊师兄》第二季稳健开播

超燃超欢乐！修仙喜剧动画《师兄啊师兄》第二季稳健开播

12月14日，备受瞩目的《师兄啊师兄》第二季终于稳健开播！首播两集连放，同时第一季全13集限免，不仅便于新观众丝滑入坑，老观众也可以二刷重温，可以说是非常良心了！ 《师兄啊师兄》改编自人气网络小…

阅读更多...

【云原生kubernets】Pod详解

【云原生kubernets】Pod详解

一、Pod介绍 1.1.概念 Pod是kubernetes中最小的资源管理组件，Pod也是最小化运行容器化应用的资源对象。一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的，例如，用于管理Pod运行的State…

阅读更多...

将 Github token 添加至远程仓库

将 Github token 添加至远程仓库

将 Github token 添加至远程仓库后便于每次 push 重复输入的麻烦首先,将已生成的 token 记录(注:生成后的 token 确认后便无法查看只能重新生成)并找到对应的项目 git 本地文件路径下其次,将其与项目所关联,按如下格式配置即可 token 格式类似于 ghp_CAxxxxxxxxxxxxxxxxxGx5j…

阅读更多...

【rabbitMQ】rabbitMQ控制台模拟收发消息

【rabbitMQ】rabbitMQ控制台模拟收发消息

目录 1.新建队列 2.交换机绑定队列 3.查看消息是否到达队列总结： 1.新建队列 2.交换机绑定队列点击amq.fonout 3.查看消息是否到达队列总结： 生产者（publisher）发送消息，先到达交换机，再到队列&…

阅读更多...

微软Microsoft二面面试题分享通过总结（不是标准答案分享

微软Microsoft二面面试题分享通过总结（不是标准答案分享

误打误撞我写的shitty代码当年面试算法开发岗竟然通过了 Background 先说下背景，软件工程本科毕业之后，当年8月到北欧读两年制硕士。面试发生在当年的11月，微软哥本哈根，location在丹麦的哥本哈根lingby（是不是这么…

阅读更多...

【JavaEE】锁的策略

【JavaEE】锁的策略

作者主页：paper jie_博客本文作者：大家好，我是paper jie，感谢你阅读本文，欢迎一建三连哦。本文于《JavaEE》专栏，本专栏是针对于大学生，编程小白精心打造的。笔者用重金(时间和精力)打造&…

阅读更多...

vue中哪些数组的方法可以做到响应式

vue中哪些数组的方法可以做到响应式

Vue2 中为什么直接通过数组的索引修改元素是不会触发视图更新 vue2 为什么不直接监听数组 Vue2 对于数组提供了一些变异方法重写数组方法源码分析定义拦截器将拦截器挂载到数组上面收集依赖扩展：理解Vue2如何解决数组和对象的响应式问题对复杂对象的处理复杂对…

阅读更多...

基于JSP+Servlet+Mysql的建设工程监管信息

基于JSP+Servlet+Mysql的建设工程监管信息

基于JSPServletMysql的建设工程监管信息一、系统介绍二、功能展示1.企业信息列表2.录入项目信息3.项目信息列表四、其它1.其他系统实现五.获取源码一、系统介绍项目名称：基于JSPServlet的建设工程监管信息项目架构：B/S架构开发语言：…

阅读更多...

ubuntu pycharm 死机，如何重启

ubuntu pycharm 死机，如何重启

1. 找出pycharm 进程的id 进入命令行： ps -ef 是查看当前运行的进程值输入 ps -ef 会返回所有当前执行的进程，太多了，过滤一下，找到 pycharm : ps -ef | grep pycharm 2. 使用 kill -s 9 来杀死进程如图所是，…

阅读更多...

HTML基础标签

HTML基础标签

但实际上无论声明为中文还是英文都可以写，中文/英文主要是浏览器在进行调用翻译功能的时候，会按照声明的语言来进行翻译。标签语义： 标签的属性一般都是在第一个标签中定义该标签效果所拥有的属性。即标签的作用是什么 <>标签功能…

阅读更多...

$美食大赛的题解$

美食大赛的题解

目录原题描述： 题目描述： 输入格式： 输出格式： 样例输入： 样例输出： 数据规模： 题目大意： 主要思路： 注： 代码： 原题描述&#xff1a…

阅读更多...

C# WPF上位机开发（crc校验）

C# WPF上位机开发（crc校验）

【声明：版权所有，欢迎转载，请勿用于商业用途。联系信箱：feixiaoxing 163.com】为了验证数据传输的过程中有没有发生翻转，我们在传输报文的同时一般还会添加一个crc校验。对于modbus协议也是一样，它在数据…

阅读更多...

Unity中Shader URP最简Shader框架（整理总结篇）

Unity中Shader URP最简Shader框架（整理总结篇）

文章目录前言一、精简 ShaderGraph 所有冗余代码后的最简 URP Shader二、我们来对比一下 URP Shader 与 BuildInRP Shader 的对应关系与区别1、"RenderPipeline""UniversalPipeline"2、面片剔除、深度测试、深度写入、颜色混合和 BRP 下一致3、必须引入…

阅读更多...

maven工程中读取resources中的资源文件

maven工程中读取resources中的资源文件

maven工程的代码布局如下：在resources下面有一个资源文件test.properties，现在的目标要在Java代码中读取该资源文件中的内容。 test.properties资源文件的内容如下： Java代码如下： package com.thb;import java.io.BufferedR…

阅读更多...

github 学习番外篇

github 学习番外篇

我们可以按照仓库开始的提示提交仓库不知道为什么出现了我用 git branch 查看了一下，竟然没发现分支后来发现是只有commit以后才会显示这个分支后来显示这是因为本地和远程仓库不同步的原因这时候我们就需要git pull 一下发现两个仓库由于不关联不能git…

阅读更多...

【算法】【动规】乘积为正数的最长子数组长度

【算法】【动规】乘积为正数的最长子数组长度

跳转汇总链接 👉🔗算法题汇总链接 1.1 乘积为正数的最长子数组长度 🔗题目链接给你一个整数数组 nums ，请你求出乘积为正数的最长子数组的长度。一个数组的子数组是由原数组中零个或者更多个连续数字组成的数组。请你返回乘积…

阅读更多...

生产派工自动化：MES系统的关键作用

生产派工自动化：MES系统的关键作用

随着制造业的数字化转型和智能化发展，生产派工自动化成为了提高生产效率、降低成本，并实现优质产品生产的关键要素之一。制造执行系统（MES）在派工自动化中发挥着重要作用，通过实时数据采集和智能调度，优化生…

阅读更多...

最新文章

推荐文章