足球、篮球、乒乓球的动作识别通用方案开源

北京冬奥会即将开幕,全民健身如火如荼。2020年夏季奥运会有46项体育项目,2022年冬奥会有15项体育项目,丰富的项目涉及的姿势标准也各有区别。运动员如何科学地进行体育锻炼、准确矫正健身动作?教练员如何借助技术提供更智能化的训练和战术分析?体育视频行业如何高效定位精彩片段,分享更多精彩运动瞬间?“AI+体育”正在交出答卷。

目前,AI 在体育场景上的应用主要集中在动作类型的准确识别及定位上,技术存在如下挑战:

1、体育运动行为复杂度高:体育项目类间方差小、类内方差大,隐蔽性高,当前针对人体动作识别的解决方案在体育类数据集上难以奏效。

2、长视频处理困难:在复杂动作难度基础上,如何从冗长含大量背景信息未经处理的原视频中准确定位并识别短时间内发生的人体动作,也备受业界关注。

PaddleVideo 开源了一套通用的体育类动作识别方案,该方案不仅能准确识别出动作的类型,而且能精确定位出该动作发生的起止时间。这套方案已经在线上业务中得到了充分验证。PaddleVideo 目前已开源其中的足球运动识别算法 FootballAction、篮球运动识别算法 BasketballAction、乒乓球动作识别算法和花样滑冰动作识别算法,其中篮球和足球使用同一套框架。将动作识别出来后,可以方便的实现下游任务,如:动作识别分析、智能评分、智能剪辑、赛事解析等。项目链接:GitHub - PaddlePaddle/PaddleVideo: 基于模块化的设计,提供丰富的视频算法实现、产业级的视频算法优化与应用,包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等,涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。

PaddleVideo 所有源码及教程均已开源,欢迎大家使用,Star 鼓励~

足球/篮球动作识别

FootballAction 基于比赛视频构建数据集,每一条视频时长约40分钟,共包含8个动作类别,分别为:背景、进球、角球、任意球、黄牌、红牌、换人、界外球。方案分为三个组成部分:特征抽取、时序提名生成、动作分类及后处理模块。模型的动作识别准确率达到94%,F1-score 达到82%。

BasketballAction 整体解决方案与 FootballAction 类似,共包含7个动作类别,分别为:背景、进球-三分球、进球-两分球、进球-扣篮、罚球、跳球。世界杯准确率超过90%,F1-score 达到80.14%

乒乓球动作识别与定位

以往为了向运动员提供针对性的技战术分析数据,需要反复查看历史视频,统计分析每个球得失分的原因、每一板使用了什么技术,成功率又是多少。这是一项费时费力、非常辛苦的工作。为此,飞桨联合北京大学构建了基于 500G 以上的比赛视频的标准训练数据集,标签涵盖发球、拉、摆短等8个大类动作。PaddleVideo 开源了包括 Video Swin Transformer 在内的乒乓球动作识别模型和基于 BMN 的动作定位模型。

基于 Video Swin Transformer 的乒乓球动作识别模型,目前动作识别准确率达到了74%以上。

 Video Swin Transformer 特点

基于百度自研的 BMN 在乒乓球挥拍动作定位模型上,对比主流动作定位数据集 SOTA 效果,ActivityNet1.3 – 67.10%, THUMOS14- 43.54%,目前 AUC 精度在验证集上可达72.33%。

花样滑冰动作识别

花样滑冰因其优雅的舞姿,备受年轻人喜爱。但由于舞蹈动作的专业性,非专业选手很难判断运动员们具体的舞蹈动作类型。相较于其他竞技体育,花样滑冰的运动轨迹复杂性强、速度快、类别多,这对识别任务来说是极大的挑战。

2021年飞桨联合中国计算机学会(CCF)举办了第九届 CCF 大数据与计算智能大赛,其中花样滑冰动作识别大赛吸引了300家高校与200家企业超过3800人参赛,冠军方案比基线方案精度提升了12个点,比赛 Top3 方案已经开源。

我们使用基于关节点的行为识别对动作进行识别。花样滑冰锦标赛数据集由专业人员对动作进行标注。对输入视频,首先将其帧率统一,然后使用姿态估计算法提取关节点数据,最后将关节点数据输入时空图卷积网络 ST-GCN 模型中进行动作分类,可以实现30种动作的分类。

算法性能强劲 应用案例丰富

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35767.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电商导购CPS,淘宝联盟如何跟单实现用户和订单绑定

前言 大家好,我是小悟 做过自媒体的小伙伴都知道,不管是发图文还是发短视频,直播也好,可以带货。在你的内容里面挂上商品,你自己都不需要囤货,如果用户通过这个商品下单成交了,自媒体平台就会…

高考英语口语测试软件,练习英语口语的app有哪些

随着国际化的发展,英语越来越普遍。英语中口语也是很重要的成分之一。也是跟老外交流或者英语考试的重要考点之一。我们有很多方法锻炼口语。什么方法最快捷最有效方便?下面我们看看几款最受欢迎的英语口语练习app。 练习口语的app 1、口语侠 一款非常实…

几个常见的语音交互平台的简介和比较

1.概述 最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,或者更确切的说是关键字识别,但开发的平台不同, 一个是windows下的,另一个是android平台的,于是也就选用了不同的语音识别平…

Chatbot UI老外在用的gpt网页版 搭建方法分享!

新建了一个网站 https://ai.weoknow.com/ 每天给大家更新可用的国内可用chatGPT资源 Chatbot UI 高仿ChatGPT官网,中文还支持贼好,界面美观度间距还需要打磨。是老外做的吗? ​ 环境部署 更新环境 apt update -y && apt upg…

小米多模网关通过telnet刷入改版固件,完美接入HASS

一、环境介绍 宿主机:树莓派3B Raspbian系统 HA安装方式:HASS系统使用hass.io一键脚本进行安装 多模网关:ZNDMWG03LM(软件版本v1.4.5_0012) 2、为什么要刷固件 A 、因为要把该多模网关接入到homeassistant&#xf…

国际交流学术英文写作hnu(仅供参考)

本文仅供参考,希望同学们继续加油!

用letax写毕业论文-- 中英文封面

一、中文封面: 中文封面主要是 姓名、专业、指导教师、培养单位 这几项对齐这里比较麻烦, 我是用 tabular 来描述这个部分,然后字数不够的补空格 i.e. \hspace*{0.67em}. 具体实现代码如下: 二、 英文封面 英文封面跟中文封面类…

新手请看这里,如何撰写一篇英文论文

第一次写英文论文,无论是期刊论文、还是会议论文,都是很苦很累的一件事情。 查找文献、阅读文献,当然,主要都得是英文的,再加上真正动手撰写,这些环节都在考验我们的英文阅读和写作能力。 在科研这条路上…

【中英文论文写作——图片和表格】

1. 前言 前期讲了论文头部和正文,接下来分享论文写作之图片和表格,属于锦上添花部分! 2. 图片和表格要求 图标要求:专业性,美观性,简洁性 Chart Suggestions: A Thought Starter (Andrew Abela) 3. 软件推…

ChatGPT能够帮留学生完成毕业论文写作吗?

ChatGPT采用交互式对话界面,根据用户输入的指令以近似人类交流的方式作出回应,自问世以来一直令世人为之惊叹。目前,ChatGPT已成为有史以来用户增长速度最快的应用程序。 与此同时,研究人员对学术写作的关注程度与日俱增。人工智能…

【论文写作】——设置中英文字体

打开文件 点击选项 选择高级 取消中文字体也应用于西文的勾选 然后选中全文,设置中文字体为宋体,设置英文字体为times new Roman。

谷歌学术中英文网址

之前用谷歌学术的时候一直用的是https://scholar.google.com/这个网址,这个是谷歌学术的国外版比较适合生成外文期刊格式的参考文献,如下图所示:   但国内写文献参考格式的时候大多是采用GPT格式,这个在谷歌学术国外版是直接生…

一个典型的语音识别系统

一个典型的语音识别系统 标签: 语音识别 2015-01-05 16:56 3966人阅读 评论(0) 收藏 举报 分类: 自然语言识别研究(9) 版权声明:本文为博主原创文章,未经博主允许不得转载。 一、语音识别技术 转载请表…

语音识别系列1:语音识别Speech recognition综述

目录 1 什么是语声识别VOICE RECOGNITION? 2 语声识别(VOICE RECOGNITION)和语音识别(SPEECH RECOGNITION)有什么区别? 3 语声识别(VOICE RECOGNITION)系统的类型 4 语音识别系统的类型 5 语音识别简…

语音识别-特征提取 (一)

一.语音的产生简介 1.1 发音器官 人体的语音是由人体的发音器官在大脑的控制下做生理运动产生的。人体发音器官由三部分组成:肺和气管、喉、声道。 肺是语音产生的能源所在。气管连接着肺和喉,是肺与声道的联系通道。喉是由一个软骨和肌肉组…

分享本周所学——人工智能语音识别模型CTC、RNN-T、LAS详解

本人是一名人工智能初学者,最近一周学了一下AI语音识别的原理和三种比较早期的语音识别的人工智能模型,就想把自己学到的这些东西都分享给大家,一方面想用浅显易懂的语言让大家对这几个模型有所了解,另一方面也想让大家能够避免我…

如何跟踪语音领域的技术

语音顶会 ICASSP 所有年份论文集下载地址:https://ieeexplore.ieee.org/xpl/conhome/1000002/all-proceedings Interspeech 所有年份论文集下载地址:https://www.isca-speech.org/archive/ 期刊 IEEE Transactions on Audio, Speech and Language Proces…

语音识别(Speech Recognition)综述

文章目录 1. 语音识别的基本单位1.1 Phoneme(音位,音素)1.2 Grapheme(字位)1.3 Word(词)1.4 Morpheme(词素)1.5 bytes 2. 获取语音特征(Acoustic Feature&…

语音识别(一)——概述

概述 虽然现在的语音识别中,DL已经应用的非常广泛了,但是语音识别终究还是有一些领域知识的,将之归类为DL或者ML,似乎都不妥当。特形成本系列文章,用以描述automatic speech recognition的领域知识和传统方法。 说起…

语音识别 特征提取(一)

一.语音的产生简介 1.1 发音器官 人体的语音是由人体的发音器官在大脑的控制下做生理运动产生的。人体发音器官由三部分组成:肺和气管、喉、声道。 肺是语音产生的能源所在。气管连接着肺和喉,是肺与声道的联系通道。喉是由一个软骨和肌肉…