图片速览 PoseGPT：基于量化的 3D 人体运动生成和预测(VQVAE)

图片速览 PoseGPT：基于量化的 3D 人体运动生成和预测(VQVAE)

news/2024/11/24 8:48:13/文章来源:https://blog.csdn.net/ResumeProject/article/details/135060743

paper	code
https://arxiv.org/pdf/2210.10542.pdf	https://europe.naverlabs.com/research/computer-vision/posegpt/

方法将动作压缩到离散空间。使用GPT类的模型预测未来动作的离散索引。使用解码器解码动作得到输出。
效果提出的方法在HumanAct12（一个标准但小规模的数据集）以及BABEL（最近的大规模MoCap数据集）和GRAB（人-物体交互数据集）上取得了最先进的结果。

方法总览

PoseGPT 生成一个人体运动序列，以动作标签、持续时间 $T$ 为条件(观察到的过去人类运动为可选条件）。类似GPT[54]的模型G按顺序预测离散的潜在指数，这些指数使用解码器D解码为生成的人体运动。当也对过去的人体运动进行调节时，输入的人体运动用 E 编码，并使用 $q(\cdot)$ 量化到离散潜在空间中。

在这里插入图片描述

实现细节

VQVAE

潜在空间的离散性和压缩性使类似 GPT 的模型能够专注于长距离信号，因为它消除了输入信号中的低级冗余。编码器 E 将人体运动 p 映射到潜在表示 $\hat z$ ，然后使用码本 $\mathcal Z$ 对其进行量化。解码器 D 从量化的潜在序列 $z_q$ 重建人体运动 $\hat p$ 。
在这里插入图片描述

Attention

屏蔽注意力图 :在编码器中屏蔽注意力图会导致模型可以根据过去的观察结果进行调节。在解码器中屏蔽注意力图也允许模型进行在线预测。
在这里插入图片描述

未来运动预测

在离散潜在空间中，自回归转换器模型 G 根据前一个潜在指数预测下一个潜在指数。我们以人体动作标签、序列持续时间和观察到的运动为条件。
在这里插入图片描述

结果

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/220267.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

KSP音频抓包

KSP音频抓包

1. 按照网上其他教程，安装KSP抓音频 Biu~笔记：高通蓝牙ADK（38）-- KSP in MDE - 大大通(简体站) Biu~笔记：高通蓝牙ADK（22）--DSP音频链路监听 - 大大通(简体站) <<Biu~笔记：高…

阅读更多...

RabbitMQ入门指南(二)：架构和管理控制台的使用

RabbitMQ入门指南(二)：架构和管理控制台的使用

专栏导航 RabbitMQ入门指南从零开始了解大数据目录专栏导航前言一、RabbitMQ架构二、RabbitMQ管理控制台的使用 1.Exchange交换机 2.Queue队列 3.绑定Exchange交换机和Queue队列 4.发送消息 5.数据隔离总结前言 RabbitMQ是一个高效、可靠的开源消息队列系统…

阅读更多...

微信小程序 - 龙骨图集拆分

微信小程序 - 龙骨图集拆分

微信小程序 - 龙骨图集拆分注意目录结构演示动画废话一下业务逻辑注意点龙骨JSON图集结构源码分享dragonbones-split.jsdragonbones-split.jsondragonbones-split.wxmldragonbones-split.wxssimgUtil.js 参考资料注意只支持了JSON版本目录结构演示动画 Spine播放器1.5.…

阅读更多...

C语言-数组指针笔试题讲解(1)-干货满满！！！

C语言-数组指针笔试题讲解(1)-干货满满！！！

文章目录 ▶️1.sizeof和strlen的对比💯➡️1.1 sizeof是什么？💯➡️1.2sizeof用法举例💯▶️1.3strlen是什么？💯▶️1.4 strlen函数用法举例：💯▶️1.5 strlen和sizeof的对比&#…

阅读更多...

栈（C语言版）

栈（C语言版）

一.栈的概念及结构栈：一种特殊的线性表，其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守后进先出 LIFO （ Last In First Out ）的原则。…

阅读更多...

人工智能数据挖掘：发掘信息的新境界

导言人工智能数据挖掘作为信息时代的利器，通过智能算法和大数据技术的结合，为企业、学术研究和社会决策提供了前所未有的洞察力。本文将深入探讨人工智能在数据挖掘领域的应用、技术挑战以及对未来的影响。 1. 人工智能数据挖掘的基本原理数…

阅读更多...

回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型（多指标，多图）

回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型（多指标，多图）

回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型 （多指标，多图） 目录回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型 &a…

阅读更多...

CSS3 2D变形过渡动画

CSS3 2D变形过渡动画

transform(2D变形)概述translate()平移scale()缩放skew()倾斜rotate()旋转transform-origin中心原点 CSS3 2D变形 3D变形过渡动画在CSS3中，动画效果包括4个部分：变形（transform）、3D变形、过渡（transit…

阅读更多...

数据结构(Chapter Two -02)—顺序表基本操作实现

数据结构(Chapter Two -02)—顺序表基本操作实现

在前一部分我们了解线性表和顺序表概念，如果有不清楚可以参考下面的博客： 数据结构(Chapter Two -01)—线性表及顺序表-CSDN博客首先列出线性表的数据结构： #define MaxSize 50 //定义顺序表最大长度 typedef struct{ElemType data…

阅读更多...

数据可视化---双Y轴折线图比较

数据可视化---双Y轴折线图比较

内容导航类别内容导航机器学习机器学习算法应用场景与评价指标机器学习算法—分类机器学习算法—回归机器学习算法—聚类机器学习算法—异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统…

阅读更多...

＜软考高项备考＞《论文专题 - 15 资源管理（一）》

＜软考高项备考＞《论文专题 - 15 资源管理（一）》

1 写作要点过程定义、作用写作要点、思路规划资源管理是定义如何估算、获取、管理和利用团队以及实物资源的过程。作用:根据项目类型和复杂程度确定适用于项目资源的管理方法和管理程度。资源管理计划的内容、编写的原则（考虑资源竞争、稀缺资源、争取资源等&…

阅读更多...

SQL进阶理论篇（十二）：InnoDB中的MVCC是如何实现的？

SQL进阶理论篇（十二）：InnoDB中的MVCC是如何实现的？

文章目录简介事务版本号行记录的隐藏列Undo LogRead View的工作流程总结参考文献简介在不同的DBMS里，MVCC的实现机制是不同的。本节我们会以InnoDB举例，讲解InnoDB里MVCC的实现机制。我们需要掌握这么几个概念： 事务版本号行记录的隐藏…

阅读更多...

TrustZone之其他设备及可信基础系统架构

TrustZone之其他设备及可信基础系统架构

一、其他设备最后，我们将查看系统中的其他设备，如下图所示：我们的示例TrustZone启用的系统包括一些尚未涵盖的设备，但我们需要这些设备来构建一个实际的系统。 • 一次性可编程存储器（OTP）或保险丝这些是一旦写入就无法更改的存储器。与每个芯片上都包含相同…

阅读更多...

基础算法(3):排序(3)插入排序

基础算法(3):排序(3)插入排序

1.插入排序实现插入排序的工作原理是：通过构建有序序列，对于未排序数据，在已经排序的序列从后向前扫描，找到位置并插入，类似于平时打扑克牌时，将牌从大到小排列，每次摸到一张牌就插入到正确的位…

阅读更多...

202352读书笔记｜踪迹——在繁星般的黄的交错里，秦淮河仿佛笼上了一团光雾

202352读书笔记｜踪迹——在繁星般的黄的交错里，秦淮河仿佛笼上了一团光雾

《踪迹》朱自清，因为春，匆匆，背影，疯狂入坑。学生时代，我的语文并不好，可害怕写作文了。对于文章/古文/诗都是比较浅显的学习，从未探究深意，可以说并没有学明白。是比较跳脱而表面的…

阅读更多...

Docker 的基本概念、优势、及在程序开发中的应用

Docker 的基本概念、优势、及在程序开发中的应用

Docker 是一种容器化平台，它通过使用容器化技术，将应用程序及其依赖性打包到一个独立的、可移植的容器中，从而实现应用程序的快速部署、可靠性和可扩展性。下面是 Docker 的一些基本概念和优势：容器：Docker 使用容器化技术，将应用程序及其依赖性打包到一个可移植的容器…

阅读更多...

不做数据采集，不碰行业应用，专注数字孪生PaaS平台，飞渡科技三轮融资成功秘诀

不做数据采集，不碰行业应用，专注数字孪生PaaS平台，飞渡科技三轮融资成功秘诀

12月15日，飞渡科技在北京举行2023年度投资人媒体见面会，全面分享其产品技术理念与融资之路。北京大兴经开区党委书记、管委会主任常学智、大兴经开区副总经理梁萌、北京和聚百川投资管理有限公司（以下简称“和聚百川”）投资总监严…

阅读更多...

ChatGPT使用：一个发包机器人的提示词

ChatGPT使用：一个发包机器人的提示词

发包机器人： 设想：目前项目组有n条打包线会输出多个包，用户想获取最新的包是比较困难的，难点在于 1. 分支多：trunk，release，outer等，至少有3个分支； 2. 多平台&#x…

阅读更多...

分布式理论 | RPC | Spring Boot 整合 Dubbo + ZooKeeper

分布式理论 | RPC | Spring Boot 整合 Dubbo + ZooKeeper

一、基础分布式理论什么是分布式系统？ 在《分布式系统原理与范型》一书中有如下定义：“分布式系统是若干独立计算机的集合，这些计算机对于用户来说就像单个相关系统”； 分布式系统是由一组通过网络进行通信、为了完成共同的…

阅读更多...

入侵检测系统HIDS_wazuh使用及部署

入侵检测系统HIDS_wazuh使用及部署

文章目录 wazuh简介wazuh在线文档及下载资源虚拟机默认用户是： 访问页面登录，默认是用户：admin，密码：admin进入系统后页面点击代理总数选择需要添加的主机需要检测的主机测试是否ping通wazuh服务机测试访问通后&#x…

阅读更多...

最新文章

推荐文章