<Weakly-Supervised Action Localization by Hierarchically-structured Latent Attention Modeling>
这篇文章的标题是《Weakly-Supervised Action Localization by Hierarchically-structured Latent Attention Modeling》,作者是Guiqin Wang等人,来自西安交通大学和华为技术有限公司的ACS实验室。文章主要研究的是在只有视频级标签的情况下,如何在未修剪的视频中识别和定位动作实例,这是一个被称为弱监督动作定位(Weakly-supervised Action Localization, WSAL)的问题。
核心内容和贡献
文章提出了一种新颖的基于注意力的层次化潜在模型(Attention-based Hierarchically-structured Latent Model, AHLM),用于学习特征语义的时间变化。这个模型包含两个主要部分:
- 无监督变化点检测模块