论文推荐
“SFFAI135期来自中国科学院计算技术研究所博士在读的常峥推荐的文章主要关注于计算机视觉的视频预测领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”
关注文章公众号
回复"SFFAI135"获取本主题精选论文
01
推荐理由:第一次用LSTM进行视频预测任务,开创了先河。
02
推荐理由:第一次将卷积神经网络融合进LSTM中进行视频帧的处理,在节省计算量的同时也做到了对视觉信息更好的感知。
03
推荐理由:将时域信息和空域信息同等看待,将长短期记忆的思想也扩展到空域。
04
推荐理由:将3D卷积融合进LSTM之中,进一步提升了模型对时空信息的表达能力。
05
推荐理由:设计了一种可逆的编解码器来对视频进行特征图提取,在视频预测的过程中可以很好的保护视觉信息。
06
推荐理由:将动作信息分解为长期运动以及瞬时运动,并设计了一种预测单元对两种运动模式分别建模。
分享内容
分享简介
视频预测是使用深度学习的技术对已有的视频帧进行外插预测,在很多媒体任务中都有很好的应用前景。目前主流的方法主要利用LSTM以及GRU联合卷积神经网络对视频帧进行渐进式预测,但是在这过程中视频中的时域信息(动作信息)以及空域信息(纹理信息)仅仅会被简单的融合,无法做到互相感知。本期我们邀请到了中科院计算所的常峥同学,他提出了一种运动感知的视频预测方法解决了此类问题。
讲者介绍
常峥,中国科学院计算技术研究所博士在读,主要研究方向为视频理解,视频表征学习,目前已在NeurIPS等国际会议上发表论文4篇。
分享题目
一种动作感知的视频预测方法
分享摘要
我们提出了一种运动感知的视频预测方法,我们创新性地利用空域信息去监督时域信息的融合过程,使得预测单元可以很好的感知到每一时刻视频帧的纹理变化,从而预测出更加可靠的动作信息,我们在多个公开数据集上进行了测试,并取得了很好的效果。
题目:MAU: A Motion-Aware Unit for Video Prediction and Beyond
论文下载:关注本公众号,对话框回复“SFFAI135”,获取下载
分享亮点
1、本文提出利用时空域间的相关性信息进行视频预测;
2、空域信息可以监督时域信息的融合过程,时空域信息可以互相感知;
3、本文提出的预测单元可以很方便地扩展到其他预测模型,扩展性较好。
直播时间
2022年1月16日(周日)20:00—21:00 线上直播
关注本公众号,对话框回复“SFFAI135”,获取入群二维码
注:直播地址会分享在交流群内
SFFAI招募!
现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。
论文推荐
《关系抽取专题》论文推荐
《对抗机器学习》论文推荐
《目标跟踪》论文推荐
《代码生成》论文推荐
《预训练模型》论文推荐
《机器翻译专题》论文推荐
《脚本事件预测专题》论文推荐
《多模态处理》论文推荐
《点云补全》论文推荐
《图像生成》论文推荐
《机器翻译》论文推荐
《点云补全》论文推荐
《文本表示》论文推荐
《对话机器阅读理解》论文推荐
《事件关系抽取》论文推荐
更多论文推荐历史文章
请点击文章底部“阅读原文”查看
分享、点赞、在看,给个三连击呗!