论文阅读:One-Shot Video Object Segmentation

论文名字

One-Shot Video Object Segmentation

来源

2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)

年份

2017.4.13

作者

S. Caelles K.-K. Maninis J. Pont-Tuset L. Leal-Taixé D. Cremers L. V an Gool ETH Zürich TU München

核心点

提出基于全卷积神经网络框架的One-Shot video Object Segmentation (OSVOS)框架用于解决视频中物体分割问题。

阅读日期

2020.10.29

影响因子

 

内容总结

文章主要解决的问题及解决方案:

解决视频物体分割问题。

 

文章的主要工作:

①三个贡献,第一个:将CNN用于一个特定的对象实例,给定一个带注释的图像;第二个:将视频每一帧单独处理,将视频对象分割视为每帧分割问题;第三个:可以在速度和精度之间的不同平衡点工作。

②本文提出一个新型的CNN架构OSVOS,用于处理视频物体分割问题,即对视频中的每一帧图像分成两类:前景(foreground)和背景(background),前景需要检测出的物体。OSVOS的全称为One-Shot Video Object Segmentation,即一次视频物体分割。如下图所示,OSVOS只需输入视频的第一帧图像中物体的掩模(masks)(红色位置),就可以识别中该视频接下来的每一帧中物体的掩模(masks)(绿色位置)。

③OSVOS的架构分三个部分:(1)在ImageNet中做预训练的一个基础网络(base network),离线训练的,用于区分前景对象;(2)在DAVIS数据集上训练的一个分割网络(parent network),离线训练的;(3)在视频单个帧中对特定的目标对象的分割示例进行微调网络(test network),使网络迅速聚焦于该目标,在线训练。

④在OSVOS架构中,Parent Network按Foreground Branch(前景分支)、Contour Branch(轮廓分支,用于检测目标轮廓,当前图像中的全部轮廓)和Boundary Snapping(用于改善边界定位)分为三步。如下图所示,Foreground Branch和Contour Branch使用完全相同的网络架构,但使用不同的损失函数,以分别达到目标分割和轮廓勾勒的效果,最后Boundary Snapping将前两步的结果结合,得到更准确的物体分割结果。在PASCAL-Context数据集上训练,该数据集为图像的整个场景提供轮廓注释。

 

文章内容:

①离线训练部分的细节:VGG作为基础网络,二元分类的像素交叉熵损失函数(The pixel-wise cross-entropy loss for binary classification),其允许对不平衡的二进制任务进行训练。base network在ImageNet中预训练,parent network在DAVIS上训练,用SGD,参数设置为0.9,50000次训练,数据增强:镜像和放大,learning rate:10-8

②在线训练部分的细节:用第一帧对parent network做微调。

③All resources of this paper can be found at www.vision.ee.ethz.ch/˜cvlsegmentation/osvos/

 

实验结果:

        没有边界捕捉的原始方法(-BS),没有在DAVIS上预训练the parent network,没有在特定序列上执行一次性学习(one-shot)(-OS)。

         表1证明了,预训练以及one-shot起重要作用。

        errors主要来自false negative,而边缘捕获(boundary snapping)主要用于降低false negative。(说明boundary snapping的作用)

 

        表2是与当前较先进的技术的对比。

        表4是训练数据对Quality(J)的影响

        图6是在各个种类上的各种方法的识别率。

        表5表示注释的图像数量对质量的影响。

        表6表示不同重叠级别匹配地面真实情况的边框的百分比。

        图9中(a)是原本注释的,结果是(b)在第88帧和第46帧增加两帧的注释,结果是(f),OSVOS可以学习出两个骆驼的区别。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/53227.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vs2022调试配置文件不存在的解决方案

代码就是最基础的Hello,World using System; namespace _001 { class Program { static void Main(String[] args) { Console.WriteLine("Hello,World!"); } } } 如图,已经百度了几种方法&…

go私有库封装到gitlab/github

一、说明 go语言拥有自己的库管理工具,如果使用本地clone也是可以的,但如果库很多的话,管理起来十分麻烦,所以需要使用go内部的mod进行管理。 二、代码 1.撰写代码: //输入网址 export GOPRIVATEgitee.com分别执行…

《CryptDB: Protecting Confidentiality with Encrypted Query Processing》论文学习笔记

文章目录 CryptDB: Protecting Confidentiality with Encrypted Query Processing1.cryptDB概述(背景)2.CryptDB方案①面对威胁1☆大致系统框架☆SQL-aware Encryption☆Adjustable Query-based Encryption☆其他DBMS功能 ②面对威胁2☆向共享数据提供访…

论文阅读:Deep Leakage From Gradients

论文名字 Deep Leakage From Gradients 来源 顶会 NeurIPS 年份 2019.12 作者 Ligeng Zhu Zhijian Liu Song Han 核心点 主要研究梯度泄露问题,使用比以往方法更强的攻击方法,恢复图像是像素级的,恢复文本是符号级的匹配。提出有效…

论文阅读:Differentially Private Learning with Adaptive Clipping

论文名字 Differentially Private Learning with Adaptive Clipping 来源 年份 2019 作者 Galen Andrew, Om Thakkar, H. Brendan McMahan, Swaroop Ramaswamy 核心点 提出对更新的范数的自适应裁剪方法 阅读日期 2021.3.30 影响因子 页数 10 引用数 引用…

《An Ideal-Security Protocol for Order-Preserving Encoding》论文学习笔记

文章目录 《An Ideal-Security Protocol for Order-Preserving Encoding》论文学习笔记1.论文背景2.论文概述3.威胁模型4.mOPE的原理☆Tree construction☆Binary encoding☆Tree balancing☆平均开销☆旧的编码☆Mutable order-preserving encoding (mOPE) 《An Ideal-Securit…

论文阅读:DP-FL: a novel differentially private federated learning framework for the unbalanced data

论文名字 DP-FL: a novel differentially private federated learning framework for the unbalanced data 来源 World wide web (2020) 年份 2020 作者 Xixi Huang, Ye Ding, Zoe L. Jiang, Shuhan Qi, Xuan Wang, Qing Liao 核心点 针对unbalance data的DP的噪声的动…

数学建模英文论文写作001之Proposal开题

GG呕心沥血、浏览群书群论文总结了一系列数学建模英文写作好词好句,助你旗开得胜! 本次主要介绍论文的开题部分。论文开题的目的是清晰陈述问题并且描述为什么这个问题是重要的。写开题的时候,假想自己正在为了继续研究话题申请项目基金。你…

论文笔记——频率隐藏保序加密

论文标题:Frequency-Hiding Order-Preserving Encryption 原文作者:Florian Kerschbaum, Authors Info & Claims 原文链接:https://dl.acm.org/doi/abs/10.1145/2810103.2813629 发表会议:CCS 15: Proceedings …

论文阅读:Video Object Segmentation and Tracking A Survey

论文名字 Video Object Segmentation and Tracking A Survey 来源 arXiv 论文地址:http://arxiv.org/abs/1904.09172?contextcs.CV 年份 2019.4.26 作者 RUI YAO, GUOSHENG LIN, SHIXIONG XIA, JIAQI ZHAO, YONG ZHOU 核心点 对现有的VOST算法进行分…

「都是url惹的祸」(问题:小数点参数被截取|刷新页面找不到资源)

问题背景: 在开发的时候有个页面跳转的需求点并且需要带着五个参数飞过去,其中包含版本号(就是有小数点的数字,这也是遇到的一个问题一会聊一哈),本来触发完事件横跳过去没有问题,寻思着看一下N…

mysql用户名不存在_dedecms系统后台登陆提示用户名密码不存在

dedecms最近被曝有非常多的安全漏洞,最近有些用户反应后台管理员账号密码没有修改但无法正常登陆,提示用户名不存在,经研究发现是程序漏洞管理员被直接篡改,解决方案如下。 一、请先使用phpmyadmin登陆mysql管理,虚拟主…

桂林三金,吃不到中药股红利

如果说,国货品牌崛起的大潮本质上是国家的崛起,而非货的崛起。那么,中药的一时火热,靠的也不是疗效,是文化自信。 文化自信改变不了中药的疗效,但可以提升消费者对中药的信心。片仔癀靠着独家秘方&#xf…

如何实现沉浸式旅游与非物质文化遗产的共同发展

中国非物质文化遗产资源丰富,是世界上非物质文化遗产数量最多的国家。丰富多样的资源为非物质文化遗产旅游业的建设提供了良好的基础。非物质文化遗产旅游是基于非物质文化遗产资源开发的文化旅游消费形式。文化资源包括各民族代代相传的传统文化表现形式。非物质文…

@河南省文旅厅 携手让非遗“活”起来!

太极拳申遗成功两周年之际 河南省文化和旅游厅联合百度智能云 打造的“太极拳一张图” 正式上线啦! 河南省是我国非物质文化遗产资源大省,此次推出的“太极拳一张图”正是河南省贯彻落实二十大精神,深入推进非遗数字化保护体系建设和传播推广…

小红书百万博主如何炼成?美妆博主专访

“在小红书上如何快速涨粉?”是大家长期以来的疑惑,为此我们找到了小红书美妆博主小颠儿kini,让我们看看他在成为百万博主的道路上都总结了哪些心得吧! 采访手记:截止到发稿,美妆博主小颠儿kini在小红书上的…

基于Java Web技术的动车购票系统

毕 业 设 计 中文题目基于Java Web技术的动车购票系统英文题目Train ticket system based on Web JavaTechnology 毕业设计诚信声明书 本人郑重声明:在毕业设计工作中严格遵守学校有关规定,恪守学术规范;我所提交的毕业设计是本人在 指导教师…

什么是注意力机制?

Attention机制在近几年来在图像,自然语言处理等领域中都取得了重要的突破,被证明有益于提高模型的性能。 Attention机制本身也是符合人脑和人眼的感知机制,这次我们主要以计算机视觉领域为例,讲述Attention机制的原理&#xff0c…

深入理解注意力机制(Attention Mechanism)和Seq2Seq

学习本部分默认大家对RNN神经网络已经深入理解了,这是基础,同时理解什么是时间序列,尤其RNN的常用展开形式进行画图,这个必须理解了。 这篇文章整理有关注意力机制(Attention Mechanism )的知识&#xff0…

Attention注意力机制学习(一)------->SENet

目录 前言 论文 注意力机制 Squeeze-and-Excitation (SE) 模块 第一步Squeeze(Fsq) 第二步excitation(Fex) SE注意力机制应用于inception和ResNet 前言 在深度学习领域,CNN分类网络的发展对其它计算机视觉任务如目标检测和语义分割都起到至关重要的作用&…