商汤等提出:统一多目标跟踪框架

https://www.toutiao.com/a6654722067419628046/

 

 

 2019-02-06 11:20:22

正文

《Multi-Object Tracking with Multiple Cues and Switcher-Aware Classification》

 

商汤等提出:统一多目标跟踪框架

 

 

arXiv:https://arxiv.org/abs/1901.06129

作者团队:商汤&北航&悉尼大学

注:2019年01月21日刚出炉的paper

 

Abstract:In this paper, we propose a unified Multi-Object Tracking (MOT) framework learning to make full use of long term and short term cues for handling complex cases in MOT scenes. Besides, for better association, we propose switcher-aware classification (SAC), which takes the potential identity-switch causer (switcher) into consideration. Specifically, the proposed framework includes a Single Object Tracking (SOT) sub-net to capture short term cues, a re-identification (ReID) sub-net to extract long term cues and a switcher-aware classifier to make matching decisions using extracted features from the main target and the switcher. Short term cues help to find false negatives, while long term cues avoid critical mistakes when occlusion happens, and the SAC learns to combine multiple cues in an effective way and improves robustness. The method is evaluated on the challenging MOT benchmarks and achieves the state-of-the-art results.

摘要:在本文中,我们提出了一个统一的多目标跟踪(MOT)框架,可以学会充分利用长期和短期线索来处理MOT场景中的复杂情况。此外,为了更好地关联,我们提出了切换器感知分类(SAC),它考虑了潜在的身份切换监视器(切换器)。 具体而言,所提出的框架包括用于捕获短期线索的单个对象跟踪(SOT)子网络,用于提取长期线索的 ReID 子网络以及用于使用提取的特征进行匹配决策的切换器感知分类器。 从主目标和切换器。短期线索有助于发现漏报(FN),而长期线索避免了发生遮挡时的严重错误,并且SAC学会以有效的方式组合多个线索并提高稳健性。该方法在具有挑战性的MOT基准测试中进行评估,并达到 SOTA。

商汤等提出:统一多目标跟踪框架

 

 

The proposed MOT framework

 

商汤等提出:统一多目标跟踪框架

 

 

Siamese-RPN architecture for SOT

 

创新点

  • Using SOT Tracker for Short Term Cues
  • Using ReID Network for Long Term Cues
  • Switcher-Aware Classifier

 

SOTA(MOT16 and MOT17)

商汤等提出:统一多目标跟踪框架

 

 

商汤等提出:统一多目标跟踪框架

 

 

识别示例

商汤等提出:统一多目标跟踪框架

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43428.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

商汤科技总裁张文谈人工智能: 未来10年到20年会有巨大爆发 下一个井喷是AI+教育

https://m.thecover.cn/news_details.html?fromweb&id2087288 2019-06-11 19:31 封面新闻记者 秦怡 杨晨 “有一个预测,到2035年人工智能对整个经济的发展会提高40%。这取决于未来10到20年人工智能发展的理论是否会有所突破。” 人工智能的时代已经来临&…

商汤科技汤晓鸥:其实不存在AI行业,唯一存在的是“AI+“行业

https://www.cnblogs.com/DicksonJYL/p/9684671.html 9 月 17 日,2018 世界人工智能大会在上海召开,在上午主论坛大会上,商汤科技联合创始人汤晓鸥发表了题为《人工智能 大爱(AI)无疆》的演讲。他提到,并不…

“学院派”商汤科技:原创技术价值迸发

https://www.toutiao.com/a6651509438320476686/ 2019-01-28 19:33:43 距离李飞飞离职谷歌已经5个月了。 我们熟识的这位AI圈一姐沉寂了一段时间后,终于又听到关于她的消息:领导的斯坦福的团队提出了自动图像语义分割架构。 从这位在谷歌首席科学家和…

图片标注工具LabelImg使用教程

项目地址:LabelImg 下载地址:Windows/Linux 百度云备份:最近几个版本 密码: cnn6 前言 我们知道,图片标注主要是用来创建自己的数据集,方便进行深度学习训练。本篇博客将推荐一款十分好用的图片标注工具LabelImg&a…

程序员的职场危机,能靠技术化解吗?

很多人认为,程序员一定要干到管理层,才会有继续走下去的希望,而踏实做技术的程序员,只会面临淘汰。 事实真是如此吗? △ 截图来源脉脉,如侵删 我们先不说结论,一起看看网友们的看法&#xff1…

【报告分享】2020程序员人群洞察报告.pdf(附下载链接)

大家好,我是文文(微信:sscbg2020),今天给大家分享Mob研究院于2020年11月发布的报告《2020程序员人群洞察报告.pdf》,带你走进小哥哥们“软萌”的内心code。 随着互联网的发展,程序员群体已经高达…

大数据说职场人没有逃离互联网,但35岁问题有了新解药

本文为转载 两年前,阿一对互联网大厂充满憧憬,从外企辞职加入一家互联网大厂工作。大有大的好处,福利待遇都不错,从三餐到下午茶,从打车到租房,衣食住行,公司都给包了。 大也有大的压力&#…

用AI帮助你思考?两名大学生一夜开发出ChatMind,这次是知识工作者的福音!

Datawhale发布 作者:石天放,Datawhale成员 ChatGPT建议的标题。还可以吧。如何让知识工作者更便捷的通过对话就能梳理思维逻辑、找到解决方案,Datawhale成员天放,开发了能够与AI对话生成思维导图的工具ChatMind。这次是知识工作者…

[正能量系列]失业的程序员(一)

注:本文原型为作者的好友,全文不完全代表作者本人的意图. 不小心,我失业了。 原因是前几天和我的部门经理拍了桌子,我的组员去内蒙古出差,项目没有中标。年后,长得很像猪刚烈的部门经理发飙了,要…

电商卖家都开始用AI做模特图了?!

AI最近热度特别大,甚至都开始在电商中应用起来了!最近有网友发帖称:AI模特与石膏模特、真人模特对比,从生成效果来看,AI模特已非常接近真人。一起来看看吧! 你敢相信吗? 这些照片都是AI人工智能…

利用AI点亮副业变现:5个变现实操案例的启示

AI变现副业实操案例 宝宝起名服务AI科技热点号头像壁纸职业头像收徒:萌娃头像定制头像平台挂载 小说推广号流量营销号百家号AI共创计划公众号流量主 知识付费知识星球小报童: 整体思维导图: 在这里先分享五个实操案例: 宝宝起名服务AI科技热…

Java 9 模块化特性学习:一个使用Gradle构建模块化项目的实践指南

Java 9 模块化特性学习:一个Gradle模块化项目实践 前言 不知怎么的,现今的程序员往往被当成加班工种的典范,而我随着工龄的不断增加,作为码农的我码带码的时间却可以做到越来越少?(狗头) 时间…

Generative AI 新世界:大型语言模型(LLMs)概述

在上一篇《Generative AI 新世界:文本生成领域论文解读》中,我带领大家一起梳理了文本生成领域(Text Generation)的主要几篇论文:InstructGPT,RLHF,PPO,GPT-3,以及 GPT-4…

大语言模型经典论文一次读到爽!

知乎:Ostrich 职位:阿里巴巴 算法工程师 原文:https://zhuanlan.zhihu.com/p/620360553 要说2023刷屏最多的词条,ChatGPT可以说是无出其右。到最近的GPT-4,技术的革新俨然已呈现破圈之势,从学术圈到工业界再…

关于两个STM32F103系列单片机的蓝牙通信

毕设做的是掌控小车,因此采用蓝牙通信作为小车和手部通信,前段时间做出实物,对其遇到的问题以及解决的方法做一些总结。一个主控芯片采用STM32F103ZET6,另一个主控芯片采用STM32F103C8T6,原因是本来准备了两个主控C8T6…

GraphPad绘图软件:汇集生物统计、化学统计、以及科技绘图于一身

分享一款实用的绘图软件,GraphPad Prism。汇集生物统计、化学统计、以及科技绘图于一身,有超过110个国家的超过20万名科学家用这个软件来分析、绘制和展示他们的科学数据。 不需要学习复杂的编程,无需代码,用起来像EXCEL一样点点点…

认真分享几个「副业赚钱」的靠谱思路!

已剪辑自: https://mp.weixin.qq.com/s?__bizMzUxODM4MDk2NA&mid2247486581&idx1&sn1a27953f0956836693434f9aaf96829f&chksmf98880beceff09a83a915d231b5888287142227fda6671d53dac7d03e2c13806abe82994a3b6&scene21#wechat_redirect 你好,我…

如何在家里赚钱,分享六个适合普通人长期可做的副业

​当今社会,压力越来越大,工作、家庭、生活等等,方方面面都需要钱,仅靠一份工作赚钱,已经很难满足我们的需求。所以越来越多的人尝试做副业,通过副业增加收入,让生活过得更幸福。常见的副业都是…

ChatGPT对软件开发生命周期有哪些冲击?

1、对需求开发的冲击 ChatGPT对需求开发的冲击,主要体现在:可以帮助更准确地理解和记录需求,协助起草和完善用户故事或用例。 ChatGPT对软件开发生命周期有哪些冲击? ​ 2、对设计的冲击 ChatGPT对设计的冲击,主…

元宇宙场景技术实践|实现“虚拟人”自由

虚拟形象是虚拟世界的核心资产,也是打造元宇宙社交的数字名片,从虚拟形象为切入点,ZEGO Avatar 基于强大的 AI 算法能力,可以为企业提供多元化风格虚拟形象制作及智能互动服务,助力企业打造虚拟形象数字资产&#xff0…