目标检测-One Stage-SSD

文章目录

  • 前言
  • 一、SSD的网络结构和流程
  • 二、SSD的创新点
  • 总结


前言

根据前文目标检测-One Stage-YOLOv1可以看出YOLOv1的主要缺点是:

  1. 每个格子针对目标框的回归是不加限制的,导致目标的定位并不是很精准
  2. 和Faster RCNN等先进Two Stage算法相比,没有应用多尺度特征图的思想
  3. 预训练时与实际训练时输入大小不一致,模型需要去适应这种分辨率的转换,会影响最终精度

SSD(Single Shot MultiBox Detector)针对上述缺点做了改进


提示:以下是本篇文章正文内容,下面内容可供参考

一、SSD的网络结构和流程

  1. 将影像输入VGG16,得到不同卷积层的多尺度特征图(38,19,10,5,3,1)
  2. 引入了anchor机制,不同尺度特征图每个像素预设置不同数量的先验框 [4, 6, 6, 6, 4, 4]

ps:产生共计 3 8 2 × 4 + 1 9 2 × 6 + 1 0 2 × 6 + 5 2 × 6 + 3 2 × 4 + 1 2 × 4 = 8732 38^2×4+19^2×6+10^2×6+5^2×6+3^2×4+1^2×4 = 8732 382×4+192×6+102×6+52×6+32×4+12×4=8732 个anchor
SSD中anchor的大小尺寸(scale)并不是按照特征图的大小统一缩放对应的,而是手动设置了一个线性插值变换,使浅层使用较小的scale,往深层逐渐增大scale。由于随着层次加深感受野逐渐增大,这意味着SSD使用感受野小的feature map检测小目标(较小的scale),使用感受野大的feature map检测更大目标(较大的scale)。

  1. 将不同尺度特征图的anchor输入不同的分类和边框回归器
  2. 使用非极大值抑制NMS去除冗余窗口
    在这里插入图片描述
    在这里插入图片描述

二、SSD的创新点

  1. 引入了多尺度特征图和anchor机制,改进了YOLOv1边框不加限制的缺点
  2. 为适应数据集的输入,采用了两种大小输入:300 × 300和512 × 512
  3. 使用了一些数据增强手段

总结

SSD结合了YOLO中的回归思想和Faster R-CNN中的anchor机制,使用全图各个位置的多尺度区域特征进行回归,既保持了YOLO速度快的特性,也保证了窗口预测的跟Faster R-CNN一样比较精准。SSD在VOC2007上mAP可以达到72.1%,速度在GPU上达到58帧每秒。

但是,和Faster RCNN使用SPP不限制输入大小相比,到目前为止,One Stage算法都是缩放到固定大小,可能会使图片变形失真。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/231294.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2020年认证杯SPSSPRO杯数学建模C题(第一阶段)抗击疫情,我们能做什么全过程文档及程序

2020年认证杯SPSSPRO杯数学建模 C题 抗击疫情,我们能做什么 原题再现: 2020 年 3 月 12 日,世界卫生组织(WHO)宣布,席卷全球的冠状病毒引发的病毒性肺炎(COVID-19)是一种大流行病。…

打工人的2.0时代,只需要一副AR眼镜!

在数字化时代,工业行业中的生产效率如何得到提升?工业AR眼镜或许是一个不错的选择。不过工业AR眼镜真的可以协助员工处理工作中所遇到的各种问题吗?我们以制造业、医疗行业、船舶业的不同从业者为例: 假如你是一名制造业从业者&am…

Linux第4步_安装VMwareTools

安装Ubuntu操作系统后,就可以安装VMwareTools了,目的是实现“电脑和虚拟机之间互相复制粘贴文件”。 1、双击桌面图标“VMware Workstation Pro”,然后点击下图中的“开机”,打开虚拟机电源。 2、双击下图中的用户名“zgq” 3、…

解决npm,pnpm,yarn等安装electron超时等问题

我在安装electron的时候,出现了超时等等各种问题: (RequestError: connect ETIMEDOUT 20.205.243.166:443) npm yarn:Request Error: connect ETIMEDOUT 20.205.243.166:443 RequestError: socket hang up npm ER…

Kafka集群详解

Kafka介绍Kafka集群介绍Kafka集群特点Kafka集群搭建在这里插入图片描述Kafka集群如何进行故障切换Kafka集群Leader的选举Kafka集群如何快速横向拓展Kafka集群搭建最佳实践Kafka集群可以使用单节点Zookeeper吗Kafka集群的消费者信息保存在那里Kafka集群的Topic的分区数的设置规则…

LeetCode(36)有效的数独 ⭐⭐

请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。 数字 1-9 在每一行只能出现一次。数字 1-9 在每一列只能出现一次。数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。(请参考示例图) 注…

(Java基础知识综合)

进制转换&#xff1a; 其他转10 10转其他 2进制8和16 8和16转2 位运算&#xff1a; >> 除于2 <<乘以2 近似值 空心金字塔 this关键字还可以用于访问父类中的属性和方法

Java的内部类

Java的内部类 1. 什么是内部类?2. 内部类的分类2.1 成员式内部类2.1.1 成员内部类&#xff08;Member Inner Class&#xff09;2.1.2 静态内部类&#xff08;Static Nested Class&#xff09; 2.2 局部式内部类2.2.1 局部内部类&#xff08;Local Inner Class&#xff09;2.2.…

计算机网络期末复习

计算机网络复习 1.第一章 1.2.2计算机啊网络的分类(认识) 按网络的覆盖范围进行分类&#xff1a; 局域网城域网广域网个人区域网 按网络的使用者进行分类&#xff1a; 公用网专用网 1.3互联网的组成(掌握) 从功能上可以划分为以下两大部分&#xff1a; 边缘部分&#x…

Halcon算子精讲:形态学操作(圆形操作)

膨胀操作&#xff08;圆形膨胀&#xff09; 算子 dilation_circle(Region, RegionDilation, 3.5) 原理 将区域中边界的每个像素点以3.5为半径做圆&#xff0c;原有区域 所做圆区域 膨胀后区域。 作用 扩大目标所在区域或连接区域破碎部分。 对比图 腐蚀操作&#xff08;圆…

[2023-年度总结]凡是过往,皆为序章

原创/朱季谦 2023年12月初&#xff0c;傍晚&#xff0c;在深圳的小南山看了一场落日。 那晚我们坐在山顶的草地上&#xff0c;拍下了这张照片——仿佛在秋天的枝头上&#xff0c;结出一颗红透的夕阳。 这一天很快就会随着夜幕的降临&#xff0c;化作记忆的碎片&#xff0c;然…

利用 IntelliJ IDEA 整合 GitHub 实现项目版本控制与协作管理

目录 前言1 设置GitHub登录账号2 将项目分享到GitHub3 IntelliJ IDEA 中导入Github项目4 往GitHub推送代码4.1 Commit Change&#xff08;提交到本地库&#xff09;4.2 Git -> Repository -> Push&#xff08;推送到远程库&#xff09; 5 拉取远程库代码到本地6 克隆远程…

大模型应用实践:AIGC探索之旅

随着OpenAI推出ChatGPT&#xff0c;AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势&#xff0c;而是深刻地塑造着我们交流、工作和思考的方式。 本文介绍了笔者理解的大模型和AIGC的密切联系&#xff0c;从历史沿革到实际应用案例&#xff0c;再到面临的技术挑…

降噪自编码器(Denoising Autoencoder)

降噪自编码器&#xff08;Denoising Autoencoder&#xff09;是一种用于无监督学习的神经网络模型。与普通的自编码器不同&#xff0c;降噪自编码器的目标是通过在输入数据中引入噪声&#xff0c;然后尝试从具有噪声的输入中重建原始无噪声数据。 以下是降噪自编码器的主要特点…

VCoder:大语言模型的眼睛

简介 VCoder的一个视觉编码器&#xff0c;能够帮助MLLM更好地理解和分析图像内容。提高模型在识别图像中的对象、理解图像场景方面的能力。它可以帮助模型显示图片中不同物体的轮廓或深度图&#xff08;显示物体距离相机的远近&#xff09;。还能更准确的理解图片中的物体是什…

three.js Raycaster(鼠标点击选中模型)

效果&#xff1a; 代码&#xff1a; <template><div><el-container><el-main><div class"box-card-left"><div id"threejs" style"border: 1px solid red"></div><div class"box-right"…

科普:嵌入式多核并行仿真

自信息技术革命以来&#xff0c;计算机一直被应用在各种复杂的数据处理中&#xff0c;如火箭弹道&#xff0c;高能物理和生物学数据等。随着嵌入式领域的多样化需求的不断丰富&#xff0c;多核CPU的应用也越来越广泛&#xff1a;嵌入式系统通常需要同时处理多个任务和实时数据&…

14:00面试,14:08就出来了,问的问题过于变态了。。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到10月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40…

Unity3D Shader 之透视效果XRay

1、 Shader "Unlit/XRay" {Properties{_MainTex("Texture", 2D) "white" {}// 漫反射_Diffuse("Diffuse", COLOR) (1,1,1,1)// XRay 效果_XRayColor("XRay Color", COLOR) (0,1,1,1)_XRayPower("XRay Power",…

Java多线程<二>多线程经典场景

leetcode 多线程刷题 上锁上一次&#xff0c;还是上多次&#xff1f; 同步的顺序。 1. 交替打印字符 使用sychronize同步锁使用lock锁使用concurrent的默认机制使用volitale关键字 Thread.sleep() / Thread.yield机制使用automic原子类 方式1 &#xff1a;使用互斥访问st…