如何使用OpenCV对物体进行搜索检测与识别

在本教程中,我们将了解对象检测中称为“选择性搜索”的重要概念。我们还将用C ++和Python共享OpenCV代码。

 

物体检测与物体识别

对象识别算法识别图像中存在哪些对象。它将整个图像作为输入,并输出该图像中存在的对象的类标签和类概率。例如,类标签可以是“狗”,相关的类概率可以是97%。

 

另一方面,对象检测算法不仅告诉您图像中存在哪些对象,还输出边界框(x,y,宽度,高度)以指示图像内对象的位置。

 

所有物体检测算法的核心是物体识别算法。假设我们训练了一个物体识别模型,该模型识别图像斑块中的狗。该模型将判断图像中是否有狗。它不会告诉对象的位置。

 

为了本地化对象,我们必须选择图像的子区域(块),然后将对象识别算法应用于这些图像块。对象的位置由图像块的位置给出,其中对象识别算法返回的类概率高。

 

生成较小子区域(补丁)的最直接方法称为滑动窗口方法。然而,滑动窗口方法有几个局限性。一类称为“区域提议”算法的算法克服了这些限制。选择性搜索是最受欢迎的区域提案算法之一。

 

滑动窗口算法

在滑动窗口方法中,我们在图像上滑动框或窗口以选择补丁,并使用对象识别模型对窗口覆盖的每个图像补丁进行分类。它是对整个图像上的对象的详尽搜索。我们不仅需要搜索图像中的所有可能位置,还必须搜索不同的比例。这是因为对象识别模型通常以特定尺度(或尺度范围)进行训练。这导致对数万个图像块进行分类。

 

问题并没有在这里结束。滑动窗口方法适用于固定宽高比的物体,如面部或行人。图像是3D对象的2D投影。宽高比和形状等对象特征会根据拍摄图像的角度而有很大差异。滑动窗口方法,因为当我们搜索多个宽高比时,计算上非常昂贵。

 

区域提案算法

到目前为止我们讨论的问题可以使用区域提议算法来解决。这些方法将图像作为输入和输出边界框,对应于图像中最可能是对象的所有面片。这些区域提议可能是嘈杂的,重叠的并且可能不完全包含对象,但是在这些区域提议中,将有一个非常接近图像中的实际对象的提议。然后我们可以使用对象识别模型对这些提议进行分类。具有高概率得分的区域提议是对象的位置。

 

区域提议算法使用分段识别图像中的预期对象。在分割中,我们基于一些标准(例如颜色,纹理等)将相邻区域彼此相似地分组。与我们在所有像素位置和所有尺度上寻找对象的滑动窗口方法不同,区域建议算法通过以下方式工作:将像素分组为较少数量的段。因此,生成的最终提案数量比滑动窗口方法少很多倍。这减少了我们必须分类的图像补丁的数量。这些生成的区域提议具有不同的比例和宽高比。

 

区域提案方法的一个重要特性是具有非常高的召回率。这只是一种奇特的说法,即包含我们正在寻找的对象的区域必须在我们的区域提案列表中。为了实现这一点,我们的区域提议列表最终可能会包含许多不包含任何对象的区域。换句话说,区域提议算法可以产生大量的误报,只要它能够捕获所有真正的正数。大多数这些误报将被物体识别算法拒绝。当我们有更多的误报并且精度受到轻微影响时,检测所需的时间就会增加。但是,召回率高仍然是一个好主意,因为错过包含实际对象的区域的替代方案会严重影响检测率。

 

已经提出了几种区域提议方法,例如

 

  • 对象性

  • 用于自动对象分割的约束参数最小割

  • 类别独立对象提案

  • 随机Prim

  • 选择性搜索

在所有这些区域提议方法中,选择性搜索是最常用的,因为它速度快且召回率很高。

 

选择性搜索对象识别

什么是选择性搜索?

选择性搜索是用于对象检测的区域提议算法。它设计为快速,具有很高的召回率。它基于根据颜色,纹理,大小和形状兼容性计算相似区域的分层分组。

 

选择性搜索首先使用Felzenszwalb和Huttenlocher 基于图形的分割方法,根据像素的强度对图像进行过度分割。算法的输出如下所示。右侧的图像包含使用纯色表示的分段区域。

 

 

中使用分段部分作为区域提案吗?答案是否定的,我们不能这样做有两个原因:

 

  1. 原始图像中的大多数实际对象包含2个或更多分段部分

  2. 使用该方法不能产生用于封闭物体的区域建议,例如由杯子覆盖的板或装有咖啡的杯子

如果我们试图通过进一步合并彼此相似的相邻区域来解决第一个问题,那么我们将最终得到一个覆盖两个对象的分段区域。

 

完美的细分不是我们的目标。我们只想预测许多区域提案,使得其中一些提案应与实际对象具有非常高的重叠。

 

选择性搜索使用来自Felzenszwalb和Huttenlocher方法的调查作为初始种子。一个过度注释的图像看起来像这样。

 

选择性搜索算法将这些过量作为初始输入并执行以下步骤

 

  1. 将与分段部件对应的所有边界框添加到区域提案列表中

  2. 根据相似性对相邻段进行分组

  3. 转到第1步

在每次迭代中,形成更大的段并将其添加到区域提议列表中。因此,我们以自下而上的方式创建从较小的细分市场到较大细分市场的区域提案。这就是我们所说的使用Felzenszwalb和Huttenlocher的计划来计算“分层”分段。

 

此图显示了分层分段过程的初始,中间和最后一步。

 

相似

让我们深入探讨如何计算两个区域之间的相似性。

 

选择性搜索使用基于颜色,纹理,大小和形状兼容性的4种相似性度量。

 

颜色相似

针对图像的每个通道计算25个区间的颜色直方图,并且连接所有通道的直方图以获得颜色描述符,得到25×3 = 75维颜色描述符。

 

两个区域的颜色相似性基于直方图交集,可以计算为:

 

 

纹理相似性

通过为每个通道提取8个方向的高斯导数来计算纹理特征。对于每个方向和每个颜色通道,计算10个箱的直方图,得到10x8x3 = 240维特征描述符。

 

还使用直方图交叉来计算两个区域的纹理相似性。

 

大小相似

大小相似性鼓励较小的区域尽早合并。它确保在图像的所有部分形成所有尺度的区域提议。如果不考虑该相似性度量,则单个区域将逐个吞噬所有较小的相邻区域,因此仅在该位置处生成多个尺度的区域提议。大小相似度定义为:

其中大小Size(im)是图像的大小,以像素为单位。

 

形状兼容性

形状兼容性衡量两个区域(Ri和Rj)相互适合的程度。如果R_I适合r_j我们想合并它们以填补空白,如果它们甚至没有相互接触它们就不应该合并。

 

形状兼容性定义为:

在哪里大小Size(BBijj)是一个边界框Ri和Rj。

 

最终相似性

两个区域之间的最终相似性被定义为前述4个相似性的线性组合。

结果

OpenCV中的选择性搜索实现提供了按对象性递减顺序排列的数千个区域提议。为清楚起见,我们与图像上方的200-250个框共享结果。一般来说,1000-1200个提案足以获得所有正确的区域提案

让我们来看看我们如何在OpenCV中使用基于选择性搜索的分段。

选择性搜索:C ++

下面的代码是使用OpenCV进行选择性搜索的C ++教程。请仔细阅读评论以了解代码。

#include "opencv2/ximgproc/segmentation.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/core.hpp"
#include "opencv2/imgproc.hpp"
#include <iostream>
#include <ctime>using namespace cv;
using namespace cv::ximgproc::segmentation;static void help() {std::cout << std::endl <<"Usage:" << std::endl <<"./ssearch input_image (f|q)" << std::endl <<"f=fast, q=quality" << std::endl <<"Use l to display less rects, m to display more rects, q to quit" << std::endl;
}int main(int argc, char** argv) {// If image path and f/q is not passed as command// line arguments, quit and display help messageif (argc < 3) {help();return -1;}// speed-up using multithreadssetUseOptimized(true);setNumThreads(4);// read imageMat im = imread(argv[1]);// resize imageint newHeight = 200;int newWidth = im.cols*newHeight/im.rows;resize(im, im, Size(newWidth, newHeight));// create Selective Search Segmentation Object using default parametersPtr<SelectiveSearchSegmentation> ss = createSelectiveSearchSegmentation();// set input image on which we will run segmentationss->setBaseImage(im);// Switch to fast but low recall Selective Search methodif (argv[2][0] == 'f') {ss->switchToSelectiveSearchFast();}// Switch to high recall but slow Selective Search methodelse if (argv[2][0] == 'q') {ss->switchToSelectiveSearchQuality();} // if argument is neither f nor q print help messageelse {help();return -2;}// run selective search segmentation on input imagestd::vector<Rect> rects;ss->process(rects);std::cout << "Total Number of Region Proposals: " << rects.size() << std::endl;// number of region proposals to showint numShowRects = 100;// increment to increase/decrease total number// of reason proposals to be shownint increment = 50;while(1) {// create a copy of original imageMat imOut = im.clone();// itereate over all the region proposalsfor(int i = 0; i < rects.size(); i++) {if (i < numShowRects) {rectangle(imOut, rects[i], Scalar(0, 255, 0));}else {break;}}// show outputimshow("Output", imOut);// record key pressint k = waitKey();// m is pressedif (k == 109) {// increase total number of rectangles to show by incrementnumShowRects += increment;}// l is pressedelse if (k == 108 && numShowRects > increment) {// decrease total number of rectangles to show by incrementnumShowRects -= increment;}// q is pressedelse if (k == 113) {break;}}return 0;
}

选择性搜索:Python

下面的代码是使用OpenCV 3.3进行选择性搜索的Python教程。请注意代码块后提到的OpenCV 3.2的错误警报。请仔细阅读评论以了解代码。

 


#!/usr/bin/env python
'''
Usage:./ssearch.py input_image (f|q)f=fast, q=quality
Use "l" to display less rects, 'm' to display more rects, "q" to quit.
'''import sys
import cv2if __name__ == '__main__':# If image path and f/q is not passed as command# line arguments, quit and display help messageif len(sys.argv) < 3:print(__doc__)sys.exit(1)# speed-up using multithreadscv2.setUseOptimized(True);cv2.setNumThreads(4);# read imageim = cv2.imread(sys.argv[1])# resize imagenewHeight = 200newWidth = int(im.shape[1]*200/im.shape[0])im = cv2.resize(im, (newWidth, newHeight))    # create Selective Search Segmentation Object using default parametersss = cv2.ximgproc.segmentation.createSelectiveSearchSegmentation()# set input image on which we will run segmentationss.setBaseImage(im)# Switch to fast but low recall Selective Search methodif (sys.argv[2] == 'f'):ss.switchToSelectiveSearchFast()# Switch to high recall but slow Selective Search methodelif (sys.argv[2] == 'q'):ss.switchToSelectiveSearchQuality()# if argument is neither f nor q print help messageelse:print(__doc__)sys.exit(1)# run selective search segmentation on input imagerects = ss.process()print('Total Number of Region Proposals: {}'.format(len(rects)))# number of region proposals to shownumShowRects = 100# increment to increase/decrease total number# of reason proposals to be shownincrement = 50while True:# create a copy of original imageimOut = im.copy()# itereate over all the region proposalsfor i, rect in enumerate(rects):# draw rectangle for region proposal till numShowRectsif (i < numShowRects):x, y, w, h = rectcv2.rectangle(imOut, (x, y), (x+w, y+h), (0, 255, 0), 1, cv2.LINE_AA)else:break# show outputcv2.imshow("Output", imOut)# record key pressk = cv2.waitKey(0) & 0xFF# m is pressedif k == 109:# increase total number of rectangles to show by incrementnumShowRects += increment# l is pressedelif k == 108 and numShowRects > increment:# decrease total number of rectangles to show by incrementnumShowRects -= increment# q is pressedelif k == 113:break# close image show windowcv2.destroyAllWindows()

源码地址关注微信公众号:“图像算法”或者微信搜索账号imalg_cn关注公众号 回复检测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32412.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通用物体识别使用攻略

作者&#xff1a;让天涯 一、需求描述 大家在出去旅游的时候&#xff0c;往往会对景点里的特色事物感兴趣&#xff0c;而一般情况下&#xff0c;如果没有导游的介绍&#xff0c;我们不太清楚这个景区里的特色景点是什么&#xff0c;有时候即使看到了一个事物&#xff0c;都不…

python姿态检测实现多人多姿态识别python行为识别openpose行为骨骼框架检测动作识别动作检测行为动作分类

效果演示&#xff1a; 视频演示&#xff1a; python行为识别行为骨骼框架检测动作识别动作检测行为动作分类 项目下载链接&#xff1a;https://download.csdn.net/download/babyai996/87552750 0环境项目配置教程&#xff1a;https://download.csdn.net/download/babyai996/87…

Win11集成 ChatGPT,任务栏取消分组真的回来了

时隔两月微软如期发布了 Win11 Moments 3 更新&#xff0c;版本号 22621.1778 。 微软这次更新带来了许多质量更新和功能改进。 直观的改动是任务栏&#xff0c;网络图标在连接加密隧道时会上锁&#xff0c;时间显示到秒也重新回归。 日常会用到的 AltTab 任务选项卡被限制到最…

​干货!影视剪辑大神常用避免侵权的8个秘籍首次公开【覃小龙课堂】

哈罗&#xff0c;我是您的老朋友&#xff1a;覃小龙&#xff0c;您可以称呼我为覃总&#xff0c;因为我是腾然MCN和火星电商的老板&#xff0c;我2016年创办腾然MCN至今&#xff0c;已经是自媒体的骨灰级老司机了&#xff0c;所以今天给您带来的主题是&#xff1a; 干货&#x…

影视剪辑,视频剪辑的万能剪辑技巧来啦,剪辑技巧合集

好多人在学习视频剪辑时不知道如何入手&#xff01; 今天这一篇总结来啦&#xff01; 首先要掌握的就是关于正确的视频剪辑流程 ①建立好项目文件夹。根据时间、地点、大体拍摄内容等分类&#xff0c;在不同的文件夹存入对应的物料和工程。 ②获取素材。提前收集好要用的包装…

影视剪辑,PR剪辑软件两个转场教程

一、古风渐变擦除转场&#xff1a;拖入视频1和视频2&#xff0c;将视频2放到视频1上面的轨道&#xff0c;2者重叠部分就是转场部分。 【效果】【渐变擦除】&#xff0c;拖到视频2。 在开头K关键帧&#xff0c;【效果控件】【渐变擦除】【过渡完成】K帧调到100。 在2段视频交接…

影视剪辑,你应该掌握的剪辑流程和技巧

很多朋友想学视频剪辑&#xff0c;但是不知道如何入手&#xff1f;今天就把我的压箱底都告诉你们啦! 应该先掌握的剪辑流程! 建立好项目文件夹。在每个级的文件夹存入对应的物料和工程。 获取素材。先收集要用的所有素材与音乐。 回看和分类。按照脚本的结构进行素材分类&am…

影视剪辑视频制作教程,必备私藏软件工具分享给大家

影视剪辑最直接粗暴的方式就是送钱给作者&#xff0c;你只要发出剪辑的视频&#xff0c;有流量就有钱。所以现在很多新手自媒体都会选择影视解说赛道&#xff0c;但是影视剪辑视频的创作过程也是有很多重点要抓的&#xff0c;不搞清楚&#xff0c;账号也很难做起来&#xff01;…

我们要被淘汰了?从科技变革看"ChatGPT"与"无代码开发"

现在只要一上网&#xff0c;就能看见GPT都在说“好厉害”、“太牛了”、“新技术要诞生了”、“我们人类要被淘汰了”之类的话题。 但是这伟大的技术变革到底给我们带来了什么呢&#xff1f;答案好像又比较模糊。现在ChatGPT的代写、问答&#xff0c;以及开始做的搜索、办公是目…

计算机相关专业混体制的解决方案(考公务员)

文章目录 序&#xff1a;编制介绍1、公务员报考要求2、公务员工作待遇3、公务员工作内容4、公务员报考复习 序&#xff1a;编制介绍 编制介绍&#xff1a;编制&#xff0c;也就是常说的铁饭碗。 编制的诞生为了控制吃财政饭的人员数量无限膨胀而设置的&#xff0c;所以名额有限…

在线LLM应用集锦(持续更新ing...)

诸神缄默不语-个人CSDN博文目录 本博文关注能够在线直接用的AI大模型应用。 大模型冲鸭&#xff01;加速&#xff01; 最近更新时间&#xff1a;2023.7.24 最早更新时间&#xff1a;2023.6.8 文章目录 1. 自研2. 非自研3. LLM衍生服务 1. 自研 聊天机器人 ChatGPT https://c…

“云炬众创”小程序的操作演示

1是什么 “云炬众创”是云炬网络公司在国家“大众创新、万众创业”口号号召下开发的一个探索创业性的小程序&#xff0c;目前主要内容是考研真题等学习资料的免费分享和下载。 2为什么 &#xff08;1&#xff09;考研真题等学习有很重要的价值 &#xff08;2&#xff09;考…

ChatGPT应用|科大讯飞星火杯认知大模型场景创新赛开始报名了!

ChatGPT发布带来的 AI 浪潮在全球疯狂蔓延&#xff0c;国内掀起的大模型混战已经持续半年之久&#xff0c;国产大模型数量正以惊人的速度增长&#xff0c;据不完全统计&#xff0c;截止7月14号已经达到了111个&#xff0c;所谓的“神仙打架”不过如此了吧。 &#xff08; 包括但…

chatgpt赋能python:Python中的迭代器

Python中的迭代器 在Python中&#xff0c;迭代器是一种对象&#xff0c;它可以让我们可以遍历&#xff08;或迭代&#xff09;序列中的元素而不必了解它们如何存储在内存中。迭代器是Python中许多高级构造的基础 - 他们节省了空间&#xff0c;并且它们能够帮助我们更有效地处理…

chatgpt赋能python:Python迭代次数

Python迭代次数 Python作为一个动态语言&#xff0c;具有简单易学、易读易写、适用于快速开发等优点&#xff0c;已经成为众多开发者的首选语言。而其中的迭代功能更是方便快捷&#xff0c;可以用于处理数据集合或者处理流程控制等方面。但是&#xff0c;迭代次数同样是一个需…

2022年中考英语热点话题作文预测(满分范文15篇)

01 北京冬奥会 假设你是李华&#xff0c;最近收到新西兰笔友Peter的电子邮件&#xff0c;说他对北京冬奥会的吉祥物冰墩墩和冬残奥会的吉祥物雪容融非常感兴趣&#xff0c;但对其具体寓意不太清楚&#xff0c;请你参照下面表格的内容&#xff0c;给他回一封电子邮件。 注意&a…

CET4之作文

目录 一、议论文 1.1、现象解释类 1.1.1、18年12月 1.1.2、20年12月 1.1.3、20年7月 1.2、观点选择类 1.2.1、16年12月 1.4、图片表格类 二、应用文 2.1、感谢信 2.2、建议信 2.3、推荐信 2.4、邀请信 一、议论文 1.1、现象解释类 1.1.1、18年12月 the challeng…

Postman无法正常启动,打开后一片空白,只显示顶部菜单栏

问题现象 后端程序开发完成后&#xff0c;想要使用postman调试接口&#xff0c;验证接口是否通。但是打开postman却一片空白&#xff0c;只有菜单栏&#xff0c;其他都是空白&#xff0c;如下图所示 解决方法 设置环境变量即可。 在环境变量窗口下&#xff0c;选择系统变量>…

肝了一晚帮她搭建完个人网站——利用Docker在单节点上实现内外网隔离网站部署(Nginx、Wordpress、MySQL)

目录 1、前言2、注册3、重置服务器实例密码4、配置安全规则5、登录服务器6、更新系统7、安装Docker8、创建Docker子网络9、创建子网内的MySQL实例10、创建子网内的WordPress实例11、创建Nginx反向代理实例12、查看状态13、配置WordPress14、发布站点15、访问站点16、Docker命令…

基于vue3的京东nutui组件库的表单校验规则:怎样进行表单验证?怎样只使用指定的某一个规则进行校验呢?

官网&#xff1a; NutUI - 移动端 Vue2、Vue3、小程序 组件库京东风格的轻量级移动端 Vue、React 组件库https://nutui.jd.com/#/component/form 用法&#xff1a; &#xff08;详细的代码在下面&#xff0c;这里先只说主要的使用方法&#xff09; 全部校验&#xff1a; 如…