opencv各个模块介绍(2)

Features2D 模块:特征检测和描述子计算模块,包括SIFT、SURF等算法。

Features2D 模块提供了许多用于特征检测和描述子匹配的函数和类,这些函数和类可用于图像特征的提取、匹配和跟踪。

  1. FeatureDetector:特征检测器的基类,包括常用的特征检测算法,如ORB、SIFT、SURF、FAST 等。

  2. DescriptorExtractor:描述子提取器的基类,用于从图像中提取特征点周围的描述子,包括常用的描述子算法,如ORB、SIFT、SURF 等。

  3. Feature2D:特征检测器和描述子提取器的统一接口类,可以方便地使用各种特征检测和描述子提取算法。

  4. DescriptorMatcher:描述子匹配器的基类,用于对提取出的描述子进行匹配,包括常用的匹配算法,如BruteForce、FlannBased 等。

  5. drawKeypoints:用于在图像上绘制特征点的函数,可以将检测到的特征点可视化显示在图像上。

  6. drawMatches:用于在两幅图像上绘制特征点匹配的函数,可以将两幅图像中匹配的特征点对可视化显示出来。

  7. compute:用于计算图像中的特征点和描述子的函数,可以对输入的图像进行特征点检测和描述子提取。

  8. match:用于对输入的两组描述子进行匹配的函数,可以对提取出的描述子进行匹配操作。

这些函数和类提供了在图像中进行特征检测、描述子提取和匹配的基本工具,通过使用它们,我们可以提取图像中的关键特征点和描述子,进行特征匹配和跟踪,从而实现诸如目标识别、图像拼接、运动跟踪等应用。

Calib3d 模块:相机标定和三维重建模块

OpenCV Calib3d 模块函数和类:

  1. calibrateCamera:用于对相机进行内参和畸变参数的标定,通过捕获多个图像中的棋盘格等模板,并提取角点位置来进行相机标定。

  2. stereoCalibrate:用于立体相机的标定,通过匹配两个相机的图像中的对应点,求解两个相机之间的外参和内参关系。

  3. stereoRectify:用于校正立体相机的图像,使得两个相机的光学轴平行,方便后续的立体匹配。

  4. stereoMatch:用于立体匹配,通过匹配左右两个相机的图像,得到对应点的深度信息。

  5. solvePnP:用于从图像中的二维点和三维点之间求解相机的姿态(旋转和平移矩阵)。

  6. findHomography:用于寻找两幅图像之间的单应性矩阵,通常用于图像配准和目标跟踪。

  7. triangulatePoints:用于三角化立体视觉中的对应点,求解三维空间中的点坐标。

  8. undistort:用于去畸变,将畸变图像转换为无畸变的图像。

这些函数和类在摄像机标定、立体视觉和三维重构等领域具有广泛的应用,可以帮助我们理解场景的三维结构、测量物体的尺寸、进行虚拟现实等任务。通过使用这些函数和类,我们可以实现各种基于摄像机的视觉任务,并提高图像处理和计算机视觉的效果和准确性。

Videoio 模块:视频输入/输出模块,用于读取和写入视频文件

  1. VideoCapture:用于从视频文件或摄像头捕获视频帧的类,可以通过该类实例来读取视频文件或捕获摄像头视频流。

  2. VideoWriter:用于将视频帧写入视频文件的类,可以通过该类实例将视频帧写入到视频文件中。

  3. cv::CAP_PROP_ 参数*:一系列用于设置视频流参数的常量,如帧率、分辨率、亮度、对比度等

  4. isOpened:用于检查 VideoCapture 或 VideoWriter 是否成功打开视频文件或捕获设备。

  5. read:用于从 VideoCapture 实例中读取下一帧视频。

  6. write:用于将视频帧写入到 VideoWriter 实例中。

  7. set:用于设置 VideoCapture 或 VideoWriter 的参数,如帧率、分辨率等。

  8. get:用于获取 VideoCapture 或 VideoWriter 的参数,如帧率、分辨率等。

通过使用 Videoio 模块提供的函数和类,我们可以方便地读取视频文件、捕获摄像头视频流,并进行视频数据的处理和分析。这些函数和类为我们在计算机视觉和图像处理领域中处理视频数据提供了便捷的工具,可以帮助我们实现视频内容的处理、分析和应用。

Dnn 模块:深度学习模块,支持使用深度学习模型进行图像处理任务

  1. readNet:用于加载深度学习模型的函数,支持多种深度学习框架(如 TensorFlow、Caffe、Darknet 等)的模型格式。

  2. Net:代表一个深度学习模型的类,可以用于进行前向推断、获取输出等操作。

  3. setInput:用于设置输入数据到深度学习模型中,例如设置图像作为模型的输入。

  4. forward:执行前向推断,获取模型的输出。

  5. getUnconnectedOutLayers:获取模型中未连接到其他层的输出层索引。

  6. getLayerNames:获取模型中所有层的名称。

  7. blobFromImage:将图像转换为网络模型的输入 blob 格式。

  8. NMSBoxes:执行非最大抑制(Non-Maximum Suppression),用于目标检测中去除重叠的边界框。

通过使用 Dnn 模块提供的函数和类,我们可以方便地加载和使用深度学习模型,进行图像识别、目标检测、人脸识别等任务。这些函数和类为我们在计算机视觉领域应用深度学习模型提供了强大的工具,可以帮助我们实现各种复杂的视觉任务,并提高处理效率和准确性。

备注:

NMS(Non-Maximum Suppression,非最大抑制)是一种常用的目标检测算法,用于在目标检测任务中去除重叠的边界框,保留最相关的目标框。NMS 算法通常应用于神经网络输出的边界框预测中。

NMS 的原理如下:

  1. 得分排序:首先,对所有的候选边界框按照其置信度得分进行排序,通常情况下,得分越高的边界框越可能包含真实目标。

  2. 选择最高得分框:从得分最高的边界框开始,将该边界框加入最终输出的目标框列表中。

  3. 计算重叠区域:对于剩余的边界框,计算它们与已选边界框的重叠区域的面积,通常采用交并比(IoU)来衡量两个边界框的重叠程度。

  4. 去除重叠边界框:对于与已选边界框有较大重叠的边界框,根据设定的阈值(通常为 0.5 或 0.7)来决定是否将其丢弃,只保留得分最高的边界框。

  5. 重复步骤:重复上述步骤,直到处理完所有的候选边界框。

NMS 算法可以在目标检测结果中去除大量重叠的边界框,保留最具代表性和置信度最高的目标框,从而提高目标检测算法的准确性和鲁棒性。

NMS 算法在许多目标检测器(如 Faster R-CNN、YOLO 等)中被广泛应用,是提高目标检测性能的重要组成部分。

Machine Learning(ML)模块:机器学习模块,提供了一些常见的机器学习算法实现

  1. cv::ml::SVM:支持向量机(SVM)模型的实现类,用于二分类、多分类和回归任务。

  2. cv::ml::KNearest:k-最近邻(KNN)模型的实现类,用于基于最近邻的分类和回归。

  3. cv::ml::RTrees:随机森林(Random Forest)模型的实现类,用于决策树集成学习。

  4. cv::ml::Boost:Boosting 模型的实现类,用于集成多个弱分类器以提高性能。

  5. cv::ml::ANN_MLP:人工神经网络(MLP)模型的实现类,用于深度神经网络的训练和预测。

  6. cv::ml::EM:期望最大化(Expectation-Maximization)算法的实现类,用于高斯混合模型的聚类。

  7. cv::ml::TrainData:用于加载和处理训练数据集的类,方便机器学习模型的训练。

  8. cv::ml::ParamGrid:用于定义参数网格搜索的类,帮助进行模型参数调优。

  9. cv::ml::StatModel:所有机器学习模型的基类,包括了训练和预测等通用方法。

这些函数和类提供了丰富的功能和工具,可以帮助我们在 OpenCV 中应用各种机器学习算法,并实现图像分类、目标检测、特征提取等复杂任务。通过熟练掌握这些函数和类的用法,我们可以更好地利用机器学习技术来解决计算机视觉和图像处理领域的挑战。

Stitching 模块:图像拼接模块,用于将多幅图片拼接成全景图像

  1. cv::Stitcher::create():静态方法,用于创建 Stitcher 类的实例。

  2. cv::Stitcher::stitch():拼接多幅图像,生成全景图像。可以通过该方法传入图像集合进行拼接,并获取拼接后的全景图像。

  3. cv::Stitcher::estimateTransform():估计图像间的转换矩阵,用于拼接图像时的配准。

  4. cv::Stitcher::composePanorama():对拼接后的全景图像进行优化和融合,消除拼接过程中的接缝。

  5. cv::Stitcher::registrationResol():设置拼接的分辨率,影响最终拼接结果的清晰度和质量。

  6. cv::Stitcher::blendImages():对拼接的图像进行融合处理,使得拼接后的全景图像看起来更加自然。

Photo 模块:图像编辑和修复模块,包括图像去噪、颜色校正等功能

Photo 模块提供了许多图像处理和修复的函数和类,用于实现图像增强、去噪、颜色校正等功能。以下是一些常用的 OpenCV Photo 模块函数和类:

  1. cv::fastNlMeansDenoising():使用非局部均值去噪算法对图像进行去噪处理。

  2. cv::colorChange():将图像的颜色转换为目标颜色。

  3. cv::seamlessClone():无缝克隆算法,将源图像的一部分融合到目标图像中,使得融合后的图像看起来自然。

  4. cv::illuminationChange():调整图像的光照条件。

  5. cv::textureFlattening():纹理平滑算法,用于减少图像中的纹理细节。

  6. cv::rollMinEigenVal():计算图像的最小特征值,用于角点检测和特征匹配。

  7. cv::edgePreservingFilter():边缘保留滤波器,用于保留图像中的细节信息而抑制噪声。

  8. cv::detailEnhance():增强图像的细节和结构。

  9. cv::decolor():将彩色图像转换为灰度图像,但保留图像的结构信息。

  10. cv::colorChange():改变图像的颜色。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/285199.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[BT]BUUCTF刷题第6天(3.24)

第6天 Web [极客大挑战 2019]PHP Payload: O:4:"Name":3:{s:14:"%00Name%00username";s:5:"admin";s:14:"%00Name%00password";s:3:"100";}这道题考点是网站源码备份文件泄露和PHP反序列化,有篇介…

t-rex2开放集目标检测

论文链接:http://arxiv.org/abs/2403.14610v1 项目链接:https://github.com/IDEA-Research/T-Rex 这篇文章的工作是基于t-rex1的工作继续做的,核心亮点: 是支持图片/文本两种模态的prompt进行输入,甚至进一步利用两…

013_Linux(上传rz,下载sz,tar,zip,unzip)

目录 一、上传、下载 1、通过鼠标操作 (1)下载 (2)上传 2、通过命令操作 rz、sz (1)下载 sz (2)上传 rz 二、压缩、解压 1、tar命令 (1)压缩 &…

使用amd架构的计算机部署其他架构的虚拟机(如:arm)

1 下载quem模拟器 https://qemu.weilnetz.de/w64/2 QEMU UEFI固件文件下载(引导文件) 推荐使用:https://releases.linaro.org/components/kernel/uefi-linaro/latest/release/qemu64/QEMU_EFI.fd3 QEMU 安装 安装完成之后,需要将安装目录添加到环境变…

vscode的一些技巧

技巧1:调试时传参数 在launch.json的configuration中"pwd"或者"program"选项之后添加如下选项: “--args”:["参数1", "参数2", ..., "参数3] 参数之间使用逗号隔开 技巧2:断点 普通断点使…

通过dbeaver链接dm8数据库

一、环境说明 windows 11 vmware 17 ubuntu 22 tt:~$ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 22.04.3 LTS Release: 22.04 Codename: jammytt:~$ docker info Client:Version: 24.0.5Context: d…

Python 全栈系列236 rabbit_agent搭建

说明 通过rabbit_agent, 以接口方式实现对队列的标准操作,将pika包在微服务内,而不必在太多地方重复的去写。至少在服务端发布消息时,不必再去考虑这些问题。 在分布式任务的情况下,客户端本身会启动一个持续监听队列的客户端服…

Java研学-SpringBoot(二)

二 Spring Boot 介绍 1 简介 Spring Boot是由Pivotal团队提供的全新框架,主要目标是简化Spring应用程序的配置和部署过程,减少开发者在项目搭建和配置上的工作量,让开发者能够更专注于业务逻辑的实现。它使用特定的方式来进行配置&#xff0…

Request请求参数----中文乱码问题

一: GET POST获取请求参数: 在处理为什么会出现中文乱码的情况之前, 首先我们要直到GET 以及 POST两种获取请求参数的不同 1>POST POST获取请求参数是通过输入流getReader来进行获取的, 通过字符输入流来获取响应的请求参数, 并且在解码的时候, 默认的情况是 ISO_885…

基于SpringBoot+Vue+Mybatis的408刷题小程序管理端

简介 原始数据:书目信息、章节信息、题目信息、系统菜单、系统角色、系统用户。 主要任务:系统主要采用spring boot作为后端框架,前端使用vueelementUI,为408刷题小程序提供一个方面的管理和维护的任务,主要功能包括…

图解Kafka架构学习笔记(三)

准备Kafka环境 这里推荐使用Docker Compose快速搭建一套本地开发环境。 以下docker-compose.yml文件用来搭建一套单节点zookeeper和单节点kafka环境,并且在8080端口提供kafka-ui管理界面。 version: 2.1services:zoo1:image: confluentinc/cp-zookeeper:7.3.2hos…

day6:STM32MP157——串口通信实验

使用的是cortex A7内核 【串口通信的工作原理】 本次实验使用的是uart4的串口,分别使用了uart4_tx和uart4_rx两个引脚。根据板子的原理图我们可以知道,他们分别对应着芯片的PG11和PB2 从引脚名字也可以知道使用了GPIO口,所以本次实验同样需…

ubuntu20.04安装 ffmpeg 开发环境

参考:参考1 一些相关软件包,已打包整理好,如下 源码包 1、安装步骤 创建安装目录 sudo mkdir -p /usr/local/ffmpeg/lib 解压源码 tar -jxf ffmpeg-4.3.2.tar.bz2 到指定ffmpeg目录进行配置 cd ffmpeg-4.3.2/ 配置:会报错很多…

Spark Streaming DStream

Spark Streaming DStream DStream 即Discretized Stream,中文叫做离散流,Spark Streaming提供的一种高级抽象,代表了一个持续不断的数据流。 DStream可以通过输入数据源来创建,比如Kafka、Flume,也可以通过对其他DS…

【JAVA】通过JAVA实现用户界面的登录

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法|MySQL| ​💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-wyCvaz0EBNwHcwsi {font-family:"trebuchet ms",verdana,arial,sans-serif;f…

2025汤家凤考研数学视频,基础网课百度网盘课程+PDF讲义资料

2025汤家凤大神及数学全程 docs.qq.com/doc/DTmtOa0Fzc0V3WElI 复制粘贴到浏览器,可以见所有的Ke 第一轮 夯实基础 1.阅读大纲考查要求,明确每章的学习目标; 2.按节学习数学理论基础知识,吃透书中例题; 3.学习每章…

数学建模综合评价模型与决策方法

评价方法主要分为两类,其主要区别在确定权重的方法上 一类是主观赋权法,多次采取综合资讯评分确定权重,如综合指数法,模糊综合评判法,层次评判法,功效系数法等 另一类是客观赋权法,根据各指标…

ubuntu上一款好用的串口工具screen

看名字,你猜他是什么? 安装 sudo apt install screen 然后将USB串口接到虚拟机,执行dmesg命令查看串口设备名: 测试: sudo screen /dev/ttyUSB0 115200确实很简单。

机器视觉学习(六)—— 图像的颜色识别

目录 一、色彩空间 1.1 RGB色彩空间 1.2 HSV色彩空间 1.3 灰度 1.4 CMYK色彩空间 1.5 Lab色彩空间 二、色彩空间转换 三、识别颜色 3.1 识别一种特定的颜色 3.2 识别多种颜色 一、色彩空间 计算机视觉中常用的色彩空间有RGB色彩空间、HSV色彩空间、CMYK色彩空间、La…

如何设计循环队列(两种方法)

文章目录 前言一、方法一:数组法二、方法二.链表法总结 前言 前面有提到过队列的知识,这次来说一下怎么设计一个循环队列 一.循环队列(力扣) . - 力扣(LeetCode). - 备战技术面试?力扣提供海量技术面试资…