Python----计算机视觉处理(Opencv:图像边缘检测:非极大值抑制,双阈值筛选)

一、 高斯滤波

        边缘检测本身属于锐化操作,对噪点比较敏感,所以需要进行平滑处理。这里使用的是一个5*5的高斯 核对图像进行消除噪声。

二、计算图像的梯度和方向

三、非极大值抑制

        在得到每个边缘的方向之后,其实把它们连起来边缘检测就算完了,经过第二步得到的边缘不经过处理是没办法使用的,因为高斯滤波的原因,边缘会变得模糊,导 致经过第二步后得到的边缘像素点非常多,因此我们需要对其进行一些过滤操作,而非极大值抑制就是 一个很好的方法,它会对得到的边缘像素进行一个排除,使边缘尽可能细一点。

        在该步骤中,我们需要检查每个像素点的梯度方向上的相邻像素,并保留梯度值最大的像素,将其他像 素抑制为零。假设当前像素点为(x,y),其梯度方向是0°,梯度值为G(x,y),那么我们就需要比 较G(x,y)与两个相邻像素的梯度值:G(x-1,y)和G(x+1,y)。如果G(x,y)是三个值里面最 大的,就保留该像素值,否则将其抑制为零。

        并且如果梯度方向不是0°、45°、90°、135°这种特定角度,那么就要用到插值算法来计算当前像素点在 其方向上进行插值的结果了,然后进行比较并判断是否保留该像素点。这里使用的是单线性插值,通过 A1和A2两个像素点获得dTmp1与dTmp2处的插值,然后与中心点C进行比较。具体的插值算法请参考图 像旋转实验。

四、 双阈值筛选

        经过非极大值抑制之后,我们还需要设置阈值来进行筛选,当阈值设的太低,就会出现假边缘,而阈值 设的太高,一些较弱的边缘就会被丢掉,因此使用了双阈值来进行筛选,推荐高低阈值的比例为2:1到 3:1之间

        当某一像素位置的幅值超过最高阈值时,该像素必是边缘像素;当幅值低于最低像素时,该像素必不是 边缘像素;幅值处于最高像素与最低像素之间时,如果它能连接到一个高于阈值的边缘时,则被认为是 边缘像素,否则就不会被认为是边缘。

        也就是说,上图中的A和C是边缘,B不是边缘。因为C虽然不超过 最高阈值,但其与A相连,所以C就是边缘。

        具体来说,对于非极大值抑制之后的图像来说,设置两个阈值threshold1和threshold2,其中 threshold1是低阈值,threshold2是高阈值。然后遍历图像,把梯度值小于低阈值的点的梯度值设为 0,得到图像1,把梯度值小于高阈值的点的梯度值设为0,得到图像2。由于图像2的阈值比较高,所以 其中会损失掉很多有用的图像信息,而图像1的阈值比较低,所以会保留很多的信息,包括真正的边缘和虚假的边缘。

        那么我们就可以以图像2为基础,以图像1为补充来连接图像的边缘,其具体步骤为:

•        对图像2进行遍历,当遇到一个非零的像素点P时,记录以P为开始的轮廓线,知道轮廓线的终点位 置Q。

•        考察图像1中与图像2中的Q点位置对应的点S的8邻近区域,如果在S点的8邻近区域内有非零像素存 在,就将其作为边界点放入图像2中作为点R。然后再从点R开始重复第一步,直到在图像1和图像2 中都无法继续为止。

•        当完成对包含点P的轮廓线的寻找之后,将这条轮廓线标为已寻找,然后接着寻找下一条轮廓,就 是重复第1步、第2步、第3步,直到图像2中找不到新的轮廓为止。

        经过筛选之后的所保存下来的点就是我们图像中的边缘点了

五、图像边缘检测 

5.1、有二值化

导入模块

import cv2

输入图像

img=cv2.imread('lenda01.png')

灰度化

img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

二值化

ret1,img_threshold1=cv2.threshold(img_gray,127,255,cv2.THRESH_BINARY)

高斯滤波

img_Guss1=cv2.GaussianBlur(img_threshold1,(5,5),sigmaX=1.5)

梯度与方向

非极大值抑制

双阈值筛选

img_Canny1=cv2.Canny(img_Guss1,122,127,L2gradient=True)

输出图像

cv2.imshow('img',img)
cv2.imshow('img_Canny1',img_Canny1)
cv2.waitKey(0)

完整代码 

import cv2  img = cv2.imread('lenda01.png')  # 将图像从BGR颜色空间转换为灰度图像  
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 使用全局阈值进行二值化处理  
#   - ret1:  计算得到的阈值 (127)  
#   - img_threshold1:  二值化后的图像,像素值大于127设置为255,否则设置为0  
ret1, img_threshold1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)  # 使用 Otsu's 阈值法进行二值化处理,并进行反转  
#   - ret2:  Otsu's算法计算得到的阈值  
#   - img_threshold2:  二值化后的图像,像素值小于阈值设置为255,否则设置为0  
ret2, img_threshold2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_OTSU + cv2.THRESH_BINARY_INV)  # 对二值化后的图像进行高斯模糊处理,以减少噪声  
#   - img_threshold1:  输入图像(二值化后的图像)  
#   - (5, 5):  高斯核的大小  
#   - sigmaX=1.5:  X方向上的高斯核标准差  
img_Guss1 = cv2.GaussianBlur(img_threshold1, (5, 5), sigmaX=1.5)  # 使用 Canny 边缘检测算法提取图像的边缘  
#   - img_Guss1:  输入图像(高斯模糊后的二值化图像)  
#   - ret2:  低阈值,用于边缘检测的阈值下限 (这里使用Otsu算法计算得到的阈值)  
#   - ret1:  高阈值,用于边缘检测的阈值上限 (这里使用固定阈值127)  
#   - L2gradient=True:  使用 L2 范数计算图像梯度,更准确  
img_Canny1 = cv2.Canny(img_Guss1, ret2, ret1, L2gradient=True)  # 显示原始图像  
cv2.imshow('img', img)  
# 显示 Canny 边缘检测后的图像  
cv2.imshow('img_Canny1', img_Canny1)  
# 等待用户按下键盘上的任意键  
cv2.waitKey(0)  

5.2、无二值化 

import cv2img = cv2.imread('lenda01.png')# 将图像从BGR颜色空间转换为灰度图像
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 使用全局阈值进行二值化处理
#   - ret1:  计算得到的阈值 (127)
#   - img_threshold1:  二值化后的图像,像素值大于127设置为255,否则设置为0
ret1, img_threshold1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)# 使用 Otsu's 阈值法进行二值化处理,并进行反转
#   - ret2:  Otsu's算法计算得到的阈值
#   - img_threshold2:  二值化后的图像,像素值小于阈值设置为255,否则设置为0
ret2, img_threshold2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_OTSU + cv2.THRESH_BINARY_INV)# 对灰度图像进行高斯模糊处理,以减少噪声
#   - (5, 5):  高斯核的大小
#   - sigmaX=1.5:  X方向上的高斯核标准差
img_Guss2 = cv2.GaussianBlur(img_gray, (5, 5), sigmaX=1.5)# 使用 Canny 边缘检测算法提取图像的边缘
#   - img_Guss2:  输入图像(高斯模糊后的灰度图像)
#   - ret2:  低阈值,用于边缘检测的阈值下限
#   - ret1:  高阈值,用于边缘检测的阈值上限
#   - L2gradient=True:  使用 L2 范数计算图像梯度,更准确
img_Canny2 = cv2.Canny(img_Guss2, ret2, ret1, L2gradient=True)# 显示原始图像
cv2.imshow('img', img)
# 显示 Canny 边缘检测后的图像
cv2.imshow('img_Canny2', img_Canny2)
# 等待用户按下键盘上的任意键
cv2.waitKey(0)
```

六、库函数

Canny()

使用 Canny 算法查找图像中的边缘

该函数在输入图像中查找边缘,并使用 Canny 算法在输出映射边缘中标记它们。threshold1 和 threshold2 之间的最小值用于 Edge 链接。最大值用于查找强边缘的初始分段。查看 http://en.wikipedia.org/wiki/Canny_edge_detector

cv.Canny(	image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]]	) ->	edges
cv.Canny(	dx, dy, threshold1, threshold2[, edges[, L2gradient]]	) ->	edges
方法描述
image8 位输入图像。
edges输出边缘映射;单通道 8 位图像,其大小与 图像 相同。
threshold1磁滞过程的第一个阈值。
threshold2滞后程序的第二个阈值。
apertureSize孔径大小。
L2gradient
dx输入图像的 16 位 x 导数(CV_16SC1 或 CV_16SC3)
dy输入图像的 16 位 y 导数(与 dx 类型相同)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41246.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Deepseek写扫雷uniapp小游戏

扫雷作为Windows系统自带的经典小游戏,承载了许多人的童年回忆。本文将详细介绍如何使用Uniapp框架从零开始实现一个完整的扫雷游戏,包含核心算法、交互设计和状态管理。无论你是Uniapp初学者还是有一定经验的开发者,都能从本文中获得启发。 …

JS数组方法

数组方法 一、数组 JavaScript 数组的大小是可调整的,并且可以包含不同 数据类型。(当不需要这些特性时,请使用 类型数组。) 注:JavaScript 类型数组是类似数组的对象,它提供了一种在内存缓冲区中读取和写…

string 的接口

我们继续来讲解一些常用的string接口。 一.at接口 我们来看一个越界的问题。 我们运行之后发现这是一个断言错误,直接就终止我们的程序了,不能作为异常被捕捉到,但是我们如果不想让程序直接崩溃该怎么办呢? 此时我们就要用到at关键…

2000-2019年各省地方财政行政事业性收费收入数据

2000-2019年各省地方财政行政事业性收费收入数据 1、时间:2000-2019年 2、来源:国家统计局、统计年鉴 3、指标:行政区划代码、地区、年份、地方财政行政事业性收费收入 4、范围:31省 5、指标说明:地方财政行政事业…

Pytorch学习笔记(九)Learning PyTorch - Deep Learning with PyTorch: A 60 Minute Blitz

这篇博客瞄准的是 pytorch 官方教程中 Learning PyTorch 章节的 Deep Learning with PyTorch: A 60 Minute Blitz 部分, 官网链接:https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html 完整网盘链接: https://pan.baidu.com/s/1L9…

Elasticsearch 的搜索功能

Elasticsearch 的搜索功能 建议阅读顺序: Elasticsearch 入门Elasticsearch 搜索(本文) 1. 介绍 使用 Elasticsearch 最终目的是为了实现搜索功能,现在先将文档添加到索引中,接下来完成搜索的方法。 查询的分类&…

比特币等虚拟货币实时价格使用说明,数字货币价格获取,k线获取,实时价格获取

数据截图 k线数据 websocket 实时价格数据 根据这些数据可以做出自己的产品 获取时间段内的k线数据 在开始之前,你需要知道的知识: 币种缩写英文名币种IDBTCBitcoinbitcoinETHEthereumethereumEOSEOSeosUSDTTethertetherLTCLitecoinlitecoinUSDDol…

初阶7 vector

本章重点 vector的介绍vector的使用vector的模拟实现 1.vector的介绍 vector就类似数据结构中的顺序表 vector是表示可变大小数组的序列容器。 就像数组一样,vector也采用的连续存储空间来存储元素。 意味着可以采用下标对vector的元素 进行访问,和数…

解码未来:DeepSeek开源FlashMLA,推理加速核心技术,引领AI变革

前言: DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。 项目地址:https://github.com/deepseek-ai/FlashMLA 1:FlashMLA 是什么呀? MLA是DeepSeek大模型的重要技术创新点&…

scss预处理器对比css的优点以及基本的使用

本文主要在vue中演示&#xff0c;scss的基本使用。安装命令 npm install sass sass-loader --save-dev 变量 SCSS 支持变量&#xff0c;可将常用的值&#xff08;如颜色、字体大小、间距等&#xff09;定义为变量&#xff0c;方便重复使用和统一修改。 <template><…

GPU架构与通信互联技术介绍

文章目录 GPU架构介绍SM 和 Warp Scheduler GPU通信互联技术介绍1、GPUDirectGPUDirect Shared AccessGPUDirect P2PGPUDirect for VideoGPUDirect for RDMARDMAGPUDirect RDMA GPUDirect Storage 2、NVLink & NVSwitchNVLinkNVSwitch 3、应用场景总结 GPU架构介绍 SM 和 …

强化学习与神经网络结合(以 DQN 展开)

目录 基于 PyTorch 实现简单 DQN double DQN dueling DQN Noisy DQN&#xff1a;通过噪声层实现探索&#xff0c;替代 ε- 贪心策略 Rainbow_DQN如何计算连续型的Actions 强化学习中&#xff0c;智能体&#xff08;Agent&#xff09;通过与环境交互学习最优策略。当状态空间或动…

day 16

创建链接文件 软链接&#xff1a;又叫符号链接&#xff0c;类似win的快捷方式&#xff0c;是一种用来建立文件的特殊文件&#xff0c;这个文件里的数据都是建立链接的文件&#xff0c;但是它和建立链接的文件不是一个东西&#xff0c;如果建立链接的文件移动或删除&#xff0c…

fork系统调用

基本概念&#xff1a; 在操作系统里&#xff0c;进程是正在运行的程序的实例。fork() 函数的作用是复制当前进程&#xff0c;生成一个新的进程&#xff0c;这个新进程被称作子进程&#xff0c;而原本的进程则是父进程。这两个进程&#xff08;父进程和子进程&#xff09;会从 …

【leetcode刷题记录】(java)数组 链表 哈希表

文章目录 四、题目之&#xff1a;代码随想录(1) 代码随想录&#xff1a;数组[704. 二分查找](https://leetcode.cn/problems/binary-search/)[27. 移除元素](https://leetcode.cn/problems/remove-element/)暴力解:双指针&#xff1a; [977. 有序数组的平方](https://leetcode.…

在线运行vscode

安装 https://github.com/coder/code-server?utm_sourcesyndication&pubDate20250317 运行前预览脚本 curl -fsSL https://code-server.dev/install.sh | sh -s -- --dry-run运行脚本 curl -fsSL https://code-server.dev/install.sh | sh其他 可以通过后台服务运行&am…

【Tauri2】002——Cargo.toml和入口文件

目录 前言 正文 toml文件的基础 注释——# Comment 键值对——Key/Value 表——[table] 内联表——Inline Table 数组——Array package和crate Cargo.toml文件 Cargo.toml——dependencies Cargo.toml——lib crate-type main.rs 前言 【Tauri2】001——安装及…

Netty源码—7.ByteBuf原理三

大纲 9.Netty的内存规格 10.缓存数据结构 11.命中缓存的分配流程 12.Netty里有关内存分配的重要概念 13.Page级别的内存分配 14.SubPage级别的内存分配 15.ByteBuf的回收 9.Netty的内存规格 (1)4种内存规格 (2)内存申请单位 (1)4种内存规格 一.tiny&#xff1a;表示从…

W、M、C练题笔记(持续更新中)

web here are the flag 点击&#xff0c;页面跳转404.php&#xff0c;用bp抓包访问/flag.php页面&#xff0c;得到flag用base64解码 TryToFindFlag 打开后查看源代码 发现是robots协议&#xff0c;访问robots.txt 访问flllaaa......&#xff0c;得到空白页面&#xff0c;查看…

【高项】信息系统项目管理师(十二)项目干系人管理【3分】

项目干系人管理包括识别能够影响项目或会受项目影响的人员、团队或组织,分析干系人对项目的期望和影响,制定管理策略有效调动干系人参与项目决策和执行。项目干系人管理过程能够支持项目团队的工作。一、管理基础 1、管理的重要性 项目经理和团队管理干系人的能力决定着项目…