从零开始学cv-5: 图像的仿射变换

文章目录

  • 一,简介:
  • 二,图像仿射变换详解
    • 2.1,图像平移:
    • 2.2 ,图像旋转:
    • 2.3,仿射变换:


一,简介:

仿射变换(Affine Transformation 或 Affine Map)是一种将二维坐标(x, y)映射到另一组二维坐标(u, v)的线性变换。在这种变换中,坐标点的相对位置和属性保持不变,即变换是保持直线平行性和直线交点不变的。仿射变换主要包括以下几种基本操作:平移、旋转、镜像、缩放、翻转和错切。

二,图像仿射变换详解

具体来说,仿射变换的过程可以描述为以下几种情况:

● 平移:将图像沿某个方向移动一定距离。
● 旋转:围绕某个点将图像旋转一定角度。
● 镜像:以某条线为轴,将图像进行对称翻转。
● 缩放:按照一定比例增大或缩小图像。
● 翻转:将图像沿水平或垂直方向进行翻转。
● 错切:沿某一方向倾斜图像,使得图像的一侧发生平移,而另一侧保持不动。

以下图所示,可以直观地展示这些仿射变换的效果。需要注意的是,虽然仿射变换是线性的,但它包括了非线性成分(如错切),因为它可以表示为线性变换的组合,并附加一个平移项。
在这里插入图片描述
在opencv_python中,实现放射变换的函数为:
cv2.warpAffine(img,M,size,flags,borderMode,borderValue)
函数说明:可以通过构建不同的M矩阵以及设置不同的参数来实现不同的仿射变换效果.

参数说明:
img:输入图像,可以是灰度图像或彩色图像。
M:一个 2×3 的变换矩阵,用于定义仿射变换。
size:输出图像的大小,格式为 (width, height)。
flags:插值方法标志,用于确定如何计算输出图像的像素值。常见的插值方法包括:
cv2.INTER_NEAREST:最近邻插值。
cv2.INTER_LINEAR:双线性插值(默认值)。
cv2.INTER_AREA:使用像素区域关系进行重采样。
cv2.INTER_CUBIC:双三次插值。
cv2.INTER_LANCZOS4:Lanczos 插值。
borderMode:边界模式,用于处理边界外的像素。默认值为 cv2.BORDER_CONSTANT。其他选项包括:
cv2.BORDER_REPLICATE:复制边界像素。
cv2.BORDER_REFLECT:反射边界像素。
cv2.BORDER_REFLECT101:反射边界像素,不包括边缘。
cv2.BORDER_WRAP:包裹模式。
borderValue:当 borderMode 为 cv2.BORDER_CONSTANT 时,用于填充边界外的像素的值。默认值为 (0, 0, 0),对于灰度图像是单一值,对于彩色图像是三个值。
borderValue - 边界填充值; 默认情况下,它为0
其中:M作为仿射变换矩阵,一般反映平移或旋转的关系,为InputArray类型的2×3的变换放射变换的构建可以遵循下图
在这里插入图片描述
简而言之,cv2.warpAffine 函数通过指定的变换矩阵 M 对输入图像 img 进行仿射变换,生成指定大小 size 的新图像,并使用指定的插值方法和边界模式来处理变换过程中的像素计算和边界问题。

2.1,图像平移:

将图像中所有的点按照指定的平移量水平或者垂直移动。根据上图中可知,要想实现图像平移操作,需要设置移动的距离X,Y
在这里插入图片描述
代码实现:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵H
# 在x轴方向移动多少距离,在y轴方向移动多少距离
H = np.float32([[1, 0, 100], [0, 1, 100]])
rows, cols = img.shape[:2]
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, H, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
原图:
在这里插入图片描述
效果图:
在这里插入图片描述
图像从原始位置像右下方移动了100个像素

2.2 ,图像旋转:

以图像的中心为原点,旋转一定的角度,也就是将图像上的所有像素都旋转一个相同的角度。旋转后图像的大小一般会改变,即可以把转出显示区域的图像截去,或者扩大图像范围来显示图像的所有部分。图像旋转的仿射矩阵m的构建如下所示:
在这里插入图片描述
此仿射矩阵的构建需要确定旋转角度的正弦和余弦值,相对平移而言稍显麻烦,所以opencv提供了一个简单的获取仿射矩阵的方法cv2.getRotationMatrix2D(center, angle, scale)
参数说明:

center:旋转的中心点坐标,格式为 (centerX, centerY)。
angle:旋转角度,正值表示逆时针旋转,负值表示顺时针旋转,单位为度。
scale:图像缩放比例,如果 scale 为 1,则图像大小保持不变;如果 scale 大于 1,图像放大;如果 scale 小于 1,图像缩小。
返回值:返回一个 2×3 的变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行旋转

代码:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵Hrows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # 旋转中心为图像中点,角度为四十五度,逆时针旋转炳保持原大小
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, M, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
在这里插入图片描述

2.3,仿射变换:

仿射变换是线性变换,除了简单的进行单独使用,还可以将其中的几种结合在一起实现新的仿射变换,但若执行的操作很多,相应要构造的仿射矩阵也会更复杂,所以OpenCV提供了一个求仿射变换矩阵的函数:cv2.getAffineTransform( src, dst ):
cv2.getAffineTransform 用于计算从一个三角形到另一个三角形的仿射变换矩阵。这个矩阵可以用来进行图像的仿射变换,如平移、旋转、缩放和剪切。cv2.getAffineTransform( src, dst ):
函数说明:

通过找原图像中三个点的坐标和变换图像的相应三个点坐标,创建一个2X3的矩阵。最后这个矩阵会被传给函数cv2.warpAffine()
功能:计算从一个二维三角形到另一个二维三角形的仿射变换矩阵。
参数:
src:源三角形三个顶点的坐标,格式为浮点数数组
dst:目标三角形三个顶点的坐标,格式与 src 相同。
返回值:返回一个
2×3 的仿射变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行变换。
简而言之,cv2.getAffineTransform 通过三个对应点的坐标来计算仿射变换矩阵。这三个点可以是任意位置,但通常它们被选为图像中的关键特征点,以确保变换后的图像与目标位置对齐。下面贴一张图片加深理解:
在这里插入图片描述
将左图三个点空间拉伸到右图三个点位置

代码:

import cv2
import numpy as npimg = cv2.imread(r'D:\pythonProject\13.jpg')
rows, cols, ch = img.shapepts1 = np.float32([[0, 0], [200, 50], [50, 200]])
pts2 = np.float32([[10, 100], [200, 50], [100, 250]])
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(img, M, (cols, rows))cv2.imshow("dst", dst)
cv2.waitKey(0)

效果:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/406118.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

校园综合服务小程序的设计

管理员账户功能包括:系统首页,个人中心,用户管理,卖家管理,发布信息管理,订单信息管理,类型管理,系统管理 微信端账号功能包括:系统首页,发布信息&#xff0…

webm格式怎么转换成mp4?7个有效方法将webm转mp4

在数字媒体的浩瀚宇宙中,视频格式的多样性犹如繁星点点,既点亮了创意的火花,也铺设了内容分享的广阔道路。每一种视频格式都承载着其独特的技术优势与设计初衷,WebM便是其中一颗璀璨的新星,专为优化网络传输而生。它凭…

【C++从练气到飞升】14---深入浅出继承

🎈个人主页:库库的里昂 ✨收录专栏:C从练气到飞升 🎉鸟欲高飞先振翅,人求上进先读书🎉 目录 ⛳️推荐 一、继承的概念及定义 1.1 继承的概念 1.2 继承定义 1.2.1 定义格式 1.2.2 继承方式和访问限定符…

C语言—指针(2)

目录 一、数组名的理解 二、使用指针访问数组 三、一维数组传参的本质 四、冒泡排序 五、二级指针 六、指针数组 七、字符指针变量 八、数组指针变量 (8.1)什么是数组指针变量 (8.2)数组指针变量的初始化 九、二维数组传…

【工业机器人】工业异常检测大模型AnomalyGPT

AnomalyGPT 工业异常检测视觉大模型AnomalyGPT AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models AnomalyGPT是一种基于大视觉语言模型(LVLM)的新型工业异常检测(IAD)方法。它利用LVLM的能力来理…

企业级WEB应用服务器TOMCAT

目录 一、WEB技术 1.1 HTTP协议和B/S 结构 1.2 前端三大核心技术 1.2.1 HTML 1.2.2 CSS(Cascading Style Sheets)层叠样式表 二、WEB框架 2.1 web资源和访问 2.2 后台应用架构 2.2.1 单体架构 2.2.2 微服务 2.2.3 单体架构和微服务比较 三、t…

springboot社区疫情返乡管控系统--论文源码调试讲解

第2章 开发环境与技术 本章节对开发社区疫情返乡管控系统管理系统需要搭建的开发环境,还有社区疫情返乡管控系统管理系统开发中使用的编程技术等进行阐述。 2.1 MySQL数据库 MySQL是一种具有安全系数、安全系数、混合开发性、高效化等特征的轻量关联数据库智能管…

最新动态鲨鱼导航网引导页html源码

源码介绍 最新动态鲨鱼导航网引导页html源码 源码由HTMLCSSJS组成,记事本打开源码文件可以进行内容文字之类的修改,双击html文件可以本地运行效果,也可以上传到服务器里面,重定向这个界面 https://download.csdn.net/download/h…

鸿蒙HarmonyOS开发:用户通知服务Noification的详细使用指南

文章目录 一、Notification Kit简介二、能力范围三、业务流程四、通知样式:五、约束限制六、开发步骤6.1、导入模块。6.2、构造NotificationRequest对象,并发布通知。6.2.1、普通文本类型。6.2.2、长文本类型。6.2.3、多行文本类型。 6.3、为通知添加行为…

反射异常捕获 | InvocationTargetException 要用e.getCause()打印才能看到具体异常

背景:线上某段和反射相关的代码报错了,但是异常信息打印只看到了 InvocationTargetException,没打印具体的异常。就像这样:java.lang.reflect.InvocationTargetException: null 查阅资料后发现要用e.getCause()才能打印具体异常&a…

赚大钱和赚小钱,哪个更累?

最近一直在质疑我在做的项目,虽然有同行做到了很好的成绩,但是我还是质疑。 因为一直在赚小钱,接触到的也是新手、底层客户、墨迹客户。 越是钱少的生意,越不好做,客户越挑剔。 而且赚小钱会消磨人的心智。 前几年…

实现 FastCGI

CGI的由来: 最早的 Web 服务器只能简单地响应浏览器发来的 HTTP 请求,并将存储在服务器上的 HTML 文件返回给浏 览器,也就是静态 html 文件,但是后期随着网站功能增多网站开发也越来越复杂,以至于出现动态技 术&…

【ACM出版,高录用EI快检索】第七届计算机信息科学与人工智能国际学术会议(CISAI 2024,9月6-8)

第七届计算机信息科学与人工智能国际学术会议(CISAI 2024) 将于2024年09月6-8日在中国浙江-绍兴举行。 计算机信息科学与人工智能国际学术会议的主题主要围绕“信息科学”与“人工智能”的最新研究展开,旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员…

图的应用

一、最小生成树 1)Prim算法(加点) 2)Kruskal算法(加边) 二、最短路径 1)Dijkstra算法 2)Floyd算法 三、拓扑排序 1)AOV 拓扑序列不唯一 2)AOE(关键路径&#…

CMOS 逆变器的功耗

CMOS 反相器的发展为集成电路提供了基本功能,是技术史上的一个转折点。该逻辑电路突出了使 CMOS 非常适合高密度、高性能数字系统的电气特性。 CMOS 的优势之一是其效率。CMOS 逻辑仅在改变状态时才需要电流——仅维持逻辑高或逻辑低电压的 CMOS 电路消耗的功率非常…

校园一卡通_q7e7o

TOC springboot576校园一卡通_q7e7o--论文 第一章 概述 1.1 研究背景 近些年,随着中国经济发展,人民的生活质量逐渐提高,对网络的依赖性越来越高,通过网络处理的事务越来越多。随着校园一卡通的常态化,如果依然采用…

IO进程(6)

目录 1.进程间通信 1.1无名管道 1.1.1读写特性 1.1.2函数 1.2有名管道 1.2.1函数接口 ​​​​​​​​​​​​​​1.2.2读写特性 2.信号 2.1信号的概念 ​​​​​​​​​​​​​​2.2信号的分类 ​​​​​​​​​​​​​​2.3信号的处理方式 ​​​​​​​2.4信号产生…

Tensorflow 2.16.0+在PyCharm中找不到keras的报错解决

在PyCharm(2024.2版本)中,直接使用from tensorflow import keras会提示“Cannot find reference ‘keras’ in ‘init.py’ ”,找不到keras,如下图所示。 查阅相关资料,可以发现在tf2.16之后,默认的keras后端升级为了…

【Git】常见命令的使用

Git 介绍流程安装常见命令本地仓与远程仓关联 介绍 Git、Svn:版本控制器(用于多人团队协作) Svn:集中式版本控制器;版本库集中放在中央服务器,操作非常简单,鼠标右键提交、新增、下载 Git&…

C语言小tip之整型提升

今天让我们来学习一下C语言中的一个小知识点-----整型提升 什么叫整型提升呢? C语言中整型算术运算总是至少以缺省(默认)整型类型的精度来进行的。​为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型&a…