2D与3D图形的基本变换

1. 2d transformations

1.1缩放(Scaling)

在这里插入图片描述

其实这个转换非常简单,如图所示就是把x与y进行s倍的缩放,而我们图中的这个矩阵正好满足这一算法。

1.2镜像(Reflection)

在这里插入图片描述

这个镜像变换可以和上面的做类比,简单看一下就行。

1.3错切(Shearing)

在这里插入图片描述

当然这里不得不提两句,这个错切可以这么看,如左图未转换前最左边的一条竖直直线,按照这样的转换思路在右边就变成了一条斜线,其他线段以此类推。

其实可以想象成如左边这条x等于0的竖直线,这上面的一个个点往右边平移了ay个单位,变成了这样一条斜线。

这里提一个有趣的想法:

如果把一条直线看成是由有限的等大小的点组成(在计算机中当然实际当中我们对直线的定义还是无数个点组成的图形),那么经过我们如上线性变换的时候,每个点的坐标发生了变换最后构成了一条斜线(比如说3个点构成了一条直线,现在把这三个点的位置挪动了下,这样点与点之间实际上会有距离间隔,但是实际我们的屏幕看不出这个距离间隔)

让我们在更加形象的来了解一下

我们知道计算机是由一个个像素组成的,如下图所示:

在这里插入图片描述

一条直线的长度等于这一个个正方形小像素的变成之和,而通过我们的图形变换我们改变了这一个个小像素的实际位置(可以把一个小像素看成一个单位坐标),如我们上面转换成的斜线的长度就是这一个个小像素的斜边加起来的值。

1.4旋转(Rotation)

在这里插入图片描述

这里的推导非常简单,通过两个特例点`来将变换的矩阵推导出来,因为过于简单这里就不做过多赘述。(旋转我们默认是按圆点逆时针旋转)

这里留一个问题给大家,你怎么知道你特例点推出来矩阵后,你的图像整体都是如图上的规律变换的?

1.5平移(Translation)

在这里插入图片描述

按照我们上面的例子依葫芦画瓢就可以很轻易的得出如图所示的式子,但是这个式子后面多了一个矩阵,这样的表达式看着不是很简明了,为了处理这样的问题,我们的图形学引入了对向量和点的新的表达形式来解决了这一问题。

在这里插入图片描述

1.6逆变换(Inverse Transform)

在这里插入图片描述

2. 3d transformations

2.1 3d空间中点与向量的表达方式

在这里插入图片描述

2.2 3d空间当中的旋转
绕轴旋转:

在这里插入图片描述

上面的式子分别是一个实际的物体绕着不同轴旋转所对应的线性变换,那么实际应用当中我们是如何处理旋转的呢?

物体实际旋转的处理公式:

在这里插入图片描述

实际我们在处理一个物理旋转时,我们会将其拆分为该物体与各个轴之间的旋转变换,我们把如图上的那三个角称作欧拉角。

罗德里格旋转公式(Rodrigues’ rotation formula)

在这里插入图片描述

解释一下这个公式的一些参数:n为物体绕着旋转的轴(默认起点为原点,默认旋转方向为逆时针),a为旋转角度。

2.3四元数

最基本的定义:i的二次方 = j的二次方 = -1 且 ij = -ji = k (意味着不满足交换律)

q(四元数) = a + bi + cj + dk 且满足 i的平方 = j的平法 = k的平方 = ijk = -1

这里只展示四元数最基本的定义,后面我会出一篇文章详细讲解一下四元数的实际运用。

3.视图变换(ViewingTransformation)

​ 思考我们拍照的过程:我们的现实是3d坐标系,而我们用相机所拍摄到的照片是二维的,那么如何3d坐标系的影像处理成二维照片呢?这就是我们视图变换所做的事情。

在这里插入图片描述

如这副图所示,为了完成我们的变换我们首先得确定相机的位置和确定一个相机的正方向。

当然在我们的实际使用当中我们默认相机固定在原点,y轴为正方向,往-Z轴看。

3.1相机的摆放问题( 摄像机变换(camera tranformation))

在这里插入图片描述

​ 当然我们的相机不可能一直会在原点,就比如如图这样的情况,我们应该如何把相机回归原点呢?(实际上就是把etg坐标系所对应的图像对应到xy-z坐标所对应的图像)

这里可以这么理解:将我们etg坐标系的三个方向进行线性转换变成了xy-z坐标系的三个方向,那么其所对应到的图片经过这样的转换后效果是不变的(不同坐标系与图像的对应关系没有发生变化),这样的过程就好比把计算机从一个随机的位置移动到了原点。

当然我们求etg到对应xy-z这样过程比较困难,不妨先求其逆,也就是xy-z到etg这一线性变换的过程。

在这里插入图片描述

正交矩阵的逆等于其转置矩阵,为什么呢?

这里偷一张大佬的图

在这里插入图片描述

3.2 投影变换(projection tranformation)
3.21正交投影(Orthographic projection)

在这里插入图片描述

按照视觉效果来说正交投影应该是如上图所示的样子,但是实际处理起来太麻烦,因此我们在实际当中采用如下步骤:

在这里插入图片描述

实际上就是先进行了一个平移和一个缩放(缩放成一个边长为2中心在原点的正方形)

3.22透视投影(Perspective projection)

在这里插入图片描述

透视投影这一过程其实分为两个部分如上图所示先进行挤压,然后在进行我们上面所说的正交投影来完成这一过程,需要说明的是透视投影在挤压过程中,整个图像上的各个点z坐标是不变的,只是x和y轴上的坐标在发生变化。

那么究竟如何得到这一挤压矩阵呢?不急我们分成了3个步骤。

步骤1

在这里插入图片描述

首先在上面我们就强调了每个点的z值不会变化,通过观察我们得到了如上图所示的规律,因此我们可以获得我们的第一个特例,在我们获得的这个特里中乘以z,在通过推导可知,我们能够已知的矩阵信息如右边的矩阵图示。

(这里的乘以z其实两边应该都乘以z等式才能成立,这个乘以z的效果隐藏在那个4乘4矩阵里)

步骤2

在这里插入图片描述

​ 当z等于n时,也就是对应最上面那个挤压图最左边小的那个面,这个时候我们同样在右边乘以z(当然我们这边的z这个常数等于常数n)

步骤三

远处最中心的点在挤压过程中没有改变因此有了如图以下推导:
在这里插入图片描述

(tips:中心点的坐标得看坐标系,这里是特意这么设计的)

至此推导结束。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/210989.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《数据结构、算法与应用C++语言描述》-线索二叉树的定义与C++实现

_23Threaded BinaryTree 可编译运行代码见:GIithub::Data-Structures-Algorithms-and-Applications/_24Threaded_BinaryTree 线索二叉树定义 在普通二叉树中,有很多nullptr指针被浪费了,可以将其利用起来。 首先我们要来看看这空指针有多少…

单片机怎么实现真正的多线程?

单片机怎么实现真正的多线程? 不考虑多核情况时,CPU在一个时间点只能做一件事,因为切换的速度快所以看起来好像是同时执行多个线程而已。 实际上就是用定时器来做时基,以时间片的方式分别执行来实现的,只不过实现起来细节比较复…

C语言--每日选择题--Day37

第一题 1. 有以下说明语句:则下面引用形式错误的是() struct Student {int num;double score; };struct Student stu[3] {{1001,80}, {1002,75}, {1003,91}} struct Student *p stu; A:p->num B:(p).num C&#…

LeetCode:2477. 到达首都的最少油耗(DFS C++、Java)

目录 2477. 到达首都的最少油耗 题目描述: 实现代码与解析: dfs 2477. 到达首都的最少油耗 题目描述: 给你一棵 n 个节点的树(一个无向、连通、无环图),每个节点表示一个城市,编号从 0 到 n…

1-4节电池升降压充电IC解决方案

描述 MP2760是一款集成窄电压DC(NVDC)电源路径管理功能和USB On-the-Go(OTG)功能的升降压充电IC,兼容USB PD,适用于单节至4节串联的电池包应用。该芯片的充电输入电压范围广,可支持最高22V。 当启用电池放电模式&…

线性可分SVM摘记

线性可分SVM摘记 0. 线性可分1. 训练样本到分类面的距离2. 函数间隔和几何间隔、(硬)间隔最大化3. 支持向量 \qquad 线性可分的支持向量机是一种二分类模型,支持向量机通过核技巧可以成为非线性分类器。本文主要分析了线性可分的支持向量机模型,主要取自…

企业级SQL开发:如何审核发布到生产环境的SQL性能

自从上世纪 70 年代数据库开始普及以来,DBA 们就不停地遭遇各种各样的数据库管理难题,其中最为显著的,可能就是日常的开发任务中,研发人员们对于核心库进行变更带来的一系列风险。由于针对数据库的数据变更是一项非常常见的任务&a…

对抗生成网络-G与D的loss异常问题

我最近在**使用DCGAN训练个人的数据集**时,出现了D loss 下降趋于0,但是G loss 却不停上升。我总结了一下几点原因: 生成器损失为1或者大于1通常表明生成器的训练可能存在问题,这可能是由于训练不稳定、超参数设置不当或网络结构问…

基于阿里云服务网格流量泳道的全链路流量管理(一):严格模式流量泳道

作者:尹航 概述 灰度发布是一种常见的对新版本应用服务的发布手段,其特点在于能够将流量在服务的稳定版本和灰度版本之间时刻切换,以帮助我们用更加可靠的方式实现服务的升级。在流量比例切换的过程中,我们可以逐步验证新版本服…

【网络奇缘】- 如何自己动手做一个五类|以太网|RJ45|网络电缆

​ ​ 🌈个人主页: Aileen_0v0🔥系列专栏: 一见倾心,再见倾城 --- 计算机网络~💫个人格言:"没有罗马,那就自己创造罗马~" 本篇文章关于计算机网络的动手小实验---如何自己动手做一个网线, 也是为后面的物理层学习进…

C# WPF上位机开发(图形显示软件)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 在实际应用中,有一种情况就是,我们需要经常对数据进行图形化显示,这样会比较直观一点。比如经济统计里面的同比…

软件设计之桥接模式

实现茶水间:茶可以分红茶和绿茶,每种茶又可以分大杯和中杯,现在你是服务员需要计算茶水的价格。 package Bridge;public class BlackTea implements TeaKind{private float redTeaPrice 2.0f;Overridepublic float price() {return redTeaPr…

WordPiece词表的创建

文章目录 一、简单介绍二、步骤流程2.1 预处理2.2 计数2.3 分割2.4 添加subword 三、代码实现 本篇内容主要介绍如何根据提供的文本内容创建 WordPiece vocabulary,代码来自谷歌; 一、简单介绍 wordpiece的目的是:通过考虑单词内部构造&…

Canal笔记:安装与整合Springboot模式Mysql同步Redis

官方文档 https://github.com/alibaba/canal 使用场景 学习一件东西前,要知道为什么使用它。 1、同步mysql数据到redis 常规情况下,产生数据的方法可能有很多地方,那么就需要在多个地方中,都去做mysql数据同步到redis的处理&…

2005-2021年地级市绿色发展注意力数据(根据政府报告文本词频统计)

2005-2021年地级市绿色发展注意力数据(根据政府报告文本词频统计) 1、时间:2005-2021年 2、指标:省、市、年份、一级指标、关键词、关键词词频、总词频 3、范围:270个地级市 4、来源:地级市政府工作报告…

深度学习TensorFlow2基础知识学习前半部分

目录 测试TensorFlow是否支持GPU: 自动求导: 数据预处理 之 统一数组维度 定义变量和常量 训练模型的时候设备变量的设置 生成随机数据 交叉熵损失CE和均方误差函数MSE 全连接Dense层 维度变换reshape 增加或减小维度 数组合并 广播机制&#…

CCKS2023-面向金融领域的主体事件检测-亚军方案分享

赛题分析 大赛地址 https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh 任务描述 主体事件检测是语言文本分析和金融领域智能应用的重要任务之一,如在金融风控领域往往会对公司主体进行风险事件的检测…

杂散表的阅读

杂散表得阅读 —— 以Marki公司得手册为例 混频杂散(Mixing Spurs)是指信号经过混频器时,不仅会与本振混频,还会与本振的高次谐波混频(对于第二章说的方波本振,信号只与本振的奇次谐波混频因为方波只含有奇…

VSC改造MD编辑器及图床方案分享

VSC改造MD编辑器及图床方案分享 用了那么多md编辑器,到头来还是觉得VSC最好用。这次就来分享一下我的blog文件编辑流吧。 这篇文章包括:VSC下md功能扩展插件推荐、图床方案、blog文章管理方案 VSC插件 Markdown All in One Markdown Image - 粘粘图片…

gitLab创建新项目

1.进入git2.选择创建项目3.勾选生成readme.md文件4.邀请成员