NEFU数字图像处理(1)绪论

一、简介

1.1什么是数字图像

图像是三维场景在二维平面上的影像。根据其存储方式和表现形式,可以将图像分为模拟图像和数字图像两大类

图像处理方法:光学方法、电子学方法

  • 模拟图像:连续的图像
  • 数字图像:通过对时间上和数值上连续的模拟图像采用数字化(离散化)技术所得到的
  • 数字图像:以数字格式存储图像数据,便于计算机进行处理,这种图像称为数字图像。

数字图像处理主要有两种方法:空域法和变换域法

 1.2数字图像的表示

一幅数字图像是通过有限个离散点来表示的,其中每个点被称为图像元素(也称像素pixel),这些像素是构成数字图像的最小组成单元·
由像素组成的二维排列可以用矩阵表示,因此,一幅大小为MxN的数字图像可表示为一个大小MxN的矩阵:

数字图像是由连续的模拟图像采样和量化而得到的。组成数字图像的基本单位是像素,所以数字图像是像素的集合
像素为元素的矩阵,像素的值代表图像在该位置的亮度,称为图像的灰度值
因此:数字图像像素具有整数坐标和整数灰度值两个方面的含义。

1.3什么是数字图像处理

利用计算机处理数字图像的过程称为数字图像处理,也称计算机图像处理,它包括了对数字图像进行增强、分割、复原、特征提取、几何变换压缩编码等一系列的理论、方法和技术。

数字图像处理的本质特征:
对输入图像进行某种操作或变换得到输出图像,即图像到图像的过程。

1.4相关工具包

IPT-Image Processing Toolbox以数字图像处理理论为基础,用MATLAB语言构造出一系列的用于图像数据显示与处理的M函数

1.5内容概述

图像增强:

作用1:用于改善图像的视感质量(视觉效果)
作用2:用于突出图像中的某些重要特征,以便于人眼观察或计算机检测,即增强感兴趣特征的可观察性或可检测性

图像分割:

一幅图像中通常包含多个对象,为了识别和理解图像中的不同对象,需要按照一定规则将图像分割成若干个区域,每个区域代表被成像的一个物体(或部分)
图像分割就是把一幅图像划分成若干区域的过程。

图像几何变换:

可用于改变图像的形状、大小和位置等几何特性。比如图像的平移、镜像、旋转、比例缩放、错切等。

图像压缩编码:

图像压缩的目的是在保证图像质量的前提下减少图像的数据量,以便于图像的存储和传输。
图像编码主要是利用图像信号的统计特性以及人类视觉的生理学和心理学特性,对图像信号进行高效编码,从而压缩图像数据。

图像复原:

当造成图像退化(图像品质下降)的原因已知时,通过图像复原技术对图像进行校正,恢复图像的本来面目·

图像特征提取:

1.6数字图像处理系统的基本组成

数字图像处理系统有三部分组成:图像采集系统、计算机和图像输出设备

 1.7应用领域

二、 图像处理基础

2.1图像获取

将一幅图像从其原来的形式转换为数字形式的处理过程,包括“扫描”、“采样”与“量化”三个步
骤,但通常将“扫描”合并到“采样”阶段,合并为两个过程


数字图像是由连续的模拟图像采样和量化而得到的。组成数字图像的基本单位是像素,所以数字图像是像素的集合。

扫描

 将一个数学虚拟网格覆盖在一幅图像上,图像的平面空间被离散化成一个个的有序的格子,然后按照格子的排列顺序依次读取图像的信息,此读取过程称为“扫描”
在扫描过程中被读取的小块图像称为图像元素,简称像素,它的描述包括空间坐标以及图像信息两个部分。

 采样

在一幅图像的每个像素位置上测量灰度值。连续图像在二维空间上的离散化称为采样,即用
空间上部分点的灰度来代表图像,这些点称为采样点
注意:
图像数字化时必须遵守采样定理,才能保证图像可恢复。

图像采样方法有均匀采样和非均匀采样两种方法

空间分辨率: 空间分辨率=M*N

采样间隔的选取决定了采样后图像的质量,即忠实于原始图像的程度

空间分辨率是图像中可分辨的最小细节,主要由采样间隔值决定

对于同一幅图像,若垂直和水平方向上采样间隔越小,则M和N越大,采样图像的空间分辨率越高,失真度越小


通常,图像中的细节越多,采样间隔应越小

灰度分辨率是指灰度图像中可以表示的不同灰度级别的数量。它决定了图像中可以区分的灰度细节的程度。

灰度图像的灰度分辨率通常由每个像素的位数来决定。例如,8位灰度图像可以表示256个不同的灰度级别,范围从0到255。因此,它具有8位的灰度分辨率。

量化

连续图像在灰度上的离散化称为图像灰度量化即把采样后得到的各采样点的灰度从连续量转换为离散量(即离散的整数值)
量化后的灰度用整数值表示

图像量化方法有标量量化、向量量化两种方法。(矢量量化)

2.2图像数字化

将连续形式的模拟图像进行离散化处理,转换为数字图像,这个过程称为图像数字化·

 对于一幅图像,当采样点数M×N一定时,不同的量化级数L对图像质量有影响:

  • 量化级数越多,图像质量越好
  • 当量化级数减少时,图像中的假轮廓现象逐渐明显。
  • 量化级数最小的极端情况(L=2):二值图像。

 例题

 2.3数字图像的基本类型

数字图像处理中四种基本的数字图像类型:

  • 灰度图像
  • 二值图像
  • 索引图像
  • 真彩色图像(也称RGB图像

 灰度图像

灰度图像是指包含灰度级的图像,这里的灰度即亮度


灰度图像只有灰度而没有彩色,图像中的每个像素都是从黑到白之间的L级灰度中的一种。

灰度图像通常由一个unit8、unit16或双精度类型的数组来描述,其实质是一个数据矩阵。该矩阵中的数据均代表了在一定范围内的灰度级,每一个元素对应于图像的一个像素点,通常0代表黑色,1、255或65535(针对不同的存储类型)代表白色。

 二值图像

二值图像是一种特殊的灰度图像。图像中的像素只有两种灰度一一黑和白

 索引图像

1、调色板

  • ·调色板是用于定义不同种颜色的一个颜色表,也称颜色映射(colormap)其中每种颜色都使用红(R)、绿(G)、蓝(B)三种分量来表示。
  • 调色板中一行定义一种颜色,最多只能定义256种颜色。
  • 每行中的三列元素分别表示R、G、B三种颜色分量的深浅程度。

2、索引图像

  • ·索引图像是一种带有调色板的图像。
  • ·最多只能显示256种颜色。
  • ·索引图像可由两个矩阵来表示:

RGB图像

  • RGB图像不需要使用调色板,即它的颜色是非映射的
  • 每个像素的颜色由红(R)、绿(G)、蓝(B)三个分量共同决定,每个分量都用8bt表示,即每个像素的颜色用3个字节表示。
  • 可以产生28×28×28=224≈1677万种不同颜色。因此,又称24位真彩色图像。

 2.4图像格式

图像格式与图像类型不同,它是指存储图像时所采用的文件格式,即存储格式,是图像文件的数
据结构·

BMP图像 

图像为真彩色24位或更多,没有调色板,图像数据直接是每一个像素的颜色值B、G、R。
位图的存储顺序:从左到右、从下到上;即图像数据中的第一个数是图像的最左下角的像素值。

gif图像

 JPEP图像

TIFF图像

 

PNG图像

 

 2.5颜色模型

颜色有三个基本属性:色调、饱和度、亮度

色调(Hue)指的是颜色的种类或类型,如红色、绿色、蓝色等。色调是通过颜色在色轮上的位置来表示的,色轮上的不同角度对应不同的色调。色调的取值范围通常是0到360度,其中0度对应红色,120度对应绿色,240度对应蓝色。

饱和度(Saturation)指的是颜色的纯度或鲜艳程度。饱和度越高,颜色越鲜艳,越接近于纯色;饱和度越低,颜色越灰暗,越接近于灰色。饱和度的取值范围通常是0到100%,其中0%表示灰度,100%表示最高饱和度。

亮度(Value)指的是颜色的明暗程度。较高的亮度值表示较亮的颜色,较低的亮度值表示较暗的颜色。亮度的取值范围通常是0到100%,其中0%表示黑色,100%表示白色。

RGB模型

 

正常每个分量的量化范围为:[0,255]
若都进行标准化(即归一化)处理:[0,1]

 HSV模型

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/150234.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【拿完年终奖后】想要转行网络安全,一定不要错过这个时间段。

网络安全,作为当下互联网行业中较为热门的岗位,薪资可观、人才需求量大,作为转行必考虑。 在这里奉劝所有零基础想转行(入门) 网络安全的朋友们 在转行之前,一定要对网络安全行业做一个大概了解&#xf…

Java卷上天,可以转行干什么?

小刚是某名企里的一位有5年经验的高级Java开发工程师,每天沉重的的工作让他疲惫不堪,让他萌生出想换工作的心理,但是转行其他工作他又不清楚该找什么样的工作 因为JAVA 这几年的更新实在是太太太……快了,JAVA 8 都还没用多久&am…

【算法|动态规划No.13】leetcode LCR 166. 珠宝的最高价值

个人主页:兜里有颗棉花糖 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 兜里有颗棉花糖 原创 收录于专栏【手撕算法系列专栏】【LeetCode】 🍔本专栏旨在提高自己算法能力的同时,记录一下自己的学习过程,希望…

计算机视觉——飞桨深度学习实战-起始篇

后面我会直接跳到实战项目,将计算机视觉的主要任务和目标都实现一遍,但是需要大家下去自己多理解和学习一下。例如,什么是深度学习,什么是计算机视觉,什么是自然语言处理,计算机视觉的主要任务有哪些&#…

121-宏免杀

CS生成宏&上线 生成宏 1.cs生成宏,如下图操作 2.点击复制宏代码,保存下来 cs上线 注:如下操作使用的是word,同样的操作也适用于Excel 1.新建一个word文档,使用word打开。点击文件—— 2.更多——选项—— 3.自定义…

(三)行为模式:8、状态模式(State Pattern)(C++示例)

目录 1、状态模式(State Pattern)含义 2、状态模式的UML图学习 3、状态模式的应用场景 4、状态模式的优缺点 (1)优点 (2)缺点 5、C实现状态模式的实例 1、状态模式(State Pattern&#x…

大数据软件项目的验收流程

大数据软件项目的验收流程是确保项目交付符合预期需求和质量标准的关键步骤。以下是一般的大数据软件项目验收流程,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.项目验收计划制定: 在…

工业路由器项目应用(4g+5g两种工业路由器项目介绍)

引言: 随着工业智能化的不断发展,工业路由器在各个领域的应用越来越广泛。本文将介绍两个工业路由器项目的应用案例,一个是使用SR500 4g工业路由器,另一个是使用SR800 5g工业路由器。 详情:https://www.key-iot.com/i…

STM32+USB3300复位枚举异常的问题

关键字:STM32F4,STM32H7,USB3300,USBHS,Reset复位 F4和H7用的都是DWC2的USBIP,我的板子上3300单片机工作的很好,插入枚举一切正常,但是设备收到上位机的复位命令后,单片…

新手选MT4还是MT5,anzo capital昂首资本建议选择MT4,一个原因

在交易中就订单执行策略而言,MT4和MT5哪个更好,相信很多交易者和,anzo capital昂首资本一样很难做出判断。在MT5中,虽然开发人员对发送订单的流程进行了额外的复杂化,同时MT5在订单执行政策方面的优势在于其能够调整全…

Langchain-Chatchat项目:1-整体介绍

基于Langchain与ChatGLM等语言模型的本地知识库问答应用实现。项目中默认LLM模型改为THUDM/chatglm2-6b[2],默认Embedding模型改为moka-ai/m3e-base[3]。 一.项目介绍 1.实现原理   本项目实现原理如下图所示,过程包括加载文件->读取文本->文本…

Langchain-Chatchat项目:1.2-Baichuan2项目整体介绍

由百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练,在多个权威的中文、英文和多语言的通用、领域benchmark上取得同尺寸最佳的效果,发布包含有7B、13B的Base和经过PPO训练的Chat版本,并提供了Chat版本的4b…

Windows 10 没有【休眠】选项的配置操作

目录 一、相关知识 1.1、名词解释 二、睡眠/休眠选项 三、睡眠/休眠配置 3.1 打开休眠配置 3.2 打开休眠功能 一、相关知识 1.1、名词解释 睡眠: 当Windows系统进入睡眠模式之后,将电脑当前的内存中的运行状态和数据存储在硬盘中&#xff0…

EQ 均衡器

EQ 的全称是 Equalizer,EQ 是 Equalizer 的前两个字母,中文名字叫做“均衡器”。最早是用来提升电话信号在长距离的传输中损失的高频,由此得到一个各频带相对平衡的结果,它让各个频带的声音得到了均衡。 EQ 的主要功能是&#xf…

从零开始学习线性回归:理论、实践与PyTorch实现

文章目录 🥦介绍🥦基本知识🥦代码实现🥦完整代码🥦总结 🥦介绍 线性回归是统计学和机器学习中最简单而强大的算法之一,用于建模和预测连续性数值输出与输入特征之间的关系。本博客将深入探讨线性…

Python爬虫(二十二)_selenium案例:模拟登陆豆瓣

本篇博客主要用于介绍如何使用seleniumphantomJS模拟登陆豆瓣,没有考虑验证码的问题,更多内容,请参考:Python学习指南 #-*- coding:utf-8 -*-from selenium import webdriver from selenium.webdriver.common.keys import Keysimp…

IDEA 使用

目录 Git.gitignore 不上传取消idea自动 add file to git撤销commit的内容本地已经有一个开发完成的项目,这个时候想要上传到仓库中 Git .gitignore 不上传 在项目根目录下创建 .gitignore 文件夹,并添加内容: .gitignore取消idea自动 add…

Leetcode901-股票价格跨度

一、前言 本题基于leetcode901股票价格趋势这道题,说一下通过java解决的一些方法。并且解释一下笔者写这道题之前的想法和一些自己遇到的错误。需要注意的是,该题最多调用 next 方法 10^4 次,一般出现该提示说明需要注意时间复杂度。 二、解决思路 ①…

ArcGIS Engine:视图菜单的创建和鹰眼图的实现

目录 01 创建项目 1.1 通过ArcGIS-ExtendingArcObjects创建窗体应用 1.2 通过C#-Windows窗体应用创建窗体应用 1.2.1 创建基础项目 1.2.2 搭建界面 02 创建视图菜单 03 鹰眼图的实现 3.1 OnMapReplaced事件的触发 3.2 OnExtentUpdated事件的触发 04 稍作演示 01 创建项目…