CV 图像处理基础笔记大全(超全版哦~)!!!

一、图像的数字化表示

  1. 像素
    • 数字图像由众多像素组成,是图像的基本构成单位。在灰度图像中,一个像素用一个数值表示其亮度,通常 8 位存储,取值范围 0 - 255,0 为纯黑,255 为纯白。例如,一幅简单的手写数字灰度图像,像素值分布反映了笔画的浓淡。
    • 彩色图像常见采用 RGB 模式,每个像素由红(R)、绿(G)、蓝(B)三个通道值构成,同样各通道一般 8 位存储,取值 0 - 255。如 (255, 0, 0) 表示纯红色,通过不同通道组合能生成各种绚丽色彩,像一幅风景彩色照片,不同物体的颜色靠 RGB 通道精准呈现。
  2. 图像分辨率
    • 指水平与垂直方向像素数量,用 “宽 × 高” 描述,如 1920×1080。高分辨率图像含更多细节,像高清摄影作品;低分辨率图像细节少,文件也小,如用于网页缩略图。选择合适分辨率依应用场景而定,监控视频为实时传输多采用较低分辨率,而印刷图像要求高分辨率保障印刷质量。

 

二、图像的存储格式

  1. BMP
    • 位图格式,无损存储,数据按像素顺序直接排列,不压缩,优点是能完美保留原始图像质量,常用于对画质要求苛刻领域,如医学影像存档,缺点是文件体积大,占用存储空间多。
  2. JPEG
    • 联合图像专家组格式,有损压缩,基于人眼视觉特性去除不易察觉细节,压缩比可观,广泛用于日常照片存储,网络传输时能快速加载,不过多次编辑保存会累积损失,使图像质量下降。
  3. PNG
    • 便携式网络图形格式,无损压缩且支持透明度通道,在网页图标、需要保留背景透明效果场景表现出色,既保证质量又兼顾灵活展示需求,像网页设计中的 logo 图形多用 PNG 格式。

三、图像的基本运算

  1. 算术运算
    • 加法:两张同尺寸图像相加,如将白天和夜晚同场景照片相加再平均,可模拟黄昏效果;但要防像素值溢出,超过 255 需特殊处理,像归一化调整。
    • 减法:常用于背景减除,从含目标图像减去背景图像,能初步勾勒目标轮廓,在安防监控里,持续采集背景图像,一旦有移动物体,通过减法快速定位目标。
    • 乘法与除法:乘法通过乘常数调整亮度,小于 1 使图像变暗,大于 1 变亮;除法可校正光照不均,如对因灯光角度问题一侧亮一侧暗的照片,用合适除数使光照均匀。
  2. 逻辑运算
    • 主要针对二值图像(像素仅 0 或 1)。“与” 运算常用于提取图像重叠部分,两个二值图像对应像素做 “与”,保留共有的形状特征;“或” 运算可合并不同区域,将两个有部分不重叠的二值图像 “或”,得到完整的组合区域;“非” 运算则反转像素值,把前景变背景、背景变前景,用于简单图像反转场景。

 

四、颜色空间

  1. RGB
    • 计算机图形学核心颜色空间,与显示器显示原理契合,硬件易实现。但处理颜色相关任务时,因通道相关性强,如调整红色物体色调,改变 R 通道常影响 G、B 通道,导致颜色失衡,在精准调色有局限。
  2. HSV
    • 依人眼感知构建,色调(Hue)0 - 360° 区分颜色种类,饱和度(Saturation)0 - 1 衡量纯度,明度(Brightness)0 - 1 反映明亮程度。在颜色分割上优势显著,要提取图像中橙色部分,在 HSV 空间设定 H 范围(如 10 - 40°),S、V 合适区间,精准分离目标颜色,广泛用于目标识别前置步骤。
  3. 灰度
    • 单通道颜色空间,将彩色转灰度常用加权平均法(Gray = 0.299R + 0.587G + 0.114B),灰度图像简化计算,许多边缘检测、特征提取任务首选灰度图启动,像经典的 Sobel 边缘检测算法在灰度图上运行效率更高,避免彩色通道干扰。

以上这些图像处理基础为后续深入学习图像滤波特征提取目标检测等高级 CV 技术筑牢根基,理解并熟练运用它们至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3800.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QT 使用QTableView读取数据库数据,表格分页,跳转,导出,过滤功能

文章目录 效果图概述功能点代码分析导航栏表格更新视图表格导出表格过滤 总结 效果图 概述 本案例用于对数据库中的数据进行显示等其他操作。数据库的映射,插入等功能看此博客框架:数据模型使用QSqlTableModel,视图使用QTableView&#xff0…

UI自动化测试:异常截图和page_source

自动化测试过程中,是否遇到过脚本执行中途出错却不知道原因的情况?测试人员面临的不仅是问题的复现,还有对错误的快速定位和分析。而异常截图与页面源码(Page Source)的结合,正是解决这一难题的利器。 在实…

Spark常见面试题-部分待更新

1. 简述hadoop 和 spark 的不同点(为什么spark更快) Hadoop是一个分布式管理、存储、计算的生态系统,包括HDFS(分布式文件系统)、MapReduce(计算引擎)和YARN(资源调度器)…

HackMyVM-Klim靶机的测试报告

目录 一、测试环境 1、系统环境 2、使用工具/软件 二、测试目的 三、操作过程 1、信息搜集 2、Getshell 3、提权 CVE-2008-0166 四、结论 一、测试环境 1、系统环境 渗透机:kali2021.1(192.168.159.127) 靶 机:debian(192.168.159.27) 注意事…

数据结构题目 课时6

题目 1、设一棵树的度是 4,其中度为 0, 1, 2, 3, 4 的结点个数分别是 8, 4, 2, 1 和( )。 A. 4 B. 3 C. 2 D. 1 2、设一棵 m 叉树中有 N₁个度数为 1 的结点,N₂个度数为 2 的结点,……,Nₘ个度…

Linux下源码编译安装Nginx1.24及服务脚本实战

1、下载Nginx [rootlocalhost ~]# wget -c https://nginx.org/download/nginx-1.24.0.tar.gz2、解压 [rootlocalhost ~]# tar xf nginx-1.24.0.tar.gz -C /usr/local/src/3、安装依赖 [rootlocalhost ~]# yum install gcc gcc-c make pcre-devel openssl-devel -y4、 准备 N…

Web前端------表单标签

一.表单标签介绍 1.认识表单 表单---类似于日常生活中的申请单 都是去填写一些信息去申请某个功能&#xff0c;例如&#xff1a;账号密码昵称&#xff0c;登陆网站 2.常见标签 常见的标签 <form></form> 表单标签&#xff0c;所有表单信息都包含在这个标签内…

LLM - 大模型 ScallingLaws 的迁移学习与混合训练(PLM) 教程(3)

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/145212097 免责声明&#xff1a;本文来源于个人知识与公开资料&#xff0c;仅用于学术交流&#xff0c;欢迎讨论&#xff0c;不支持转载。 Scalin…

Unity2017 控制.abc格式的三维动画播放

首先需要导入插件Alembic&#xff0c;否则导入abc动画&#xff0c;Unity是不会识别的。 Unity2017版本及以下直接从我这儿下载&#xff1a;https://download.csdn.net/download/qq_41603955/90272382 高版本Unity&#xff0c;请移步AssetStore商店搜找。 导入abc之后&#x…

【视觉惯性SLAM:十七、ORB-SLAM3 中的跟踪流程】

17.1 跟踪流程流程图 ORB-SLAM3 的跟踪模块是整个系统的重要组成部分&#xff0c;负责实时确定相机在三维空间中的姿态位置&#xff0c;并保持关键帧之间的连续性。其基本目标是将输入的视频流与已有地图数据进行对齐&#xff0c;完成位姿估计和地图更新。 流程图概述 一个…

开发神器之cursor

文章目录 cursor简介主要特点 下载cursor页面的简单介绍切换大模型指定ai学习的文件指定特定的代码喂给ai创建项目框架文件 cursor简介 Cursor 是一款专为开发者设计的智能代码编辑器&#xff0c;集成了先进的 AI 技术&#xff0c;旨在提升编程效率。以下是其主要特点和功能&a…

CSRF攻击XSS攻击

概述 ​在 HTML 中&#xff0c;<a>, <form>, <img>, <script>, <iframe>, <link> 等标签以及 Ajax 都可以指向一个资源地址&#xff0c;而所谓的跨域请求就是指&#xff1a;当前发起请求的域与该请求指向的资源所在的域不一样。这里的域指…

cuda + cudnn安装

1.安装CUDA Toolkit 在设备管理器&#xff08;此电脑–右键–属性&#xff09;的显示适配器中可以查看自己的显卡型号&#xff0c;去下载对应的CUDA Toolkit 。或者输入以下命令查看Driver Version &#xff0c;cuda Version&#xff1a;12.2代表12.2版本以下兼容可以进行安装 …

vscode 设置

一、如何在vscode中设置放大缩小代码 1.1.文件—首选项——设置 1.2.在搜索框里输入“Font Ligatures”&#xff0c;然后点击"在settings.json中编辑" 1.3.在setting中&#xff08;"editor.fontLigatures":前&#xff09;添加如下代码 "editor.mous…

海云安开发者安全智能助手D10荣膺 “ AI标杆产品 ” 称号,首席科学家齐大伟博士入选2024年度 “ 十大杰出青年 ”

2024年12月27日&#xff0c;粤港澳大湾区AI领袖峰会在深圳成功举办&#xff0c;大会表彰了在人工智能技术创新、应用实践和产业发展等方面取得优异成绩的企业和个人&#xff0c;深圳海云安网络安全技术有限公司开发者安全智能助手D10荣膺“AI标杆产品”称号。同时&#xff0c;公…

网络安全---CMS指纹信息实战

CMS简介 CMS&#xff08;Content Management System&#xff09;指的是内容管理系统&#xff0c;如WordPress、Joomla等。CMS系统非常常见&#xff0c;几乎所有大型网站都使用CMS来管理其网站的内容。由于常见CMS的漏洞较多&#xff0c;因此黑客将不断尝试利用这些漏洞攻击CMS…

西门子【Library of Basic Controls (LBC)基本控制库”(LBC) 提供基本控制功能】

AF架构中使用的库 文章目录 Table of contents Legal information ..............................................................................................................................2 1 Introduction ................................................…

upload-labs靶场练习

01&#xff08;JS前端认证&#xff09; 客户端JS脚本有限制&#xff0c;本来想用上次笔记的方法来做&#xff08;即改扩展名为.jpg&#xff0c;上传&#xff0c;抓包&#xff0c;改扩展名为.php&#xff0c;放行或者发送至repeater&#xff0c;改扩展名然后重发&#xff0c;再…

登录校验Cookie、Session、JWT

目录 基础知识&#xff1a;登录校验的场景 基础知识&#xff1a;会话 ​编辑方案一&#xff1a;Cookie 方案二&#xff1a;Session 方案三&#xff1a;令牌技术 JWT 令牌 基础知识&#xff1a;登录校验的场景 基础知识&#xff1a;会话 什么是会话&#xff1f;什么是会话跟…

Web端实时播放RTSP视频流(监控)

一、安装ffmpeg: 1、官网下载FFmpeg: Download FFmpeg 2、点击Windows图标,选第一个:Windows builds from gyan.dev 3、跳转到下载页面: 4、下载后放到合适的位置,不用安装,解压即可: 5、配置path 复制解压后的\bin路径,配置环境变量如图: <