我眼中的《视觉测量技术基础》

为什么会写这篇博客:

首先给大家说几点:看我的自我介绍对于学习这本书没有任何帮助,如果你是为了急切的想找一个视觉测量的解决方案那可以跳过自我介绍往下看或者换一篇博客看看,如果你是刚入门想学习计算机视觉的同学,那整篇文章读完你可能会觉得一无所获也可能会收获到意想不到的东西,接下来是我的自我介绍。

1.自我介绍

我,一个普普通通的大高个,今年大学刚毕业,以前写博客的初衷是想记录一下自己学习的过程,所以哈我的博客很随性,有突发奇想的创作、连续学习的笔记、简简单单的应用…有的粉丝问我一些系列还有更新吗?答案是肯定的,首先澄清一点,有一些以前的博客被我删除了,可能有的粉丝之前关注收藏了,后来看不到了,在此说一声抱歉,后续会更新的,删除的原因是在某天我回顾我的博客时,感慨之下删除了40篇博客,觉得质量不高(主要粉丝放映有的博客图片不显示了),越学越菜的感觉激励我接下来更新的每一篇博客都尽力向高质量看齐吧。

2.事件背景

一次偶然的机会,我发现非计算机视觉专业的人对普通的相机和工业相机有认知上的不同。

同样都是相机:
为什么工业相机拍摄时还需要光源?
为什么工业相机拍远处物体需要图像矫正?
为什么在检测面板上面板颜色和被检测物颜色相近就很难检测?
为什么一些情况我们人眼能区分但是在图像处理方面不好实现?
普通的USB摄像头能不能替代工业相机?

上述只是我列出的部分问题,虽然我尽力为其解答,但是最终还是把我问的无话可说。不全面考虑环境因素分析影响成像效果的图像处理只能是纸上谈兵,在我看来实际应用就得多看、多想,不但要知其然还要知其所以然。在我看来图像就是矩阵,可能没有学过很难理解,这就应了那句话“各行如隔山”。
我和我的导师提起这件事,我的导师给我列了两个公式计算出了选型时所需的一些参数,我突然意识到,为啥我没有想到呢?我庆幸毕业时候我只把书都寄回来了(运费比书的价格高,但是书的价值高),我忙翻出了那本《视觉测量技术基础》,是的,有讲呀,实际应用的时候到了!我决定利用工作的空余时间去把这本书看完,以通俗易懂的文字记录我的学习过程。如果是大牛看我这篇博客可能学不到啥哈,如果小白那应该会让你对视觉测量有一定的了解,书中的每一行我不会精读(注:要是前言都精读那写博客的时候我难受,看的时候你兴许都没有看下去的耐心了),例如前言之类的,可能也就像论文摘要那样一笔带过了。其中一些推导过程我会手写或代码实现,跟着我来看看吧,看这篇博客时候可以吃着零食喝着可乐,注意别撒电脑上面就行。

注意:本篇博客本不会去解析书上每一个公式,例如辐射度量计算公式这一类的物理学推倒公式,但是会去解析一些与图像处理相关的公式,每一章节的学习不会按部就班的把所有的内容深度的解析,只会涉及一些我感兴趣且小白易于接受的内容。


学习内容:我眼中的《视觉测量技术基础》


学习产出:

映入眼帘的是书籍封面上好多束光与三个不同样式的电子显微镜,打开书,我的书中掉出了很多张纸,源于我每次上课都要手写笔记的习惯,这是在小学就养成的习惯了,在此特别要感谢我的父亲,从小学到初中便答应我以5元每张手写笔记的价格回收我的笔记(其实我也算不清多少笔记了,始终也没正式的兑换过,也没有具体的交易时间与地点,因为是一次性兑换原则,我总想攒着买电脑,后来养成习惯了,也就不在意回不回收的问题了)。

第一章 绪论

  • 计算机视觉的发展,始于20世纪50年代
  • Marr视觉理论

1.Marr视觉理论从信息处理系统角度将系统研究分为:计算理论层次、表达与算法层次、硬件实现层次,通俗讲就是:1.解决什么问题,怎么计算,为什么这么算;2.定义计算的方法以及输入输出的意义,建立关系;3.硬件部署;
2.Marr从视觉理论角度出发,通过早、中、后期的视觉处理将原始二维图像到三维环境的表示;
3.基于其输入什么就处理什么、目的总是恢复场景中物体的位置与形状、不足够重视高层知识的指导作用以及无反馈的不足,提出了改进。其实通俗来说就是:我们眼睛都是主动去看、主动去选、可根据我们的意识去判断与调整的反馈机制;

  • 计算机视觉的研究内容

1.输入设备:各种探测成像的设备,例如:相机;
2.低层视觉:图像滤波、增强、边缘检测、角点检测等,我通常用opencv去实现这些效果;
3.中层视觉:立体视觉、测距成像、运动估计;一些2.5维的信息;
4.高层视觉:建立三维物体的完整图像、位置与方向;
5.体系架构:在高度抽象的层次上,根据系统模型而非实际设计的例子来研究系统的结构;书上举例说根据清朝时期的建筑风格和根据这种风格设计出来的具体建筑之间的区别。

  • 计算机视觉的问题

1.多义性:图像是二维的丢失了深度信息,例如在不同角度拍摄同一物体图像差异很大,我们能理解其是一个物体是因为我们可以从触觉、视觉等不同角度感受这个物体,而对于计算机来说却是不可想象的;
2.环境因素:光源角度、方向、空气条件、物体颜色、相机的空间位置等都会对图像产生影响;就例如本篇博客开头“事件背景”中提到的非计算机视觉专业的人可能不会去考虑那么多,但是实际应用可能就是平台旁边的一扇窗户的开关都得考虑进去,可能就因为一扇窗户的开启,人眼看着没有区别的图像在计算机看来天差地别。
3.需要让计算机去理解自然景物需要大量的数据集,需要人员去标注,这就引出了深度学习。通俗来讲,计算机就是一个孩子,看的多了也就会了,一幅图像我告诉计算机其是什么,那实现的是分类,我需要计算机检测出其中某一物体在图像中的位置,首先需要大量的数据集进行标注也就是人工去画框框然后存成特定格式作为输入去训练模型,有训练集、测试集、验证集,就像考试刷题一样,做的多了就会了。

  • 视觉应用

有摄像头的地方就可以做视觉检测,应用例如:三维重建、缺陷检测、机器人导航等。可以说视觉是一个很有发展前景的方向。

第二章 人类视觉

在这里插入图片描述

  • 三基色学说:红、绿、蓝三种颜色组成其他颜色。这就是为啥彩色图像rgb三通道。
  • 感受野:视网膜面上受到点状光源照射时每个神经元都有的响应区域。感受野越小,仅从有限的区域接受信号故空间分辨率高,反之则低。
  • 视觉暂留:当帧率高于16fps时,人眼就认为是连贯的。(也就是1秒内播放16张图像以上)
  • 视觉对比:由光刺激在空间上的分布不同所引起的视觉经验,分为明暗对比与颜色对比。

明暗对比:白盘子中找黑李子,黑盘子中找白米饭肯定比白盘子中找白米饭来得容易,但是注意这只是相对的,如果打了一束强光射到盘子上面,可能什么都看不到,故引出另外一点就是:物体的亮度不仅取决于其照明与其反射系数,环境亮度不同可产生不同的亮度感觉。

  • 颜色对比:物体颜色会受到周围颜色的影响。简单来说就例如一个灰色物体在红色背景下呈绿色,黄色背景下呈蓝色,向着补色方向发展。
  • 视错觉:看物体时,基于经验或是参照物不同造成的错觉。仔细观察下面的图片是不是在转动?
    在这里插入图片描述在这里插入图片描述
  • 马赫带效应:如下图所示,在明暗交界处亮处更亮,暗处更暗。
    在这里插入图片描述
  • 赫尔曼格子错觉:如下图,是不是感觉后有黑色圆点闪烁?
    在这里插入图片描述

第三章 光辐射与光源照明

  • 了解什么是电磁波?什么是光辐射?

电磁波的频率范围广,涵盖宇宙射线到无线电波,电磁波按照波长列成可视化的图表即电磁波谱。
0.38~0.78μm波长的电磁波能引起人眼视觉感,此范围内的便称之为光辐射。
在这里插入图片描述

  • 常见光源有什么?

1.热辐射光源(白炽灯、卤钨灯)
2.气体放电光源(汞灯、低压钠灯)
3.LED光源(磷化镓LED(加入锌和氧时发红光、锌和氮时发绿光)、砷化镓LED(可产生高频光束)、磷砷化镓LED(可制成发光颜色不同的LED))
4.激光光源(固体、气体、液体、半导体、光纤)

  • 照明光源(对项目光源选择很重要)

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
1.环形光源:光线与相机光轴近乎平行,均衡、无闪烁、无阴影。例如工业显微、工件检测、电路板检测等;
2.低角度环形光源:光线与相机光轴近乎垂直,为反光物提供360°无反光照明,均匀,适用于微不平坦的表面。例如高反射材料表面、晶片玻璃划痕及污垢、刻印字符、圆形工件边缘、瓶口缺损检测等;
3.均匀背景光源:突出物体外形轮廓、低发热、光线均匀、无闪烁,适用于轮廓检测、尺寸测量、透明物体缺陷检测,如外形检测;
4.条形光源:适用于较大被检测物的表面照明,亮度与安装角度可调、均衡、无闪烁。例如:金属表面裂缝检测、胶片和纸片包装破损检测、定位标记检测等;超市中扫描条形码就使用条形光源;
5.碗状光源:具有积分效果的半球面内壁。均匀反射从底部36°发射出的光线,使整个图像的照度非常均匀。适用于透明物体内部或立体表面检测(玻璃瓶、滚珠、不平整表面、焊接检测、线缆检测等);
6.同轴光源:光线与相机光轴平行且同轴,可消除因物体表面不平整引起的阴影从而减少干扰。适用于反射度极高的物体(金属、玻璃、胶片、晶片等)表面划伤检测,如金属面划痕检测。

  • 照明方式

在这里插入图片描述

  • 照明颜色:使用互补色光线照射物体时可以使物体成像颜色趋近与黑色,可以增加对比度,更加便于区分。

第四章 光学成像与图像采集

  • 镜头:由多个透镜、可变光圈和对焦环组成,相当于晶状体。
  • 工作距离、视场、焦距与CCD芯片尺寸关系

在这里插入图片描述

第五章 图像基础

  • 图像的产生:照射源+形成图像的场景元素对光能的反射或吸收相结合=图像
  • 图像(记录方式不同):模拟图像(analog image)、数字图像(digital image)
  • 简单来说,相机拍摄的图像是模拟图像,计算机需要处理数字图像,模拟图像通过采样(sampling)与量化(quantization)两种操作实现模拟图像转数字图像即数字化。

采样是啥?

一张照片经过采样后变成离散图像,采样点即像素,图像就是一个WxH的矩阵,W和H越大相当于图像分辨率越高、数据量越大、失真越小。这里简单写一个关于采样的程序,模拟采样的过程。

量化是啥?

将采样点亮度值离散化,即将亮度连续变化的区间转换成单个特定数码的过程。

  • 均衡量化:原图像灰度层从最暗至最亮均匀分为有限个层次;
  • 非均匀量化:即不均匀;
  • 图像文件格式
文件格式应用背景数据压缩方式
BMPWindows改进的LZ77压缩法
TIFF支持多平台与操作系统RLE
GIF网上图像在线传输RLE、Huffman、LZW(字典压缩)等
JPEG存储照片图像RLE4、RLE8或不压缩
  • 图像分类:

依据图像动与不动分为静止图像和运动图像;
依据图像维数可分为二维和三维;
依据图像辐射波长不同可分为X射线图、紫外线图、可见光图像、红外线图像、微波图像等;
依据图像的强度或颜色等级划分可分为二值图像、灰度图像、索引图像、RGB图像;
依据成像传感器类别划分,图像可分为电视图像、红外图像、雷达图像、超声图像、X射线、核磁共振图像。

  • 彩色图像

红、绿、蓝为三基色。

这篇文章是今天无意间在草稿箱中发现的,还是我上学时候写的,转眼已经过去一年有余,好久没更新了,本来想着把他写完再更新,一看要写的东西太多了,包括后面如何对图像处理,原理是啥?怎么实现?对于才入门的小伙伴来说,看书肯定比看我在这唠嗑强,所以直接发布了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/127660.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【HTML/CSS】入门导学篇

本文属于HTML/CSS专栏文章,适合WEB前端开发入门学习,如果有所帮助请一键三连支持,对博主系列文章感兴趣点击下方专栏了解详细。 本文内容出自B站pink老师的前端入门教程,感谢pink老师!!! 视频链…

【C++】封装map和set(红黑树实现)

前言: 前面,我们学习了set和map的用法,这两个容器可以完成查找,排序等操作,后来我们在学习过二叉搜索树的基础上又学习了两种特殊的二叉搜索树——AVL树和红黑树,他们俩可以是效率进一步提高,其…

Spring Security OAuth2 远程命令执行漏洞

文章目录 一、搭建环境二、漏洞验证三、准备payload四、执行payload五、变形payload 一、搭建环境 cd vulhub/spring/CVE-2016-4977/ docker-compose up -d 二、漏洞验证 访问 http://192.168.10.171:8080/oauth/authorize?response_type${233*233}&client_idacme&s…

【安全】正则回溯绕过练习简单案例

目录 环境 案例1 前要 代码审计 分析 案例2 代码审计 分析 payload 环境 phpstudy 案例1 前要 php中0 1 -1 true false null 空字符 数组之间的比较 代码审计 <?php function areyouok($greeting){return preg_match(/Merry.*Christmas/is,$greeting); //2.传…

YAML配置文件

YAML配置文件 SpringBoot中application.properties文件存在的问题&#xff1a;配置太多后难阅读和修改&#xff0c;层级结构辨识度不高。 简介 YAML是"YAML Ain’t a Markup Language"&#xff08;YAML不是一种标记语言&#xff09;的递归缩写。在开发的这种语言时&a…

前端(十六)——Web应用的安全性研究

&#x1f642;博主&#xff1a;小猫娃来啦 &#x1f642;文章核心&#xff1a;Web应用的安全性研究 文章目录 概述常见前端安全漏洞XSS&#xff08;跨站脚本攻击&#xff09;CSRF&#xff08;跨站请求伪造&#xff09; 点击劫持安全性验证与授权用户身份验证授权与权限管理 安全…

matlab数据处理: cell table array+datetime

原数据文件.csv matlab xlsread(filename{i},B2:T2881) 会同于Excel最多1048576行 舍弃 a{1,i} xlsread(filename{i},‘B2:T2881’);%读取excel文件,选定区域’B2:G2881’ readcell(filename{i},Range,E2:M2881) 会全部读取 优选 对于日期 yyyy-MM-dd HH:mm:ss.000 matlab cel…

Spring系列文章:面向切面编程AOP

一、代理模式 1、代理模式使用场景引入 ⽣活场景1&#xff1a;⽜村的⽜⼆看上了隔壁村⼩花&#xff0c;⽜⼆不好意思直接找⼩花&#xff0c;于是⽜⼆找来了媒婆王妈妈。这 ⾥⾯就有⼀个⾮常典型的代理模式。⽜⼆不能和⼩花直接对接&#xff0c;只能找⼀个中间⼈。其中王妈妈是…

百度输入法全面升级,打造首个基于大模型的输入法原生应用

基于文心一言&#xff0c;百度输入法宣布全面升级&#xff0c;打造行业首个“基于大模型的输入法原生应用”&#xff0c;从“输入工具”全面转型为“AI创作工具”。 近日&#xff0c;百度文心一言正式向公众开放。基于文心一言&#xff0c;百度输入法宣布全面升级&#xff0c;打…

【JAVA】抽象类与接口

作者主页&#xff1a;paper jie_的博客 本文作者&#xff1a;大家好&#xff0c;我是paper jie&#xff0c;感谢你阅读本文&#xff0c;欢迎一建三连哦。 本文录入于《JAVASE语法系列》专栏&#xff0c;本专栏是针对于大学生&#xff0c;编程小白精心打造的。笔者用重金(时间和…

【Linux】——网络基础:http协议

目录 前言 应用层 认识协议 协议的概念 传输结构化数据 序列化和反序列化 网络版本计算器 服务器端Server 客户端Client 协议定制 其它 运行效果 HTTP协议 HTTP的简介 认识URL urlencode和urldecode HTTP协议格式 HTTP请求 HTTP响应 HTTP的方法 GET和POST…

顺序表详解

&#x1f493; 博客主页&#xff1a;江池俊的博客⏩ 收录专栏&#xff1a;数据结构探索&#x1f449;专栏推荐&#xff1a;✅C语言初阶之路 ✅C语言进阶之路&#x1f4bb;代码仓库&#xff1a;江池俊的代码仓库&#x1f525;编译环境&#xff1a;Visual Studio 2022&#x1f38…

Tampermonkey实践:安装引导及开发一个网页背景色更改插件

&#x1f3c6;作者简介&#xff0c;黑夜开发者&#xff0c;CSDN领军人物&#xff0c;全栈领域优质创作者✌&#xff0c;CSDN博客专家&#xff0c;阿里云社区专家博主&#xff0c;2023年6月csdn上海赛道top4。 &#x1f3c6;数年电商行业从业经验&#xff0c;历任核心研发工程师…

leetcode 2. 两数相加(java)

两数相加 题目描述哨兵技巧代码演示&#xff1a; 递归算法专题 题目描述 难度 - 中等 leetcode 2. 两数相加 给你两个 非空 的链表&#xff0c;表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的&#xff0c;并且每个节点只能存储 一位 数字。 请你将两个数相加&…

宇凡微发布2.4G合封芯片YE08,融合高性能MCU与射频收发功能

宇凡微在2023年推出了全新的2.4G合封芯片YE08&#xff0c;该芯片结合了32位高性能MCU和强大的2.4GHz无线通信功能&#xff0c;为各种远程遥控应用提供卓越性能和广泛应用潜力。 深入了解YE08内部构造 YE08芯片内部融合了两颗强大的芯片&#xff1a;PY32F002B MCU和G350 2.4G通…

【LeetCode-中等题】78. 子集

文章目录 组合并集问题汇总&#xff1a;题目方法一&#xff1a;动态规划方法二&#xff1a;递归加回溯(关键----startIndex) 组合并集问题汇总&#xff1a; 1、子集去重版本 2、组合非去重版本 3、组合去重版本 题目 注意&#xff1a;这里的nums数组里面的元素是各不相同的&a…

OLED透明屏触控:引领未来科技革命的创新力量

OLED透明屏触控技术作为一项颠覆性的创新&#xff0c;正在引领新一轮科技革命。它将OLED显示技术与触摸技术相结合&#xff0c;实现了透明度和触控功能的完美融合。 在这篇文章中&#xff0c;尼伽将通过引用最新的市场数据、报告和行业动态&#xff0c;详细介绍OLED透明屏触控…

《python趣味工具》——酷炫二维码(3)计算机二级考试题

昨天我们学习了如何批量制作合适的二维码&#xff0c;今天来刷几道题练练手&#xff01; 文章目录 1. 制作名单2. 年会抽奖来啦3. 精准查找 1. 制作名单 秋招来了&#xff01;hr部门需要获得简历初筛后的候选者名单&#xff0c;所有候选者简历都按照“小明_xx大学.pdf”命名放…

建站系列(五)--- 前端开发语言之HTML、CSS、JavaScript

目录 相关系列文章前言一、前端开发与后端开发二、前端语言简介&#xff08;一&#xff09;、HTML&#xff08;二&#xff09;、CSS&#xff08;三&#xff09;、JavaScript 三、学习指导&#xff08;一&#xff09;、开发环境&#xff08;二&#xff09;、第一个Hello&#xf…

咖啡店小程序:吸引顾客的创新营销手段

近日&#xff0c;“酱香拿铁”的大火让大家再次把目标聚焦在年轻人都喜欢的咖啡上。现在咖啡已经成为年轻一代的社交硬通货&#xff0c;咖啡店也遍地开花。而随着移动互联网的快速发展&#xff0c;咖啡店小程序已经成为了各大咖啡店主的选择&#xff0c;因为它提供了便捷的方式…