计算机视觉基础:OpenCV库详解

💓 博客主页:瑕疵的CSDN主页
📝 Gitee主页:瑕疵的gitee主页
⏩ 文章专栏:《热点资讯》

计算机视觉基础:OpenCV库详解

计算机视觉基础:OpenCV库详解

  • 计算机视觉基础:OpenCV库详解
    • 引言
    • OpenCV 概述
      • 什么是 OpenCV
      • OpenCV 的应用场景
    • 安装和配置 OpenCV
      • 安装 OpenCV
      • 验证安装
    • OpenCV 基础
      • 读取和显示图像
      • 图像的基本操作
        • 获取图像属性
        • 图像裁剪和复制
      • 图像处理
        • 灰度化
        • 高斯模糊
        • 边缘检测
      • 视频处理
        • 读取和显示视频
        • 视频录制
    • OpenCV 高级功能
      • 物体检测
        • Haar 级联分类器
      • 特征点检测
        • SIFT 和 SURF
      • 图像分割
        • GrabCut
    • 实战案例分析
      • 人脸识别
      • 物体跟踪
    • 总结
    • 参考资料

引言

计算机视觉是人工智能的一个重要分支,旨在使计算机能够理解和解释图像和视频内容。OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,提供了丰富的图像处理和计算机视觉功能。本文将详细介绍 OpenCV 的基本概念、安装配置、核心功能以及实际应用,帮助读者快速上手计算机视觉开发。

OpenCV 概述

什么是 OpenCV

OpenCV 是一个开源的计算机视觉库,支持多种编程语言(如 C++、Python、Java 等),并在多个平台上可用(如 Windows、Linux、macOS)。OpenCV 提供了大量的图像处理和计算机视觉算法,广泛应用于图像识别、物体检测、人脸识别等领域。

OpenCV 的应用场景

  • 图像处理:如图像增强、滤波、边缘检测等。
  • 物体检测:如行人检测、车辆检测等。
  • 人脸识别:如人脸检测、人脸识别等。
  • 视频分析:如运动检测、背景减除等。

安装和配置 OpenCV

安装 OpenCV

OpenCV 可以通过 pip 工具轻松安装。

pip install opencv-python

验证安装

安装完成后,可以通过以下代码验证 OpenCV 是否安装成功:

import cv2
print(cv2.__version__)

OpenCV 基础

读取和显示图像

OpenCV 提供了读取和显示图像的基本功能。

import cv2# 读取图像
image = cv2.imread('image.jpg')# 显示图像
cv2.imshow('Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像的基本操作

获取图像属性
  • 形状:获取图像的高度、宽度和通道数。
  • 像素值:获取和设置特定像素的值。
# 获取图像的形状
height, width, channels = image.shape
print(f'Height: {height}, Width: {width}, Channels: {channels}')# 获取特定像素的值
pixel_value = image[100, 100]
print(f'Pixel Value at (100, 100): {pixel_value}')# 设置特定像素的值
image[100, 100] = [0, 255, 0]  # 设置为绿色
图像裁剪和复制
  • 裁剪:提取图像的一部分。
  • 复制:创建图像的副本。
# 裁剪图像
cropped_image = image[50:150, 50:150]# 复制图像
copied_image = image.copy()

图像处理

灰度化

将彩色图像转换为灰度图像。

# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 显示灰度图像
cv2.imshow('Grey Image', grey_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
高斯模糊

对图像进行高斯模糊处理。

# 高斯模糊
blurred_image = cv2.GaussianBlur(image, (5, 5), 0)# 显示模糊图像
cv2.imshow('Blurred Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
边缘检测

使用 Canny 算法检测图像的边缘。

# 边缘检测
edges = cv2.Canny(image, 100, 200)# 显示边缘图像
cv2.imshow('Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

视频处理

读取和显示视频

OpenCV 可以读取和显示视频文件。

import cv2# 读取视频
cap = cv2.VideoCapture('video.mp4')while cap.isOpened():ret, frame = cap.read()if not ret:break# 显示帧cv2.imshow('Frame', frame)# 按 q 键退出if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源
cap.release()
cv2.destroyAllWindows()
视频录制

OpenCV 可以录制视频。

import cv2# 初始化视频捕获
cap = cv2.VideoCapture(0)# 定义编码器和输出文件
fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('output.avi', fourcc, 20.0, (640, 480))while cap.isOpened():ret, frame = cap.read()if not ret:break# 写入帧out.write(frame)# 显示帧cv2.imshow('Frame', frame)# 按 q 键退出if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

OpenCV 高级功能

物体检测

Haar 级联分类器

Haar 级联分类器是一种常用的物体检测方法,可以用于检测人脸、眼睛等。

import cv2# 加载 Haar 级联分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 读取图像
image = cv2.imread('image.jpg')# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 检测人脸
faces = face_cascade.detectMultiScale(grey_image, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 绘制矩形框
for (x, y, w, h) in faces:cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)# 显示图像
cv2.imshow('Face Detection', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

特征点检测

SIFT 和 SURF

SIFT(Scale-Invariant Feature Transform)和 SURF(Speeded-Up Robust Features)是常用的特征点检测算法。

import cv2# 读取图像
image = cv2.imread('image.jpg')# 初始化 SIFT 检测器
sift = cv2.xfeatures2d.SIFT_create()# 检测特征点
keypoints, descriptors = sift.detectAndCompute(image, None)# 绘制特征点
image_with_keypoints = cv2.drawKeypoints(image, keypoints, None)# 显示图像
cv2.imshow('SIFT Keypoints', image_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像分割

GrabCut

GrabCut 是一种基于图割的图像分割算法,用于从背景中分离前景。

import cv2# 读取图像
image = cv2.imread('image.jpg')# 初始化掩码
mask = np.zeros(image.shape[:2], np.uint8)# 定义前景和背景的初始矩形
rect = (50, 50, 300, 300)# 初始化前景和背景模型
bgd_model = np.zeros((1, 65), np.float64)
fgd_model = np.zeros((1, 65), np.float64)# 运行 GrabCut 算法
cv2.grabCut(image, mask, rect, bgd_model, fgd_model, 5, cv2.GC_INIT_WITH_RECT)# 将掩码转换为二值图像
mask2 = np.where((mask==2)|(mask==0), 0, 1).astype('uint8')# 应用掩码
segmented_image = image * mask2[:, :, np.newaxis]# 显示分割后的图像
cv2.imshow('Segmented Image', segmented_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

实战案例分析

人脸识别

假设我们有一个包含人脸的照片,需要进行人脸识别。

import cv2# 加载 Haar 级联分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 读取图像
image = cv2.imread('people.jpg')# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 检测人脸
faces = face_cascade.detectMultiScale(grey_image, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 绘制矩形框
for (x, y, w, h) in faces:cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)# 保存结果
cv2.imwrite('detected_faces.jpg', image)

物体跟踪

假设我们有一个视频,需要跟踪视频中的移动物体。

import cv2# 初始化视频捕获
cap = cv2.VideoCapture('video.mp4')# 初始化背景减除器
fgbg = cv2.createBackgroundSubtractorMOG2()while cap.isOpened():ret, frame = cap.read()if not ret:break# 应用背景减除器fgmask = fgbg.apply(frame)# 显示帧cv2.imshow('Frame', frame)cv2.imshow('FG Mask', fgmask)# 按 q 键退出if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源
cap.release()
cv2.destroyAllWindows()

总结

通过本文,我们深入了解了 OpenCV 的基本概念、安装配置、核心功能以及实际应用。OpenCV 是一个强大的计算机视觉库,提供了丰富的图像处理和计算机视觉功能。希望本文能帮助读者更好地理解和应用 OpenCV,提升计算机视觉开发能力。

参考资料

  • OpenCV 官方文档
  • 计算机视觉入门教程
  • OpenCV 实战案例

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/465847.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

细说STM32单片机USART中断收发RTC实时时间并改善其鲁棒性的另一种方法

目录 一、工程目的 1、目标 2、通讯协议及应对错误指令的处理目标 二、工程设置 三、程序改进 四、下载与调试 1、合规的指令 2、不以#开头,但以;结束,长度不限 3、以#开头,不以;结束,也不包含;,长…

路见不平 ! 基于tensorlfow快速迭代的户型图分类功能

前言 在工作之余,发现合作的同事需要手动筛选户型图,存在一些老旧或无家具的户型图。这启发我们通过机器学习的模型预测来辅助校验,进而优化筛选流程。当前本期目标为6万个,后续也会有数据需要筛选,已经筛选出一部分数据 可以进行模型训练&am…

字符串接龙 /单词接龙 (BFs C#

卡码网 110和 力扣127 和LCq 108题都是一个解法 这两道题乍一看在结果处可能不一样 力扣要求 字符串里边必须包含对应的最后一个字符 而110不需要最后一个字符 但是在实验逻辑上是一致的 只是110需要把如果在set中找不到最后一个字符就直接返回0的逻辑删去 就可以了 这就是…

STM32之看门狗

STM32有独立看门狗(IWDG)和窗口看门狗(WWDG)。 采用窗口看门狗(WWDG),有一个死前中断,可以用来作一个报警的功能。 独立看门狗超时时间计算公式 假设LSI是32KHz,超时时间等于 预分频系数(4&…

平安科技(外包)面试分享

前言: 这是成都这边的平安科技面试分享,上家公司是做海外的,好不容易逮到公司离职赔偿的机会,我就离职了,没想到过了国庆节之后,工作是那么的难找,大概投了1-2周简历(外包和短期项目…

Python 在PDF中绘制形状(线条、矩形、椭圆形等)

在PDF中绘制图形可以增强文档的视觉效果。通过添加不同类型的形状,如实线、虚线、矩形、圆形等,可以使文档更加生动有趣,提高读者的阅读兴趣。这对于制作报告、演示文稿或是教材特别有用。本文将通过以下几个示例介绍如何使用Python 在PDF中绘…

2-2.STM32之定时器TIM---输入捕获--实验2( PWMI模式测频率占空比)

输入捕获模式测频率、PWMI模式测频率占空比-CSDN博客 参考这篇文章! 来利用一个GPIO的定时器的两个通道进行捕获占空比和频率,看出可以看出。TI1FP1和TI2FP2,计数值分别在CCR1和CCR2中取, 测周法 IC.c #include "stm32f1…

2024年转行指南:大学生进军就业前景广阔的领域——人工智能大模型

据教育部数据统计,2024高校毕业生规模预计达1179万人,将再创历史新高,“就业难”仍是当前大学毕业生需要直面的问题。在此背景下,选择一个就业前景好的专业尤为重要。 究竟学什么样的专业好就业呢?给毕业生们推荐3个当…

suanfabiji

1 差分练习 1 模板题 代码实现: import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int m sc.nextInt();int num sc.nextInt();long[][] arr new long[n 2][m 2…

WPS单元格重复值提示设置

选中要检查的所有的单元格 设置提示效果 当出现单元格值重复时,重复的单元格就会自动变化 要修改或删除,点击

一.Linux文件基本属性

前言:Linux系统是一个多用户系统,不同的用户处于不同的地位,也就是说具有不同的权限。为了安全,对于不同用户访问同一个文件,设置不同权限是很有必要的。 一.文件的基本属性理解 在Linux中,通常是这两个命…

【学习记录】使用CARLA录制双目摄像头SLAM数据

一、数据录制 数据录制的部分参考了网上的部分代码,代码本身并不复杂,基本都是简单的CARLA语法,关键的一点在于,CARLA内部本身并没有预设的双目摄像头,需要我们添加两个朝向相同的摄像头来组成双目系统,这…

算法的基础知识

算法的定义 算法是为了解决某类问题而规定的一个有限长的操作序列。 算法的特性 1. 有穷性(Finiteness) 含义:一个算法必须总是在执行有穷步后结束,且每一步都必须在有穷时间内完成。重要性:确保算法能够在合理的时…

城镇保障性住房管理:SpringBoot技术应用

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统,它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等,非常…

【ComfyUI】flux人像摄影风格迁移的最优解?这个效果应该暂时无敌了吧?效果不好你打我!

大家好,这期我们主要讨论如何使用stable diffusion comfyUI 制作基于flux的人像摄影,主要实现风格迁移的功能。 我们都知道flux的生态目前不太完善,flux的controlnet和flux ipadapter虽然有,但效果不太好,可控性不强。…

基于微信的追星小程序+ssm(lw+演示+源码+运行)

摘 要 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,追星小程序被用户普遍使用,为方便用户能够可以…

esp32cam+Arduino IDE在编译时提示找不到 esp_camera.h 的解决办法

多半是因为你的ESP32库升级了,不再是 1.02版本,或者根本就没有 ESp32 库。如果被升级了,还原为1.02版本就可以了。如果没有,按照下述方法添加: 首先,在"文件"->"首选项"->"…

基于物联网设计的地下煤矿安全监测与预警

文章目录 一、前言1.1 项目介绍【1】项目开发背景【2】设计实现的功能【3】项目硬件模块组成 1.2 设计思路1.3 系统功能总结1.4 开发工具的选择【1】设备端开发【2】上位机开发 1.5 模块的技术详情介绍【1】NBIOT-BC26模块【2】MQ5传感器【4】DHT11传感器【5】红外热释电人体检…

第8章 利用CSS制作导航菜单作业

1.利用CSS技术&#xff0c;结合链接和列表&#xff0c;设计并实现“山水之间”页面。 浏览效果如下&#xff1a; HTML代码如下&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8" /><title>山水之间</title><…

32单片机HAL库的引脚初始化

在使用HAL库时&#xff0c;GPIO初始化函数定义在stm32f4xx_hal_gpio.c文件中&#xff0c;如下&#xff1a; void HAL_GPIO_Init(GPIO_TypeDef *GPIOx, GPIO_InitTypeDef *GPIO_Init); 由这个函数可以看出&#xff0c;在初始化GPIO时&#xff0c;需要向函数传入2个结构体&…