OpenCV答题卡识别

文章目录

  • 一、基本流程
  • 二、代码实现
    • 1.定义函数
    • 2.图像预处理
      • (1)高斯模糊、边缘检测
      • (2)轮廓检测
      • (3)透视变换
      • (4)阈值处理和轮廓检测
    • 3.筛选和排序选项轮廓
    • 4.判断答案
    • 5.显示结果
  • 三、总结

OpenCV在答题卡识别中发挥着重要作用,它能够通过一系列图像处理技术,实现对答题卡的自动识别,并进行答题结果的统计。以下是一个基于OpenCV的答题卡识别的基本流程和关键步骤:

一、基本流程

  • 图片读取:首先,使用OpenCV读取答题卡的图像文件。
  • 图片预处理:对读取的图像进行预处理,包括灰度化、滤波去噪、边缘检测等,以突出答题卡中的关键信息。
  • 轮廓检测:通过轮廓检测算法,找到答题卡中各个选项或区域的轮廓。
  • 透视变换:对检测到的轮廓进行透视变换,以校正答题卡的视角,使其更加符合后续处理的需求。
  • 阈值处理:对校正后的图像进行阈值处理,将图像转换为二值图像,便于后续的分析和识别。
  • 答题区域识别:在二值图像中,识别出答题卡上的各个答题区域。
  • 答题结果判断:根据答题区域的填充情况,判断答题结果,并与正确答案进行对比,计算答题正确率。

二、代码实现

1.定义函数

import numpy as np
import cv2ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}def cv_show(name, img):cv2.imshow(name, img)cv2.waitKey(60)def order_points(pts):rect = np.zeros((4, 2), dtype='float32')  # 用来存储排序之后的坐标位置# 按顺序找到对应华标0123分别是左上,右上,右下,左下s = pts.sum(axis=1)rect[0] = pts[np.argmin(s)]rect[2] = pts[np.argmax(s)]diff = np.diff(pts, axis=1)rect[1] = pts[np.argmin(diff)]rect[3] = pts[np.argmax(diff)]return rectdef four_point_transform(image, pts):rect = order_points(pts)(tl, tr, br, bl) = rectwidthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))maxWidth = max(int(widthA), int(widthB))heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))maxHeight = max(int(heightA), int(heightB))# 变换后对应坐标位置dst = np.array([[0, 0], [maxWidth - 1, 0],[maxWidth - 1, maxHeight - 1], [0, maxHeight - 1]], dtype='float32')M = cv2.getPerspectiveTransform(rect, dst)  # 计算从原始四边形到目标矩形的透视变换矩阵 M。warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))  # 应用透视变换矩阵 M 到原始图像 image 上,对图像透视变换return warpeddef sort_contours(cnts, method='left-to-right'):reverse = Falsei = 0if method == 'right-to-left' or method == 'bottom-to-top':reverse = Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts](cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))return cnts, boundingBoxes

定义答案密钥:

  • ANSWER_KEY 是一个字典,存储了每个问题的正确答案(在这个例子中,只有5个问题,但密钥是通用的,可以扩展到更多问题)。

定义辅助函数:

  • cv_show(name, img):显示图像,并在指定时间后关闭窗口。
  • order_points(pts):根据轮廓点的坐标,将它们排序为左上、右上、右下、左下的顺序,以便进行透视变换。
  • four_point_transform(image, pts):使用四个点进行透视变换,将图像校正为矩形。
  • sort_contours(cnts,method=‘left-to-right’):根据指定的方法(从左到右、从右到左、从上到下、从下到上)对轮廓进行排序。

2.图像预处理

(1)高斯模糊、边缘检测

image = cv2.imread(r'./images/test_01.png')
contours_img = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)  # 对图像进行高斯模糊
# (5,5)表示高斯核函数,决定模糊程度,越大越模糊,0表示自动计算标准差。
cv_show('blurred', blurred)
edged = cv2.Canny(blurred, 75, 200)  # 边缘检测
cv_show('edged', edged)

读取答题卡图像,将图像转换为灰度图,然后应用高斯模糊来减少噪声并使用Canny边缘检测来找到图像中的边缘。打印图片如下:
在这里插入图片描述

(2)轮廓检测

cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1]  # cv2.RETR_EXTERNAL 轮廓检索,只检索最外层轮廓。
cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3)  # 绘制轮廓,在contours_img中绘制检索的轮廓
cv_show('conyours_img', contours_img)
docCnt = None
cv2.waitKey(10000)cnts = sorted(cnts, key=cv2.contourArea, reverse=True)  # 通过轮廓面积对轮廓进行由大到小排序
for c in cnts:peri = cv2.arcLength(c, True)  # 计算闭合轮廓的周长approx = cv2.approxPolyDP(c, 0.02 * peri, True)  # 对轮廓进行多边逼近if len(approx) == 4:  # 如果结果为四边形docCnt = approxbreak

在边缘检测后的图像中找到外部轮廓并进行绘制,根据轮廓面积对轮廓进行排序,找到最大的轮廓。使用approxPolyDP函数对轮廓进行多边形逼近,如果结果是四边形,则认为这是答题卡的轮廓。图像如下:
在这里插入图片描述

(3)透视变换

warped_t = four_point_transform(image, docCnt.reshape(4, 2))  # 调用函数进行图像透视变换
warped_new = warped_t.copy()
cv_show('warped', warped_t)

调用上述定义的函数four_point_transform,使用找到的答题卡轮廓的四个角点进行透视变换,将答题卡校正为矩形。图像如下:
在这里插入图片描述

(4)阈值处理和轮廓检测

warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] # 对图像进行阈值处理
cv_show('thresh', thresh)
thresh_Contours = thresh.copy()
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] # 轮廓检测
warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) # 在warped_t上绘制cnts轮廓
cv_show('warped_Contours', warped_Contours)
cv2.waitKey(10000)
questionCnts = []

对校正后的图像转化为灰度图,然后进行阈值处理,得到二值图像。在二值图像中再次进行轮廓检测,找到外部轮廓,这些轮廓代表答题卡上的选项。图像如下:
在这里插入图片描述

3.筛选和排序选项轮廓

for c in cnts:(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)questionCnts = sort_contours(questionCnts, method='top-to-bottom')[0] # 轮廓将按照它们在图像中从上到下的顺序进行排序。

根据轮廓的宽度、高度和宽高比筛选出类似矩形的轮廓,对选项轮廓进行排序,以便按顺序处理每个问题。

4.判断答案

correct = 0
for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = Nonefor (j, c) in enumerate(cnts):mask = np.zeros(thresh.shape, dtype='uint8') # 创建一个与二值图像 thresh 形状相同、数据类型为 uint8 的全零数组作为掩码。cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)cv2.waitKey(10000)thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask) # 使用掩码对二值图像 thresh 进行按位与操作,得到只包含当前轮廓内部像素的图像。cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 计算应用掩码后的图像中非零像素的总数。if bubbled is None or total > bubbled[0]:bubbled = (total, j)# 比较答案,通过将最多零像素总和的轮廓索引与答案索引比较,如果相同,及为绿色,且加入correct中,不同为红color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]:color = (0, 255, 0)correct += 1cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warpeding', warped_new)

对上述筛选的轮廓结果进行分组,每5给为一组。创建掩码mask,对二值图像 thresh 进行按位与操作,得到只包含当前轮廓内部像素的图像。计算应用掩码后的图像中非零像素的总数。将选中的选项与正确答案进行比较,如果匹配,则增加正确计数。图像如下:
在这里插入图片描述

5.显示结果

score = (correct / 5.0) * 100
print('[INFO] score: {:.2f}% '.format(score))
cv2.putText(warped_new, '{:.2f}%'.format(score), (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
cv2.imshow('Original', image)
cv2.imshow('Exam', warped_new)
cv2.waitKey(0)

在校正后的图像上用不同颜色标记出正确和错误的选项并计算并显示得分,显示原始图像和标记后的图像。
在这里插入图片描述

三、总结

本次主要为大家展示识别的答题卡的程序,这个程序的关键在于正确地识别答题卡的轮廓、选项的轮廓,以及准确地判断哪个选项被选中。通过这些操作,更好的为大家演示如何正确将轮廓检测、透视变换和阈值处理的结合使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/450056.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv11改进有效系列目录 - 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制 - 针对多尺度、小目标、遮挡、恶劣天气等问题

目标检测作为计算机视觉领域的一项核心任务&#xff0c;极大地推动了整个领域的发展。它不仅是其他许多视觉任务的基础工具&#xff0c;还在学术研究和实际应用之间架起了一座桥梁。目标检测的主要任务是识别和定位图像或视频中的特定对象&#xff0c;通常需要模型能同时处理多…

C++ | Leetcode C++题解之第476题数字的补数

题目&#xff1a; 题解&#xff1a; class Solution { public:int findComplement(int num) {int highbit 0;for (int i 1; i < 30; i) {if (num > (1 << i)) {highbit i;}else {break;} }int mask (highbit 30 ? 0x7fffffff : (1 << (hig…

【DBA Part01】国产Linux上安装Oracle进行数据迁移

内容如下&#xff1a; 1.1.生产环境RHEL/OEL Linux8Oracle11gR2安装配置 1.2.国产麒麟操作系统Oracle11gR2安装配置 1.3.国产麒麟操作系统Oracle11gR2 RAC集群安装配置 1.4.Oracle11gR2迁移到国产麒麟操作系统&#xff08;单机/RAC&#xff09; 本阶段课程项目需求说明&am…

零一万物 Yi-Lightning:超越 GPT-4o 冲击全球榜单;阿里国际 Marco 翻译大模型发布丨 RTE 开发者日报

开发者朋友们大家好&#xff1a; 这里是 「RTE 开发者日报」 &#xff0c;每天和大家一起看新闻、聊八卦。 我们的社区编辑团队会整理分享 RTE&#xff08;Real-Time Engagement&#xff09; 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 …

CEEMDAN +组合预测模型(Transformer - BiLSTM + ARIMA)

往期精彩内容&#xff1a; 时序预测&#xff1a;LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较 全是干货 | 数据集、学习资料、建模资源分享&#xff01; EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现&#xff08;一&#xff09;EMD-CSDN博客 EMD、EEM…

具备技术二:正则表达式

一、C正则库 regex 用于报文的解析。 使用接口&#xff1a;bool regex_match(const string &src, smatch &matches, regex &e); src&#xff1a;要解释的字符串。 smatch&#xff1a;一个类似于数组的结构&#xff0c;用于存储一个个解释之后的字符串。 matche…

鸿蒙网络编程系列3-TCP客户端通讯示例

1. TCP简介 TCP协议是传输层最重要的协议&#xff0c;提供了可靠、有序的数据传输&#xff0c;是多个广泛使用的表示层协议的运行基础&#xff0c;相对于UDP来说&#xff0c;TCP需要经过三次握手后才能建立连接&#xff0c;建立连接后才能进行数据传输&#xff0c;所以效率差了…

Android -- [SelfView] 多动画效果图片播放器

Android – [SelfView] 多动画效果图片播放器 效果&#xff08;录制的有点卡&#xff09; 1. 引用&#xff1a; <com.nepalese.virgolib.widget.image.BaseImageViewandroid:id"id/base_image"android:layout_width"match_parent"android:layout_heigh…

AD画图的使用

一、新建工程 二、绘制原理图 1、原理图搜索方法&#xff1a; https://www.ti.com/lit/ds/symlink/tlv1117.pdf?ts1729143086540&ref_urlhttps%253A%252F%252Fwww.mouser.tw%252F www.alldatasheet.com 2、绘图步骤&#xff1a; 注&#xff1a;管脚四点朝外

2024软考网络工程师笔记 - 第5章.无线通信网

文章目录 移动通信与 5G1️⃣移动通信2️⃣移动通信制式3️⃣5G 应用场景与关键技术 &#x1f551;WLAN 通信技术1️⃣WLAN 通信技术 &#x1f552;WLAN 频谱与信道&#xff08;高频考点&#xff09;1️⃣WLAN 网络分类2️⃣ISM频段3️⃣不重叠信道&#xff08;重点&#xff09…

uniapp 省、市、区、乡镇 数据层级选择插件 Ba-DataPicker

Ba-DataPicker 是一款uniapp数据层级选择弹窗插件。支持省市区乡四级&#xff1b;支持自定义数据。 支持省、市、区、乡镇四级支持自定义数据支持字母检索 截图展示 支持定制、本地包、源码等&#xff0c;有建议和需要&#xff0c;请点击文章结尾“Uniapp插件开发”联系我&am…

人脸识别-特征算法

文章目录 一、LBPH算法1.基本原理2.实现步骤3.代码实现 二、Eigenfaces算法1.特点2.代码实习 三、FisherFaces算法1.算法原理2.算法特点3.代码实现 四、总结 人脸识别特征识别器是数字信息发展中的一种生物特征识别技术&#xff0c;其核心在于通过特定的算法和技术手段&#xf…

代码随想录算法训练营第八天(1)|哈希表理论基础

文档讲解&#xff1a;代码随想录 难度&#xff1a;有一点 哈希表理论基础 哈希表 首先什么是哈希表&#xff0c;哈希表&#xff08;英文名字为Hash table&#xff0c;国内也有一些算法书籍翻译为散列表&#xff0c;大家看到这两个名称知道都是指hash table就可以了&#xff0…

指尖的无声告白,算法里的隐约温柔

公主请阅 1. 三数之和1. 题目说明示例 1示例 2示例 3 1.2 题目分析1.3 代码部分1.3 代码分析 2. 四数之和2.1 题目说明示例 1示例 2 2.2 题目分析2.3 代码部分2.4 代码解析 1. 三数之和 题目传送门 1. 题目说明 给定一个整数数组 nums&#xff0c;判断数组中是否存在三个元素 …

鸿道Intewell操作系统构型介绍之Intewell-C全实时构型

鸿道(Intewell)操作系统主要包括Intewell-C、Intewell-H和Intewell-V三种不同构型产品&#xff1a; Intewell-C Intewell-C是一款工业实时微内核操作系统&#xff0c;由科东软件自主研发&#xff0c;具有超低延迟和最小抖动&#xff0c;保障工业设备可以高效处理时间敏感的现…

python爬虫实战案例——从移动端接口抓取微博评论,采用cookie登陆,数据存入excel表格,超详细(15)

文章目录 1、任务目标2、网页分析3、代码编写3.1 代码分析3.2 完整代码1、任务目标 1、目标网站:微博文章(https://m.weibo.cn/detail/4813628149072458),这是微博某一篇博文,用于本文测试 2、要求:爬取该博文下,所有一级评论和二级评论,以及每条评论的作者,最后保存至E…

熵权法计算评价指标权重——使用Excel VBA实现

[ 熵权法 ] 信息是系统有序程度的一个度量&#xff0c;熵是系统无序程度的一个度量&#xff1b;根据信息熵的定义&#xff0c;对于某项指标&#xff0c;可以用熵值来判断某个指标的离散程度&#xff0c;其信息熵值越小&#xff0c;指标的离散程度越大&#xff0c; 该指标对综合…

java脚手架系列4--测试用例、拦截器

异常处理、拦截器、数据库连接 1 测试用例 单元测试是一个老生常谈的问题&#xff0c;无论是后端对自己的代码质量把的第一道关也好&#xff0c;也是对测试减缓压力。这里就不过多讲述测试用例的重要性&#xff0c;但是有2个框架我们必须了解一下。 1.1 JUnit和mockito 我们…

gitlab保护分支设置

版本&#xff1a;gitlab10.2.2 一旦设置master分支被保护&#xff0c;除了管理员之外的任何用户都无法直接向master提交代码&#xff0c;只要提交代码就会报错 # git push -u origin master Total 0 (delta 0), reused 0 (delta 0) remote: GitLab: You are not allowed to pu…

[LeetCode] 733. 图像渲染

题目描述&#xff1a; 有一幅以 m x n 的二维整数数组表示的图画 image &#xff0c;其中 image[i][j] 表示该图画的像素值大小。你也被给予三个整数 sr , sc 和 color 。你应该从像素 image[sr][sc] 开始对图像进行上色 填充 。 为了完成 上色工作&#xff1a; 从初始像素…