什么是OCR？OCR技术详解

什么是OCR？OCR技术详解

news/2024/12/25 22:13:20/文章来源:https://blog.csdn.net/cz_00001/article/details/132107985

光学字符识别(Optical Character Recognition)简称为“OCR”。ORC是指对包含文本资料的图像文件进行分析识别处理，获取文字及版面信息的技术。

一般包括以下几个过程：

1.图像输入

针对不同格式的图像，有着不同的存储格式和压缩方式。目前，用于存取图像的开源项目有OpenCV和CxImage等。

2.预处理

预处理主要包括二值化、噪声去除和倾斜较正，具体内容如下：

二值化：大多数情况下，使用摄像头拍摄的图片都是彩色图像，彩色图像包含的信息量非常丰富，需要进行简化。我们可以将图片的内容简单地分为前景和背景，为了让计算机更快地、更好地识别文字，需要先对彩色图像进行处理，使图片只剩下前景与背景信息，即简单地定义前景信息为黑色，背景信息为白色，这就是二值化图。彩色图像和二值化图像处理前后对比如图1所示。

噪声清除：对于不同的文档，噪声的定义可以不同。根据噪声的特征进行消除处理，这就叫做噪声去除。

倾斜校正：通常情况下，用户拍摄的照片比较随意，很有可能拍照文档会产生倾斜。这时，需要使用文字识别软件进行校正。

3.版面分析

将文档图片分段落、分行的过程叫做版面分析。由于实际文档的多样性和复杂性，目前没有一个固定的、最好的切割模型。

4.字符切割

由于拍照条件的限制，经常会造成字符粘连、断笔等情况，因此极大地限制了识别系统的性能。此时就需要文字识别软件具备字符切割的功能。

5.字符识别

很早的时候就有模板匹配，后来是以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响，极大地增加了提取的难度。

6.版面恢复

通常，人类希望识别后的文字，仍然按照原文档图片那样排列着，保持段落不变、位置不变、顺序不变，之后输出到Word文档或PDF文档，这个过程就叫做版面恢复。

7.后处理、核对

不同的语言环境中，语言的逻辑顺序是不同的。因此，需要根据语言特征的上下文，对识别后的结果进行校正，这个过程就是后处理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/80310.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

TypeScript学习笔记

TypeScript学习笔记

1.ts和js的区别 2. ts的优势 3. ts下载后报错解决方法报错: PS C:\Users\\Desktop> tsc -v tsc : 无法加载文件 C:\Users\32173\AppData\Roaming\npm\tsc.ps1，因为在此系统上禁止运行脚本。有关详细信息，请参阅 https:/ go.microsoft.com/fwlink/?…

阅读更多...

接口测试——电商网站接口测试实战（四）

接口测试——电商网站接口测试实战（四）

1. 接口测试需求分析常见接口文档提供的两种方式 ①word文档 ②在线文档电商网站网址模拟练习：Swagger UI 2. 登陆的分析慕慕生鲜网址：慕慕生鲜账号密码点击execute后输入账号密码后点击开发者工具，再登录，点击网络&…

阅读更多...

Linux下C/C++的gdb工具与Python的pdb工具常见用法之对比

Linux下C/C++的gdb工具与Python的pdb工具常见用法之对比

1、gdb和pdb分别是什么？ 1.1、gdb GDB（GNU Debugger）是一个功能强大的命令行调试工具，由GNU项目开发，用于调试C、C等编程语言的程序。它在多个操作系统中都可以使用，包括Linux、MacOS和Windows&#xff0…

阅读更多...

oracle的管道函数

oracle的管道函数

Oracle管道函数(Pipelined Table Function)oracle管道函数 1、管道函数即是可以返回行集合（可以使嵌套表nested table 或数组 varray）的函数，我们可以像查询物理表一样查询它或者将其赋值给集合变量。 2、管道函数为并行执行，在…

阅读更多...

如何实现基于场景的接口自动化测试用例？

如何实现基于场景的接口自动化测试用例？

自动化本身是为了提高工作效率，不论选择何种框架，何种开发语言，我们最终想实现的效果，就是让大家用最少的代码，最小的投入，完成自动化测试的工作。基于这个想法，我们的接口自动化测试思路如下…

阅读更多...

软件设计师（七）面向对象技术

软件设计师（七）面向对象技术

面向对象： Object-Oriented， 是一种以客观世界中的对象为中心的开发方法。面向对象方法有Booch方法、Coad方法和OMT方法等。推出了同一建模语言UML。面向对象方法包括面向对象分析、面向对象设计和面向对象实现。一、面向对象基础 1、面向对象的基本…

阅读更多...

【数据结构与算法】二叉排序树（BST）

【数据结构与算法】二叉排序树（BST）

二叉排序树（BST） 需求： 给你一个数列{7,3,10,12,5,1,9}，要求能够高效的完成对数据的查询和添加。解决方案分析使用数组数组未排序，优点：直接在数组尾添加，速度快。缺点：查找速…

阅读更多...

[C++项目] Boost文档站内搜索引擎(3): 建立文档及其关键字的正排倒排索引、jieba库的安装与使用...

[C++项目] Boost文档站内搜索引擎(3): 建立文档及其关键字的正排倒排索引、jieba库的安装与使用...

之前的两篇文章: 第一篇文章介绍了本项目的背景, 获取了Boost库文档 🫦[C项目] Boost文档站内搜索引擎(1): 项目背景介绍、相关技术栈、相关概念介绍…第二篇文章分析实现了parser模块. 此模块的作用是对所有文档html文件, 进行清理并汇总 🫦[C项目] …

阅读更多...

Spring Boot整合ES的两种方式

Spring Boot整合ES的两种方式

使用Spring Data Elasticsearch Starter 在Spring Boot中整合Elasticsearch的方式之一是使用Elasticsearch的官方Spring Data Elasticsearch Starter。该Starter提供了对Elasticsearch的高级集成，简化了配置和管理Elasticsearch客户端。下面是使用Spring Data E…

阅读更多...

【C++】智能指针

【C++】智能指针

一、为什么要智能指针下面我们先分析下面这段程序有没有什么内存方面的问题？ int Div(int a, int b) {if (b 0)throw invalid_argument("除0错误");elsereturn a / b; } void Func() {// 1、如果 p1 这里 new 抛异常会如何？// 2、如果 p2 …

阅读更多...

【C++从0到王者】第十六站：stack和queue的使用

【C++从0到王者】第十六站：stack和queue的使用

文章目录一、stack的使用1.stack的介绍2.stack的使用二、queue的使用1.queue的护额晒2.queue的使用三、stack和queue相关算法题1.最小栈2.栈的压入、弹出序列3.逆波兰表达式4.两个栈实现一个队列5.用两个队列实现栈6.二叉树的层序遍历1.双队列2.用一个变量levelSize去控制 7…

阅读更多...

K8S系列文章之编写自动化部署K8S脚本

K8S系列文章之编写自动化部署K8S脚本

介绍通过ansible脚本shell实现自动化部署k8s基础集群(v1.25.0) 部署结构 1. 通过二进制部署包镜像安装k8s集群、目录etcd节点只支持1-3个节点、最多三个etcd节点 2. 因k8s版本相对较新、需要升级内核来支持后台程序、当前版本只支持Cento7，内核版本(5.19.4-1.el7…

阅读更多...

ffmpeg+nginx实现rtsp协议摄像头web端播放

ffmpeg+nginx实现rtsp协议摄像头web端播放

ffmpegnginx实现rtsp协议摄像头web端播放环境准备准备nginx环境添加rtmp模块添加hls转发使用ffmpeg，将摄像头rtsp转为rtmp并推送到nginxVLC播放验证环境准备 nginx（需要安装rtmp模块）ffmpeg 6.0vlc播放器（本地播放验证&#x…

阅读更多...

大数据课程H2——TELECOM的电信流量项目实现

大数据课程H2——TELECOM的电信流量项目实现

文章作者邮箱：yugongshiyesina.cn 地址：广东惠州 ▲ 本章节目的 ⚪ 了解TELECOM项目的数据收集； ⚪ 了解TELECOM项目的数据清洗； ⚪ 了解TELECOM项目的数据导出； ⚪ 了解TELECOM项目的数据可视化&…

阅读更多...

观察者模式（C++）

观察者模式（C++）

定义定义对象间的一种一对多(变化)的依赖关系，以便当一个对象(Subject)的状态发生改变时，所有依赖于它的对象都得到通知并自动更新。 ——《设计模式》GoF 使用场景一个对象（目标对象）的状态发生改变，所有的依赖对…

阅读更多...

SpringBoot第33讲：SpringBoot集成ShardingJDBC - 基于JPA的读写分离

SpringBoot第33讲：SpringBoot集成ShardingJDBC - 基于JPA的读写分离

SpringBoot第33讲：SpringBoot集成ShardingJDBC - 基于JPA的读写分离本文是SpringBoot第33讲，主要介绍分表分库，以及SpringBoot集成基于 ShardingJDBC 的读写分离实践文章目录 SpringBoot第33讲：SpringBoot集成ShardingJDBC - 基…

阅读更多...

uni-app:实现点击按钮出现底部弹窗（uni.showActionSheet+自定义）

uni-app:实现点击按钮出现底部弹窗（uni.showActionSheet+自定义）

一、通过uni.showActionSheet实现底部选择效果代码 <template><view><button click"showActionsheet">点击打开弹窗</button></view> </template><script> export default {methods: {showActionsheet() {uni.showAct…

阅读更多...

消息队列项目(2)

消息队列项目(2)

我们使用 SQLite 来进行对 Exchange, Queue, Binding 的硬盘保存对 Message 就保存在硬盘的文本中 SQLite 封装这里是在 application.yaml 中来引进对 SQLite 的封装 spring:datasource:url: jdbc:sqlite:./data/meta.dbusername:password:driver-class-name: org.sqlite.…

阅读更多...

Python 中的机器学习简介：多项式回归

Python 中的机器学习简介：多项式回归

一、说明多项式回归可以识别自变量和因变量之间的非线性关系。本文是关于回归、梯度下降和 MSE 系列文章的第三篇。前面的文章介绍了简单线性回归、回归的正态方程和多元线性回归。二、多项式回归多项式回归用于最适合曲线拟合的复杂数据。它可以被视为多元线性回归的子集。…

阅读更多...

APP外包开发的学习流程

APP外包开发的学习流程

学习iOS App的开发是一项有趣和富有挑战性的任务，是一个不断学习和不断进步的过程。掌握基础知识后，不断实践和尝试新的项目将使您的技能不断提升。下面和大家分享一些建议，可以帮助您开始学习iOS App的开发。北京木奇移动技术有限公司&#…

阅读更多...

最新文章

推荐文章