AI9-文本识别

AI9-文本识别

news/2024/12/23 23:26:53/文章来源:https://blog.csdn.net/u013480226/article/details/140927692

本章主要介绍文本识别算法的理论知识，包括背景介绍、算法分类和部分经典论文思路。

通过本章的学习，你可以掌握：

1. 文本识别的目标

2. 文本识别算法的分类

3. 各类算法的典型思想

1 背景介绍

文本识别是OCR（Optical Character Recognition）的一个子任务，其任务为识别一个固定区域的文本内容。在OCR的两阶段方法里，它接在文本检测后面，将图像信息转换为文字信息。

具体地，模型输入一张定位好的文本行，由模型预测出图片中的文字内容和置信度，可视化结果如下图所示：

文本识别的应用场景很多，有文档识别、路标识别、车牌识别、工业编号识别等等，根据实际场景可以把文本识别任务分为两个大类：**规则文本识别**和**不规则文本识别**。

* 规则文本识别：主要指印刷字体、扫描文本等，认为文本大致处在水平线位置

* 不规则文本识别：往往出现在自然场景中，且由于文本曲率、方向、变形等方面差异巨大，文字往往不在水平位置，存在弯曲、遮挡、模糊等问题。

下图展示的是 IC15 和 IC13 的数据样式，它们分别代表了不规则文本和规则文本。可以看出不规则文本往往存在扭曲、模糊、字体差异大等

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/392664.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

基于 Redis 的分布式信号量 Spring Boot 集成 Redisson 使用 Semaphore 控制并发访问数量

基于 Redis 的分布式信号量 Spring Boot 集成 Redisson 使用 Semaphore 控制并发访问数量

目录前言 pom yml Controller 演示注意前言工作中开发过一个服务，这里记作A服务，主要功能是配置，部署以及调用云函数。其中配置云函数的功能里，有一个配置项是并发数，意思是同一时间最多能有多少个请求调用…

阅读更多...

【MATLAB源码】数学建模基础教程(2)--层次分析法（评价类算法）

【MATLAB源码】数学建模基础教程(2)--层次分析法（评价类算法）

系列文章目录在最后面，各位同仁感兴趣可以看看！ 层次分析法引言一、层次分析法的特点二、模型的建立求解过程 (1)问题的提出：实际问题的转化(2)建立层次结构模型(3)构造判断(成对比较)矩阵(4)一致性检验：三、层次分析法的优点与…

阅读更多...

Codeforces Round 871 (Div. 4)（A~H）

Codeforces Round 871 (Div. 4)（A~H）

比赛链接 Dashboard - Codeforces Round 871 (Div. 4) - Codeforces A. Love Story 找到与codeforces 有多少个不同的字符。 #include<bits/stdc.h> #define int long long #define TEST int T; cin >> T; while (T--) #define ios ios::sync_with_stdio(fals…

阅读更多...

前端常用的性能优化方案

前端常用的性能优化方案

目录性能分析工具lighthouseWebpack Bundle分析开发阶段按需引入路由懒加载打包阶段打包配置减少包体积配置压缩分包资源预加载/预请求部署阶段开启http2静态资源缓存gzip压缩性能优化主要在三个阶段进行：开发阶段、开发结束后的打包阶段、项目部署上线阶段首…

阅读更多...

提升生产效率：APS高级计划排程系统在车间工序级排程的革命性应用

提升生产效率：APS高级计划排程系统在车间工序级排程的革命性应用

在制造业的数字化转型浪潮中，APS高级计划排程系统以凭借自身卓越的排程运算能力和应用灵活性，已经成为中大型制造业提升生产效率的关键工具。APS系统的介入，打通了传统ERP和MES等各类业务系统运营平台，并且通过产能均衡规划&#…

阅读更多...

为什么我3d模型选择面选不到？---模大狮模型网

为什么我3d模型选择面选不到？---模大狮模型网

在展览3D模型设计行业中，设计师常常面临诸多技术挑战，其中之一是在模型编辑过程中遇到选择面的困难。这不仅影响了设计工作效率，还可能影响最终作品的质量和展示效果。本文将探讨在3D模型设计中为何会遇到“为什么我3D模型选择面选不到?”这…

阅读更多...

【MySQL进阶篇】管理

【MySQL进阶篇】管理

1、系统数据库 MySQL数据库安装完成之后，自带以下四个数据库，具体作用如下： 数据库含义mysql存储MySQL服务器正常运行所需要的各种信息（时区、主从、用户、权限等）information_schema提供了访问数据库元数据的各种表…

阅读更多...

实战OpenCV之环境安装与配置

实战OpenCV之环境安装与配置

OpenCV是什么 OpenCV，英文全称为Open Source Computer Vision Library，是一个开源的计算机视觉和机器学习软件库。它设计用于提供一系列功能强大的算法，以帮助开发者处理图像和视频数据，实现各种视觉任务，包括&#xf…

阅读更多...

.NET内网实战：模拟Installer关闭Defender

.NET内网实战：模拟Installer关闭Defender

01基本介绍 02编码实现原理上通过Windows API函数将当前进程的权限提升至TrustedInstaller，从而实现了对Windows Defender服务的控制。通常可以利用Windows API中的OpenSCManager、OpenProcessToken、ImpersonateLoggedOnUser以及ControlService等函数协同工作&am…

阅读更多...

从干涉实验、化学反应到晶体管的科学之旅 - 《量子宇宙》读后感

在《量子宇宙》这本书中，作者没有讲述历史和发现的故事，而是从头到尾用公式推导来展示宇宙和现代物理学的壮美。量子理论处理的是概率，而不是确定性。大自然在某些方面本质上就是由或然率支配的。计算粒子出现的概率是我们能做到的极限。 …

阅读更多...

渗透小游戏，各个关卡的渗透实例---步骤简单（含代码）

渗透小游戏，各个关卡的渗透实例---步骤简单（含代码）

文章目录 Less-1Less-2Less-5updatexml报错注入： Less-6Less-7Less-8Less-9Less-11Less-13Less-15 Less-1 首先，可以看见该界面，该关卡主要是SQL注入，由于对用户的输入没有做过滤，使查询语句进入到了数据库中&#xff…

阅读更多...

springboot电影院线上购票系统-计算机毕业设计源码68220

springboot电影院线上购票系统-计算机毕业设计源码68220

目录摘要 1 绪论 1.1 选题背景与意义 1.2国内外研究现状 1.3论文结构与章节安排 2系统分析 2.1.1 技术可行性分析 2.1.2 经济可行性分析 2.1.3 法律可行性分析 2.2 系统流程分析 2.2.1 添加信息流程 2.2.2 修改信息流程 2.2.3 删除信息流程 2.3 系统功能分析 2.…

阅读更多...

synchronized 与 Lock 的区别

synchronized 与 Lock 的区别

synchronized 与 Lock 的区别 1、相同点2、不同点2.1 精确性与灵活性2.2 性能2.3 使用便利性 3、示例3.1 synchronized 示例3.2 Lock 示例 4、总结 💖The Begin💖点点关注，收藏不迷路💖 在Java多线程编程中，synchroniz…

阅读更多...

智能家居沙盘系统-智慧家居沙盘系统

智能家居沙盘系统-智慧家居沙盘系统

智能家居和物联网技术是当前科技领域的热门话题，随着各类智能家居产品的不断推出，智能家居市场也逐渐呈现出蓬勃发展的态势。智能家居快速发展，而物联网相关人才供应远远不足。高校开展智能家居工程及设计人才教育培养具有重大意义。基本介绍…

阅读更多...

【stm32】EXTI外部中断

【stm32】EXTI外部中断

EXTI外部中断 1、中断系统2、中断执行流程3、STM32中断4、NVIC基本结构5、NVIC优先级分组6、EXTI简介（引脚电平变化，申请中断）7、EXTI基本结构8、AFIO复用IO口9、EXTI框图10、旋转编码器简介11、程序设计：1.使用对射式红外传感器触…

阅读更多...

vue3实现商品图片放大镜效果（芋道源码yudao-cloud 二开笔记）

vue3实现商品图片放大镜效果（芋道源码yudao-cloud 二开笔记）

今天开发一个防某商城的商品图片放大镜，鼠标移动到图片位置时，右侧出现一个已放大的图片效果。示例如下： 下图的图片的放大效果和小图的切换封装成了组件PicShow.vue，可根据需求自行修改，如下： 第一步&…

阅读更多...

Html5总结

Html5总结

前端学习 html决定页面的结构css决定页面的样式js决定页面的行为 Html5 1.文本格式化标签（熟记） 你在网页中，有时需要为文字设置粗体、斜体或下划线效果，这时就需要用到HTML中的文本格式化标记 2.标签属性例如： …

阅读更多...

算法 —— 位运算

算法 —— 位运算

目录位运算常用结论位运算例题位1的个数比特位计算汉明距离只出现一次的数字判定字符是否唯一丢失的数字两整数之和消失的两个数字进制转换位运算常用结论想详细了解位运算的内容可以阅读我的这篇博客：应该背下的位运算以下我只介绍一些位…

阅读更多...

3.特征工程-特征抽取、特征预处理、特征降维

3.特征工程-特征抽取、特征预处理、特征降维

文章目录环境配置（必看）头文件引用1.数据集: sklearn代码运行结果 2.字典特征抽取: DictVectorizer代码运行结果稀疏矩阵 3.文本特征抽取(英文文本): CountVectorizer()代码运行结果 4.中文文本分词(中文文本特征抽取使用)代码运行结果 5.中文文本特征抽…

阅读更多...

Linux基础笔记分享（超详细~）

Linux基础笔记分享（超详细~）

文章目录 Linux基础1.基础概念2.基础命令命令行快捷键自动补全: tab移动光标快速删除翻看历史命令终止程序退出登录清屏查看命令帮助alias命令别名-快捷键pwd-类似于地图cd-类似于传送术mkdir-类似于合成装备touch-创建文件ls-类似于查看装备tree-打印目录层级结构cp-复制命令…

阅读更多...

最新文章

推荐文章