OCR调研

OCR调研

news/2024/11/23 21:22:19/文章来源:https://blog.csdn.net/m0_51974705/article/details/141065851

OCR调研

一、介绍

OCR（Optical Character Recognition，光学字符识别）是一种将图像中的文字转换为计算机可处理格式的技术。OCR技术经历了从传统OCR到基于深度学习的OCR的转变。深度学习OCR技术通过模拟人脑神经元结构处理文本和图像数据，相较于传统OCR，在复杂场景下的识别性能和速度有显著提升。它在金融、保险、医疗、交通、教育等多个行业中有广泛应用，并随着人工智能技术的发展，OCR技术的性能不断提升，应用场景也日益复杂化。

二、开源项目

1 PaddleOCR

项目地址：https://github.com/PaddlePaddle/PaddleOCR

PaddleOCR文档：https://paddlepaddle.github.io/PaddleOCR/

百度开源项目，文档完善。PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库，助力使用者训练出更好的模型，并应用落地。

优点：准确率高，支持多语言，支持多种 OCR 相关前沿算法，支持自训练，支持倾斜、竖排等多种方向文字识别

缺点：偏向中文识别，语言支持有限

部署：本地部署、云端部署、docker

2 Tesseract

项目地址：https://github.com/tesseract-ocr/tesseract

优点：由Google维护，支持超过100种语言的识别，并且能够处理多种图像格式，如PNG、JPEG和TIFF等。提供了丰富的API接口和文档，支持多种操作系统。

缺点：速度慢

部署：安装Tesseract OCR（Windows/Linux）、配置环境变量

3 EasyOCR

项目地址：https://github.com/JaidedAI/EasyOCR

优点：全语种的（包括70+门外语识别），不单单针对中文

缺点：速度慢，官方推荐支持CUDA的独立显卡可以提高运行效率。

部署：pip安装，只能linux/windows下运行。

4 chineseocr

基于yolo3 与crnn 实现中文自然场景文字检测及识别

项目地址：https://github.com/chineseocr/chineseocr

优点：支持补充训练，有多版本优化模型

缺点：使用的三方库较老，部分三方库已废弃，环境配置困难，效果一般，且很少维护

5 chineseocr_lite

超轻量级中文ocr，支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M

项目地址：https://github.com/DayBreak-u/chineseocr_lite

优点：轻量模型，执行速度快，准确率高

缺点：不支持pip安装，不支持补充训练，不支持自定义训练；不支持复杂、不常见字符，比如德语、法语；竖向文本识别错误。

部署：源码下载运行

6 CnOCR

CnOCR 是 Python 3 下的文字识别（Optical Character Recognition，简称OCR）工具包，支持简体中文、繁体中文（部分模型）、英文和数字的常见字符识别，支持竖排文字的识别。自带了20+个训练好的识别模型，适用于不同应用场景，安装后即可直接使用。同时，CnOCR也提供简单的训练命令供使用者训练自己的模型。

项目地址：https://github.com/breezedeus/cnocr

文档：https://cnocr.readthedocs.io/zh-cn/stable/

优点：轻量模型，执行速度快，效果好，支持训练自己的模型

缺点：部分符号识别效果差，部分场景下会出现空格丢失情况

部署：pip

7 RapidOCR

目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。主打ONNXRuntime推理引擎推理，比Paddle推理引擎速度有4~5倍提升，且没有内存泄露问题。

项目地址：https://github.com/RapidAI/RapidOCR

部署：pip

8 Umi-OCR

开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

项目地址：https://github.com/hiroi-sora/Umi-OCR

9 SwiftOCR

项目地址：https://github.com/NMAC427/SwiftOCR

已被弃用，不再维护。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/397966.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MATLAB - 强化学习（Reinforcement Learning）

MATLAB - 强化学习（Reinforcement Learning）

系列文章目录前言一、什么是强化学习？ 强化学习是一种以目标为导向的计算方法，计算机通过与未知的动态环境交互来学习执行任务。这种学习方法能让计算机在没有人工干预和明确编程的情况下，做出一系列决策，使任务的累积奖励最大化…

阅读更多...

cmake 编译教程

cmake 编译教程

参考链接：cmake使用详细教程（日常使用这一篇就足够了）_cmake教程-CSDN博客一、只有一个源文件的程序编译首先在当前目录下创建两个文件 hello.cpp CMakeLists.txt （注意CMakeLists大小写，不要写错了） …

阅读更多...

推荐一个优秀的 .NET MAUI 组件库

推荐一个优秀的 .NET MAUI 组件库

目录前言组件介绍组件展示布局按钮复选框进度条导航栏组件地址最后前言 .NET MAUI 的发布，项目中可以使用这个新的跨平台 UI 框架来轻松搭建的移动和桌面应用。为了帮助大家更快地构建美观且功能丰富的应用，本文将推荐一款优秀…

阅读更多...

AcCode核心思路

AcCode核心思路

文章目录在线OJ项目核心思路1. 项目介绍2.预备知识理解多进程编程为啥采用多进程而不使用多线程?标准输入&标准输出&标准错误 3.项目实现题目API实现相关实体类定义新增/修改题目获取题目列表编译运行编译运行流程 4.统一功能处理在线OJ项目核心思路 1. 项目介绍 …

阅读更多...

$有序转化数组（LeetCode）$

有序转化数组（LeetCode）

题目给你一个已经排好序的整数数组和整数、、。对于数组中的每一个元素 ，计算函数值 ，请按升序返回数组。解题在时间复杂度为解决问题 def sortTransformedArray(nums, a, b, c):def f(x):return a * x * x b * x cn len(nums)result…

阅读更多...

4个从阿里毕业的P7打工人，当起了包子铺的老板

4个从阿里毕业的P7打工人，当起了包子铺的老板

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247483727&idx1&sndb05d8c1115a4539716eddd9fde4e5c9&chksmc0e47813f793f105017fb8551c9b996dc7782987e19efb166ab665f44ca6d900210e6c4c0281&scene21#wechat_redirect 《网安面试指南》h…

阅读更多...

学生公寓电费信息管理小程序的设计

学生公寓电费信息管理小程序的设计

管理员账户功能包括：系统首页，个人中心，公寓管理员管理，学生管理，楼层信息管理，用电情况管理，缴费清单管理，系统管理微信端账号功能包括：系统首页，用电情况…

阅读更多...

【数据结构】六、图：4.图的遍历（深度优先算法DFS、广度优先算法BFS）

【数据结构】六、图：4.图的遍历（深度优先算法DFS、广度优先算法BFS）

三、基本操作文章目录三、基本操作1.图的遍历1.1 深度优先遍历DFS1.1.1 DFS算法1.1.2 DFS算法的性能分析1.1.3 深度优先的生成树和生成森林 1.2 广度优先遍历BFS1.2.1 BFS算法1.2.2 BFS算法性能分析1.2.3 广度优先的生成树和生成森林 1.3 图的遍历与图的连通性 1.图的遍历图…

阅读更多...

Nginx系列-Nginx Location匹配规则

Nginx系列-Nginx Location匹配规则

文章目录 Nginx系列-Nginx Location匹配规则1. 语法基础2. 匹配规则2.1 精确匹配（）2.2. 最长前缀匹配（^~）2.3. 正则表达式匹配（~和~*）2.4. 普通前缀匹配（无修饰符）2.5. 默认匹配&…

阅读更多...

贷齐乐hpp+php特性注入

贷齐乐hpp+php特性注入

文章目录运行过程waf第一层waf拦截第二层waf拦截数据库查询语句注入思路注入运行过程 foreach ($_REQUEST as $key > $value) {$_REQUEST[$key] dowith_sql($value);}$request_uri explode("?", $_SERVER[REQUEST_URI]);if (isset($request_uri[1])) {$rewr…

阅读更多...

OpenGL3.3_C++_Windows(34)

OpenGL3.3_C++_Windows(34)

demo 1 Fresnel-Schlick PBR直接光源顾名思义：直接光源指有光源直接照射到点p 的辐射强度，由于一个光源只会有一个光线wi影响点p，所以和之前的计算没什么差异对于影响p的光源，并不需要积分计算半球形辐照度，遍历每个…

阅读更多...

redis面试（十）锁释放

redis面试（十）锁释放

自动释放首先锁的释放分为两种，一种是自动释放，加入说加锁的线程宕机了不在了，我们之前说过这个。那这个线程中的对redis这个锁不断刷新过期时间的看门狗逻辑就没有了，所以这个锁最多等待30s的时间就会自动过期删除&#xff0c…

阅读更多...

为什么选择在Facebook投放广告？

为什么选择在Facebook投放广告？

2024年了你还没对 Facebook 广告产生兴趣？那你可就亏大了！ 今天这篇文章，我们会分享它对你扩大业务的好处。要知道，Facebook 广告凭借它庞大的用户群和先进的定位选项，已经是企业主们有效接触目标受众的必备神器。接下…

阅读更多...

【uniapp】uniapp+vue2微信小程序实现分享功能

【uniapp】uniapp+vue2微信小程序实现分享功能

uniappvue2做的微信小程序实现分享功能问题描述 uniappvue2做的微信小程序，发布以后点击右上角三个点，分享小程序的时候，转发和分享按钮都是灰色解决方案转发、分享、复制链接这几个功能需要自己来手动写方法，考虑到每个页…

阅读更多...

Unity入门3——脚本入门

Unity入门3——脚本入门

本文使用的代码编辑器为VSCode 安装接口有： 通过将变量设置为public，可以直接在unity的Inspector面板中看到相关变量。此时可直接将需要的素材拖拽到变量处。 [SerializeField]可序列化：定义后可以使非公共的属性也显示在unity面板 [Range]…

阅读更多...

搜维尔科技：【研究】大屏幕沉浸式系统的优势，视觉冲击强、‌分辨率高、‌画面层次感强以及沉浸式交互性体验好等！

搜维尔科技：【研究】大屏幕沉浸式系统的优势，视觉冲击强、‌分辨率高、‌画面层次感强以及沉浸式交互性体验好等！

大屏幕沉浸式系统的优势主要体现在视觉冲击强、‌分辨率高、‌画面层次感强以及沉浸式交互性体验好。‌ 视觉冲击强：‌大屏幕沉浸式系统通过使用多台投影机投射画面，‌结合高质量影片，‌营造出场景环境，‌通过视觉艺术直击体验者…

阅读更多...

js 深入理解原型(prototype)及如何创建对象

js 深入理解原型(prototype)及如何创建对象

目录 1. 概述2. 工厂模式3. 构造函数模式3.1 创建的格式3.2 JS内部执行步骤3.3 constructor 构造器3.4 构造函数也是函数3.5 构造函数的问题 4. 原型模式 prototype4.1 理解原型本质4.2 原型层级(访问一个属性，查询的次序）4.2.1 查询次序：实例…

阅读更多...

SeaTunnel 实战: Apache SeaTunnel 安装与部署

SeaTunnel 实战: Apache SeaTunnel 安装与部署

文章目录一、准备工作1.1 环境1.2 下载二、SeaTunnel安装2.1 解压安装包2.2.配置环境变量2.3.配置立刻生效2.4 下载SeaTunnel相关jar包2.5 测试验证2.6 启动服务三、SeaTunnel Web 1.0.1安装3.1 将下载的压缩包解压缩到指定目录下3.2 设置 SeaTunnel Web 环境变量3.3 初始化…

阅读更多...

pythonUI自动化008：:allure测试报告（安装及应用）

pythonUI自动化008：:allure测试报告（安装及应用）

allure报告预览 1 下载jdk，配置jdk Path变量： https://www.cnblogs.com/FBGG/p/15103119.html（这里不作阐述，请看该偏文章配置即可） 2 下载allure驱动，配置allure Path变量： 下载allure驱动&a…

阅读更多...

【免费】最新区块链钱包和私钥的助记词碰撞器，bybit使用python开发

【免费】最新区块链钱包和私钥的助记词碰撞器，bybit使用python开发

使用要求 1、用的是google里面的扩展打包成crx文件，所以在使用之前你需要确保自己电脑上有google浏览器，而且google浏览器版本需要在124之上。（要注意一下，就是电脑只能有一个Chrome浏览器） 2、在win10上用vscode开发…

阅读更多...

最新文章

推荐文章