Tesseract Python 图片文字识别入门

Tesseract Python 图片文字识别入门

news/2024/12/24 20:24:20/文章来源:https://blog.csdn.net/TOOZOOY/article/details/140072153

1、安装tesseract

Index of /tesseract

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.3.0.20221214.exe

2、安装中文语言包

https://digi.bib.uni-mannheim.de/tesseract/tessdata_fast/

拷贝到C:\Program Files\Tesseract-OCR\tessdata

3、注意环境变量是否设置好

TESSDATA_PREFIX=C:\Program Files\Tesseract-OCR\tessdata

4、python 测试识别

pip install pytesseract

import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# 列出支持的语言
print(pytesseract.get_languages(config=''))
# 打开图像文件
image = Image.open("F:/projects/pythons/c.jpg")
# 使用Tesseract进行OCR
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/364303.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

昇思25天学习打卡营第3天|数据集全攻略：加载、操作与自定义

昇思25天学习打卡营第3天|数据集全攻略：加载、操作与自定义

导入数据集相关库和类首先，导入了 NumPy 库，并将其简称为 np 。要知道，NumPy 乃是用于科学计算的关键库，作用非凡。接着，从 mindspore.dataset 当中导入了 vision 模块。此外，还从 mindspore.dataset 里引…

阅读更多...

前后端分离的后台管理系统开发模板（带你从零开发一套自己的若依框架）上

前后端分离的后台管理系统开发模板（带你从零开发一套自己的若依框架）上

前言： 目前，前后端分离开发已经成为当前web开发的主流。目前最流行的技术选型是前端vue3后端的spring boot3，本次。就基于这两个市面上主流的框架来开发出一套基本的后台管理系统的模板，以便于我们今后的开发。前端使用vue3ele…

阅读更多...

Web前端

Web前端

网页开发学习内容:html css JavaScript 两个框架:VUE.js ElementUI UI->user interface 用户界面 html(HyperText Markup Language):超文本标记语言文本:文字字符超文本:网页内容标记:标签标识例如商品上的标签,介绍了商品的信息 html语言就是一种标记语言,提供…

阅读更多...

AWS云中的VPC启用流日志保存S3（AWS中国云）

AWS云中的VPC启用流日志保存S3（AWS中国云）

问题需要在AWS中国云中对VPC启用流日志操作。步骤创建s3桶这里设置一个s3桶名，创建即可。如果出现已存在具有相同名称的存储桶错误，就换个桶名再试一试吧。启用vpc流日志找到vpc流日志入口操作，如下图： 设置vpc流日志…

阅读更多...

eBPF技术揭秘：DeepFlow如何引领故障排查，提升运维效率

eBPF技术揭秘：DeepFlow如何引领故障排查，提升运维效率

DeepFlow 实战：eBPF 技术如何提升故障排查效率目录 DeepFlow 实战：eBPF 技术如何提升故障排查效率微服务架构系统中各个服务、组件及其相互关系的全景零侵扰分布式追踪（Distributed Tracing）的架构和工作流程关于零侵扰持…

阅读更多...

任务5.1 初识Spark Streaming

任务5.1 初识Spark Streaming

实战概述：使用Spark Streaming进行词频统计 1. 项目背景与目标背景: Spark Streaming是Apache Spark的流处理框架，用于构建可伸缩、高吞吐量的实时数据处理应用。目标: 实现一个实时词频统计系统，能够处理流式数据并统计文本中的单词出现频…

阅读更多...

微机原理复习

微机原理复习

第一章导论 1.3 冯诺依曼体系结构 （1）以二进制形式表示指令和数据 （2）程序和数据事先放在存储器中（预存储） （3）由运算器、控制器、输入设备和输出设备五大部件组成字长、主频…

阅读更多...

Java8新特性stream的原理和使用

Java8新特性stream的原理和使用

这是一种流式惰性计算，整体过程是： stream的使用也异常方便，可以对比如List、Set之类的对象进行流式计算，挑出最终想要的结果： List<Timestamp> laterTimes allRecords.stream().map(Record::getTime).filter…

阅读更多...

【摄像头标定】双目摄像头标定及矫正-opencv（python）

【摄像头标定】双目摄像头标定及矫正-opencv（python）

双目摄像头标定及矫正棋盘格标定板标定矫正棋盘格标定板本文使用棋盘格标定板，可以到这篇博客中下载：https://blog.csdn.net/qq_39330520/article/details/107864568 标定要进行标定首先需要双目拍的棋盘格图片，20张左右，…

阅读更多...

30 哈希的应用

30 哈希的应用

位图概念题目给40亿个不重复的无符号整数，没排过序。给一个无符号整数，如何判断一个数是否在这40亿个整数中 1.遍历，时间复杂度O(N) 2.二分查找，需要先排序，排序(N*logN)，二分查找，logN。…

阅读更多...

装载问题（回溯法）

装载问题（回溯法）

#include<iostream> using namespace std; int n;//货物的数量 int c;//轮船的总的载重量 int cw;//轮船当前的载重量 int r;//货物的总重量 int w[1000];//n个货物各自的重量 int x[1000];//当前最优解 int bestx[1000];//最优解 int bestw;//货物的最优载重量 void Bac…

阅读更多...

[JS]对象

[JS]对象

介绍对象是一种无序的数据集合, 可以详细的描述某个事物事物的特征在对象中用属性来表示, 事物的行为在对象中用方法来表示使用创建对象 let 对象名 {属性名：值，方法名：函数， } let 对象名 new Object(); 对象名.属性…

阅读更多...

Typora failed to export as pdf. undefined

Typora failed to export as pdf. undefined

变换版本并没有用，调整图片大小没有用我看到一个博客后尝试出方案我的方法解决：从上图中的A4，变为其他，然后变回A4 然后到处成功，Amazing！ 参考： Typora 导出PDF 报错 failed to export…

阅读更多...

Rpc服务的提供方（Rpcprovider）的调用流程

Rpc服务的提供方（Rpcprovider）的调用流程

首先，服务的提供方，会通过rpcprovider向rpc服务方注册rpc服务对象和服务方法， 那么，我们通过protobuf提供的抽象层的service和method，将服务对象和它所对应的服务方法记录在map表中， 当它启动以后&#xff…

阅读更多...

WordPress Quiz Maker插件 SQL注入漏洞复现(CVE-2024-6028)

WordPress Quiz Maker插件 SQL注入漏洞复现(CVE-2024-6028)

0x01 产品简介 WordPress Quiz Maker插件是一款功能强大的测验生成工具，旨在帮助用户轻松、快速地构建复杂的测验和考试。插件支持多种问题类型，包括单选框（MCQ）、复选框（MCQ）、下拉列表（MCQ）、文本、短文本、数字、日期等。还支持横幅（HTML）显示信息性消息、填空题…

阅读更多...

LONGAGENT：优化大模型处理长文本

LONGAGENT：优化大模型处理长文本

现有的大模型（LLMs），尽管在语言理解和复杂推理任务上取得了显著进展，但在处理这些超长文本时却常常力不从心。它们在面对超过10万令牌的文本输入时，常常会出现性能严重下降的问题，这被称为“中间丢失”现象…

阅读更多...

Docker基本使用和认识

Docker基本使用和认识

目录基本使用镜像仓库镜像操作 Docker 如何实现镜像 1) namespace 2) cgroup 3) LXC Docker常见的网络类型 bridge网络如何实现基本使用镜像仓库镜像仓库登录 1)docker login 后面不指定IP地址，则默认登录到 docker hub 上退出 2)docker logo…

阅读更多...

互联网直播/点播技术与平台创新应用：视频推拉流EasyDSS案例分析

互联网直播/点播技术与平台创新应用：视频推拉流EasyDSS案例分析

随着互联网技术的快速发展，直播/点播平台已成为信息传播和娱乐的重要载体。特别是在电视购物领域，互联网直播/点播平台与技术的应用，不仅为用户带来了全新的购物体验，也为商家提供了更广阔的营销渠道。传统媒体再一次切实感受到了…

阅读更多...

嵌入式Linux系统编程 — 4.7 regcomp、regexec、regfree正则表达式函数

嵌入式Linux系统编程 — 4.7 regcomp、regexec、regfree正则表达式函数

目录 1 为什么需要正则表达式 2 正则表达式简介 3 正则表达式规则 4 regcomp、regexec、regfree函数 4.1 函数介绍 4.2 URL格式案例 1 为什么需要正则表达式在许多的应用程序当中， 有这样的应用场景： 给定一个字符串，检查该字符串是否…

阅读更多...

【小学期】常用基于Swing的七个静态界面

【小学期】常用基于Swing的七个静态界面

示例1：基本的带按钮和标签的界面 import javax.swing.*; import java.awt.*;public class SimpleSwingApp1 {public static void main(String[] args) {JFrame frame new JFrame("Simple Swing App 1");frame.setDefaultCloseOperation(JFrame.EXIT_ON_C…

阅读更多...

最新文章

推荐文章