tesseract是什么
- tesseract是google开源的OCR;
- tesserocr 是 Python 的一个 OCR 识别库 ,但其实是对 tesseract 做的一 层 Python API
封装,所以它的核心是 tesseract。 因此,在安装 tesserocr 之前,我们需要先安装 tesseract 。
安装步骤
- 安装tesseract
地址:https://digi.bib.uni-mannheim.de/tesseract/
使用版本:tesseract-ocr-w64-setup-v5.0.0.20190623.exe
设置环境变量
验证安装是否成功(tesseract -v)
- 安装wheel库
pip install wheel
3. 安装tesserocr
下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
pip install tesserocr-2.5.2-cp39-cp39-win_amd64.whl
- 安装图像处理库pillow库
pip install pillow
- 安装tesserocr
pip install tesserocr
非代码验证
tesseract.exe number.jpg result -l eng
其中result表示输出结果文件txt名称,eng表示用以识别的语言文件为英文。
在tesseractv5.0.0根目录下面生成一个result.txt 存放识别的结果
python代码验证
使用python语言需要将tesseract默认的语言库放入python安装根目录下
import tesserocr
from PIL import Imageimage = Image.open(f'C:\\Users\\Administrator\\Desktop\\1667979197(1).jpg')
res = tesserocr.image_to_text(image)
print(res)
使用默认的语言库识别,识别率不高。Tesseract提供了一套训练样本的方法,用以生成自己所需的识别语言库