整合Tess4J实现OCR图片识别技术

文章目录

- - 1. 什么是OCR
  - 2. 什么是Tess4J库?
  - 3. 引入依赖
  - 4. 下载默认的训练数据
  - 5. 配置训练数据的目录路径
  - 6. 测试代码
  - - 6.1 TesseractOcrConfig
    - 6.2 OcrController
    - 6.3 OcrService
    - 6.4 OcrServiceImpl
  - 7. 功能测试
  - - 7.1 调试请求接口
    - 7.2 测试结果

1. 什么是OCR

**OCR （Optical Character Recognition，光学字符识别）指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程. **

2. 什么是Tess4J库?

**Tess4J是一个开源的Java库，它为Tesseract OCR（光学字符识别）引擎提供了一个简单的Java API。Tesseract是一个强大的开源OCR引擎，可以将图像中的文本转换为可编辑的文本。Tess4J使得在Java应用程序中使用Tesseract OCR变得更加容易。 **

主要功能和特点

文本提取：能够从图像中提取文本，包括印刷文本和手写文本。
多语言支持：支持多种语言的OCR，包括但不限于英语、中文、日语、韩语等。
简单的API：提供了易于使用的Java API，使开发者可以轻松地将OCR功能集成到他们的Java应用程序中。
扩展性：支持自定义词典和训练数据，以提高特定应用场景下的OCR准确性。
图像处理：支持基本的图像处理功能，如图像预处理，以提高OCR的准确性。

3. 引入依赖

<!-- tess4j -->
<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version>
</dependency>

4. 下载默认的训练数据

训练数据下载地址

5. 配置训练数据的目录路径

# 训练数据文件夹的路径
tess4j:datapath: E:\Software\trainData # 注意改成自己的文件路径

6. 测试代码

6.1 TesseractOcrConfig

/*** @author Ccoo* 2024/7/19*/
@Configuration
public class TesseractOcrConfig {@Value("${tess4j.datapath}")private String dataPath;@Beanpublic Tesseract tesseract() {Tesseract tesseract = new Tesseract();// 设置训练数据文件夹路径tesseract.setDatapath(dataPath);// 设置为中文简体tesseract.setLanguage("chi_sim");return tesseract;}
}

6.2 OcrController

/*** @author Ccoo* 2024/7/19*/
@RequestMapping("/ocr")
@RestController
@AllArgsConstructor
public class OcrController {private final OcrService ocrService;@PostMapping(value = "/recognize", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {// 调用OcrService中的方法进行文字识别return ocrService.recognizeText(file);}}

6.3 OcrService

public interface OcrService {String recognizeText(MultipartFile file) throws IOException, TesseractException;}

6.4 OcrServiceImpl

/*** @author Ccoo* 2024/7/19*/
@Service
@AllArgsConstructor
public class OcrServiceImpl implements OcrService {private final Tesseract tesseract;/*** 识别图片中的文字* @param imageFile 图片文件* @return 文字信息*/public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException {// 转换InputStream sbs = new ByteArrayInputStream(imageFile.getBytes());BufferedImage bufferedImage = ImageIO.read(sbs);// 对图片进行文字识别return tesseract.doOCR(bufferedImage);}
}