Capture2Text 便携式 OCR 工具
Capture2Text 能够使用键盘快捷键快速对屏幕的一部分进行 OCR。 默认情况下,生成的文本将保存到剪贴板。支持中文、英文、法文、德文、日文、韩文、俄文、西班牙文等 90 多种语言。 Capture2Text 是便携式工具,不需要安装。
Tesseract.js 识别图片语言的 JS 库
Tesseract.js 是一个几乎能识别出图片中所有语言文本的 JS 库。
Tesseract OCR 图像识别类库
Tesseract 是一款由 HP 实验室开发,后续由 Google 维护的开源 OCR 引擎,特点是开源、免费、支持多语言、多平台。
chineseocr_lite 轻量级中文 OCR
chineseocr_lite 是一个轻量级中文 OCR 项目,提供将图片上的中文转成字符串的功能。支持竖排文字,识别支持 ncnn、mnn、tnn 推理 (dbnet (1.8M) + crnn (2.5M) + anglenet (378KB)),总模型仅 4.7M。
Textinator macOS OCR 工具
Textinator 是一款简单的 macOS 状态栏 / 菜单栏应用程序,用于对屏幕截图执行自动文本检测。
MathOCR 数学公式识别系统
MathOCR 是用 Java 语言编写的一个印刷体数学公式识别系统,可以识别图片中数学公式并转换为相应的 LaTeX 代码。
树洞 OCR 文字识别 跨平台的 OCR 小工具
树洞 OCR 文字识别是一款跨平台的 OCR 小工具。xxx-with-jre.xx 是完整版,带运行环境;如果精简版不能正常工作,请下载完整版使用; 文字识别使用了各云平台开发的识别接口,因此需要联网才能正常使用;
MMOCR 基于 PyTorch 的文本检测工具
MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。 该工具箱不仅支持文本检测和文本识别,还支持其下游任务,例如关键信息提取。
PaddleOCR 基于飞桨的 OCR 工具库
PaddleOCR 是基于飞桨的 OCR 工具库,包含总模型仅 8.6M 的超轻量级中文 OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
Umi-OCR 离线文字识别工具
Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台。Umi-OCR可批量导入处理图片,结果保存到本地 txt /md/jsonl 多种格式文件。同时也可以即时截屏识别。
C-OCR 携程 OCR 项目
C-OCR 是携程自研的 OCR 项目,主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。 项目包含 4 个部分,拒识、检测、识别、后处理。
MindOCR OCR 开发及应用工具箱
MindOCR 是一个基于 MindSpore 框架的 OCR 开发及应用的开源工具箱,可以帮助用户训练、应用业界最有优的文本检测、文本识别模型,例如 DBNet/DBNet++ 和 CRNN/SVTR,以实现图像文本理解的需求。
dpScreenOCR 轻量级 OCR 工具
dpScreenOCR 是一个自由的开源程序,用于识别屏幕上的文本。由 Tesseract 提供支持,它支持 100 多种语言,并且可以拆分独立的文本块,例如列。
RapidOCR 跨平台 OCR 库
RapidOCR 是一款基于 PaddleOCR & OnnxRuntime & OpenVINO 的跨平台 OCR 库。完全开源免费并支持离线快速部署,支持多平台, 默认是中英文,其他语言识别需要自助转换。