指定PDF或图片多个识别区域，识别区域文字，并导出到Excel文件中

指定PDF或图片多个识别区域，识别区域文字，并导出到Excel文件中

news/2024/11/24 1:13:59/文章来源:https://blog.csdn.net/sun222555888/article/details/142645882

常见场景

用户有大量图片/PDF文件，期望能将图片/PDF中的多个区域中的文字批量识别出来，并导入到Excel文件中。期望工具可以批量处理、离线识别（保证数据安全性）。手工操作麻烦。具体场景：用户有工程现场照片，订单，简历等PDF或图片文件，期望按照PDF或图片中关键的文字导出到Excel中，后期对文件进行快速检索，不用每个文件打开看。
在这里插入图片描述

相关技术

QT库、离线OCR识别算法、Python的Excel库。
基本处理思路：
1、批量加载PDF或图片文件
2、指定对应的识别范围
3、根据识别范围裁剪对应图片
4、裁剪后的图片批零OCR识别
5、将识别结果导出到Excel文件中

工具处理

第一步：下载软件

PDF或图片基于文字内容批量改名工具
百度网盘：https://pan.baidu.com/s/104inoJ7RsmbF-P07E882cA?pwd=qpch
腾讯微盘：https://share.weiyun.com/pq0GbDGI

第二步：打开软件

下载软件后，解压缩文件夹到本地，双击JDX图片识别.exe，启动主程序。

第三步：选择要改名的PDF或图片文件

选择待改名的图片或者PDF，可以按照文件夹选择，也可以按部分文件选择。
可分别导入图片文件、或者PDF文件（支持按指定范围页导入）。
在这里插入图片描述

第四步：设置要识别区域（可设置多个）

在识别范围窗体里，添加需要识别的范围（按住鼠标拉框绘制识别区域），通过同步范围设置把当前图片的识别区域同步到其他图片上。
在这里插入图片描述

第五步：对自定义范围进行批量识别文字

执行批量识别文字，识别结果淡绿色，右侧识别结果文字，可以校核与编辑。离线识别。
在这里插入图片描述

第六步：导出结果-导出Excel

选择导出的路径以及导出方式，可以导出Excel，也可以导出Word。导出内容包含：图片名称、指定的多个识别区域（名字），识别文字。
在这里插入图片描述

至此，通过以上步骤就能对PDF或图片按照多个识别区域文字，批量导出Excel。
• 本地离线识别、安全稳定（拔掉网线也能识别运行）
• 批量提取图片文字：提取指定区域文字，导出Excel
• 批量提取PDF文字：提取指定区域文字，导出Excel
• PDF文件支持：可复制版的PDF、扫描版的PDF都支持

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/435566.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【学习笔记】基于 Wasserstein距离的分布鲁棒优化

【学习笔记】基于 Wasserstein距离的分布鲁棒优化

衡量不同分布间距离在构建模糊集的方式上，除了利用矩信息之外，另一种思路是衡量真实分布与经验分布之间的距离。在这种情况下，我们以经验分布为中心，将与经验分布不超过某一距离的所有分布纳入模糊集中。于是，如何定…

阅读更多...

onlyoffice连接器(connector)开发使用精讲二次开发深入开发【二】

onlyoffice连接器(connector)开发使用精讲二次开发深入开发【二】

前言这篇教程开始，全部为进阶版使用，你需要先熟悉使用最基础的连接器教程，如果你没有正常接入，请参考教程【一】：onlyoffice连接器(connector)开发使用精讲二次开发深入开发【一】_onlyoffice 连接器-CSDN博客该教…

阅读更多...

Jira Cloud涨价5%-20%，钉钉项目Teambition成优选替代

Jira Cloud涨价5%-20%，钉钉项目Teambition成优选替代

近日，Jira再次宣布涨价，Cloud版涨幅达到5%-20%，这一消息来源于Atlassian官方面向合作伙伴发布的2024年最新涨价通知。 Atlassian旗下核心产品，包括Jira、Confluence、JiraServiceManagement等的Cloud版本价格将有所提高&#xff…

阅读更多...

一站式大语言模型API调用：快速上手教程

一站式大语言模型API调用：快速上手教程

智匠MindCraft是一个强大的AI工具及开发平台，支持多种大语言模型和多模态AI模型。本文将详细介绍如何通过API调用智匠MindCraft中的大语言模型，帮助开发者快速上手。注册与登录访问智匠MindCraft官网，注册并登录账号。进入开发者平台&…

阅读更多...

如何做好接口测试？||关于京东平台商品API接口测试

如何做好接口测试？||关于京东平台商品API接口测试

探讨主题：如何做好接口测试？ 一、接口测试简介 1、什么是接口测试？ 接口测试是测试系统组件间接口的一种测试。接口测试主要用于检测外部系统与系统之间以及内部各个子系统之间的交互点。测试的重点是要检查数据的交换，传递和控制…

阅读更多...

损失函数篇 | YOLOv10 更换损失函数之 SIoU / EIoU / WIoU / Focal_xIoU 最全汇总版

损失函数篇 | YOLOv10 更换损失函数之 SIoU / EIoU / WIoU / Focal_xIoU 最全汇总版

文章目录更换方式CIoUDIoUEIoUGIoUSIoUWIoUFocal_CIoUFocal_DIoUFocal_EIoUFocal_GIoUFocal_SIoU提示更换方式第一步：将ultralytics/ultralytics/utils/metrics.py文件中的bbox_iou替换为如下的代码：class WIoU_Scale: if monotonous = None , v1if monotonous = True , v…

阅读更多...

领夹麦克风性价比最高？一文看懂领夹麦克风什么牌子的好

领夹麦克风性价比最高？一文看懂领夹麦克风什么牌子的好

近几年随着网络直播、短视频等新兴行业的发展，筑就了一个全民视频创作的时代。而领夹麦克风也是凭借轻便、便携的特性，获得了广大短视频创作者的青睐，领夹麦克风的需求量也是不断增加。也正是因为如此，如今市面上的领夹麦克风品牌…

阅读更多...

【小程序】微信小程序课程 -4 项目实战

【小程序】微信小程序课程 -4 项目实战

目录 1、效果图 2、创建项目 2.1 创建小程序端 2.1.1 先创建纯净项目 2.1.2 删除components 2.1.4 删除app.json红色部分 2.1.5 删除index.json红色部分 2.1.6 删除index.wxss全部内容 2.1.7 删除index.wxml全部内容 2.1.8 app.json创建4个页面 2.1.9 app.json添加…

阅读更多...

算法闭关修炼百题计划（一）

算法闭关修炼百题计划（一）

多看优秀的代码一定没有错，此篇博客属于个人学习记录 1.两数之和2.前k个高频元素3.只出现一次的数字4.数组的度5.最佳观光组合6.整数反转7.缺失的第一个正数8.字符串中最多数目的子序列9.k个一组翻转链表10.反转链表II11. 公司命名12.合并区间13.快速排序14.数字中的…

阅读更多...

项目学习笔记

Downloads – Oracle VirtualBoxhttps://www.virtualbox.org/wiki/Downloads

阅读更多...

Nginx基础详解2（首页解析过程、进程模型、处理Web请求机制、nginx.conf语法结构）

Nginx基础详解2（首页解析过程、进程模型、处理Web请求机制、nginx.conf语法结构）

续：Nginx基础详解1（单体部署与集群部署、负载均衡、正反代理、nginx安装）-CSDN博客目录 4.Nginx默认首页的过程解析 5.Nginx进程模型的详解 5.1启动nginx后的关于nginx的进程查看 5.2master进程与process进程 5.3Nginx进程图解 5.4wo…

阅读更多...

STM32 OLED

STM32 OLED

文章目录前言一、OLED是什么？二、使用步骤1.复制 OLED.C .H文件1.1 遇到问题 2.统一风格3.主函数引用头文件3.1 oled.h 提供了什么函数 4.介绍显示一个字符的函数5. 显示十进制函数的讲解三、使用注意事项3.1 配置符合自己的引脚3.2 花屏总结前言提示&#xff…

阅读更多...

CSS宽度和高度

CSS宽度和高度

CSS 尺寸属性指的就是元素的宽度和高度属性，虽然说非常简单，但却是必须掌握的技能。CSS 中提供了 width、height、max-width、min- width、max-height 和 min-height 等几个属性来设置元素的宽度和高度，这些元素使用起来非常简单，…

阅读更多...

02Cesium中常用的鼠标事件

02Cesium中常用的鼠标事件

文章目录 02Cesium中常用的鼠标事件1、左键单击事件2、左键双击事件3、左键按下事件4、左键弹起事件5、中键按下事件6、中键弹起事件7、鼠标移动事件8、右键单击事件9、右键按下事件10、右键弹起事件11、鼠标滚轮事件具体在代码中的应用如下所示 02Cesium中常用的鼠标事件 Ces…

阅读更多...

yolov8/9/10模型在垃圾分类检测中的应用【代码+数据集+python环境+GUI系统】

yolov8/9/10模型在垃圾分类检测中的应用【代码+数据集+python环境+GUI系统】

yolov8/9/10模型在垃圾分类检测中的应用【代码数据集python环境GUI系统】 yolov8/9/10模型在垃圾分类检测中的应用【代码数据集python环境GUI系统】背景意义随着计算机视觉技术和深度学习算法的快速发展，图像识别、对象检测、图像分割等技术在各个领域得到了广泛…

阅读更多...

本省第一所！新大学，揭牌！

本省第一所！新大学，揭牌！

9月26日，海南艺术职业学院举行揭牌仪式，标志着海南省第一所公办艺术类高等职业院校正式揭牌成立。海南省旅文厅党组成员、副厅长刘成出席揭牌仪式，省教育厅党组成员、副厅长邢孔政在揭牌仪式上宣读省人民政府同意设立海南艺术职业学院的批复。…

阅读更多...

Hive数仓操作（五）

Hive数仓操作（五）

一、Hive 信息查看 Hive的元数据管理： Hive 将表的元数据（如表名、列名、类型等）存储在关系型数据库中，通常是 MySQL。元数据的主要表包括： TBLS：存储表的信息（表名、类型、ID 等）。…

阅读更多...

性能调优知识点（mysql）三

性能调优知识点（mysql）三

SQL底层执行原理 MySQL的内部组件结构：大体来说，MySQL 可以分为 Server 层和存储引擎层store两部分 Server层:主要包括连接器、查询缓存、分析器、优化器、执行器等，涵盖 MySQL 的大多数核心服务功能，以及所有的内置函数&#xf…

阅读更多...

【STM32开发环境搭建】-3-STM32CubeMX Project Manager配置-自动生成一个Keil(MDK-ARM) 5的工程

【STM32开发环境搭建】-3-STM32CubeMX Project Manager配置-自动生成一个Keil(MDK-ARM) 5的工程

目录 1 KEIL(MDK-ARM) 5 Project工程设置 2 MCU和嵌入式软件包的选择 3 Code Generator 3.1 STM32Cube Firmware Library Package 3.2 Generated files 3.3 HAL Settings 3.4 Template Settings 4 Advanced Settings 5 自动生成的KEIL(MDK-ARM) 5 Project工程目录结…

阅读更多...

springboot+养老院管理系统—计算机毕业设计源码36270

springboot+养老院管理系统—计算机毕业设计源码36270

摘要随着我国老年人口数量的逐年增加，人口抚养比也在迅速攀升，越来越多的老年人将走出家门进入养老院安度自己的晚年。同时国家和地方也相继出台了加快发展老龄事业的政策方针，作为机构养老主要组成部分的养老院将迅猛发展。在养老院规模扩…

阅读更多...

最新文章

推荐文章