文字识别核酸检测结果并导出Excel

python下文字识别核酸检测报告信息并生成Excel数据表

前言:疫情下,隔几天就需要做一次核酸检测,核酸检测截图的收取工作称为部门工作的难点,参考最近热搜话题复旦大学辅导员用python搞定核酸检测核查难的问题,也自己动手打了几行代码,实现最基本的核酸检测结果审核问题。

文字识别代码:为了方便使用,我采取的方法是直接调用百度云中的文字识别的API接口,具体的代码参考了:https://blog.csdn.net/zhembrace/article/details/79779140这位大佬的代码,将识别到的图片中的数据写入txt文件,再通过python将txt文件转换成对应的Excel表格,即可完成核酸信息的基本统计

一、准备阶段

1.注册百度智能云账号

在这里插入图片描述

2.完成认证

在这里插入图片描述

3.点击搜索文字识别

在这里插入图片描述

4.点击领取免费资源

在这里插入图片描述

5.领取资源
在这里插入图片描述

6.点击创建应用

在这里插入图片描述

7.创建完成后查看这三个号码,待会会用到!

在这里插入图片描述

8.将准备好的核酸截图存入文件夹,并将文件夹命名为data

在这里插入图片描述
我们学校的核酸检测报告采用的是江苏省疾控预防控制中心的“新冠病毒核酸检测信息系统”
核酸检测结果如下,转换成的Excel文件也是根据图上内容为例
在这里插入图片描述

二、完成小项目

1.文字识别(可直接搬运上面大哥的源码)

# -*- coding: UTF-8 -*-import os
from aip import AipOcr
import jsonfrom time import *
begin_time = time()
# 输入自己的号码
APP_ID = '25926xxxx'
API_KEY = '4DRC53mkoBb4uwCQGw3vxxxxx'
SECRET_KEY = 'bbiN220ZM7KIgSaHTsQ4fndymfVxxxxx'
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)# 指定文件夹(更改成自己的数据文件夹)
os.chdir("/Users/chen/PycharmProjects/hesuanocr/data")
dirs = os.listdir()def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()options = {'detect_direction': 'true','language_type': 'CHN_ENG',
}print('开始处理,共' + str(len(dirs)) + "张图片。")
cnt = 0
for filePath in dirs:if filePath.split('.')[-1] == 'txt': continuecnt += 1print('正在处理第' + str(cnt) + '张图片')result = aipOcr.basicGeneral(get_file_content(filePath), options)with open(filePath.split('.')[0] + '.txt', 'w', encoding='utf-8') as ans:for i in result['words_result']:ans.write(i['words'] + '\n')print('处理完成')
print('全部处理完成!')
endtime = time()
print(endtime-begin_time)

2.识别出来的效果如图所示

在这里插入图片描述
请添加图片描述

3.将生成的多个txt文件转换成Excel文档,采用pandas将csv格式转换成Excel格式

#!/user/bin/env python
#coding=utf-8
"""
@author : wangchen
@email  : 3222738263@qq.com
@file   : change.py
@time   : 2022/4/8
@Desc   :
"""
import pandas as pd
import osdef name():'''获取当前目录下的CSV文件名'''file_name = []  # 创建一个空列表,存储当前目录下的CSV文件全称a = os.listdir('data/')for j in a:if os.path.splitext(j)[1] == '.txt':  # 判断是否为txt文件,如果是则存储到列表中file_name.append(j[:-4])return file_nameif __name__ == "__main__":# 获取csv文件名name_ = name()# 创建数据框df = pd.DataFrame()# 读取txt文件并汇总for i in name_:data = pd.read_csv('data/'+i+'.txt')df = pd.concat([data.T, df])df['姓名'] = df.indexname_excel = ['报告是否完成', '检测单位', '检测日期', '样本类型', '查看详情', '姓名']df.columns = name_excelname_excel1 = ['姓名', '报告是否完成', '检测单位', '检测日期', '样本类型', '查看详情']df = df[name_excel1]df.iloc[:,2] = df.iloc[:,2].apply(lambda x: x[5:])df.iloc[:,3] = df.iloc[:,3].apply(lambda x: x[5:])df.iloc[:,4] = df.iloc[:,4].apply(lambda x: x[5:])print(df)df.to_excel('result.xlsx', index=None)

4.运行效果如下

在这里插入图片描述
在这里插入图片描述

三、总结

方法虽不难,但是还有很多需要优化的地方,也请各位大神批评指正!其中转换成excel的过程中必须使识别出来的数据格式严格符合txt文档中的格式要求,这一点容易在数据多的时候出问题,毕竟识别的准确度也一般!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20554.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新库上线 | CnOpenData中国核酸检测机构及采样点数据

中国核酸检测机构及采样点数据 一、数据简介 2020年1月21日,国家卫健委发布1号公告,将新型冠状病毒感染的肺炎纳入《中华人民共和国传染病防治法》规定的乙类传染病,并采取甲类传染病的预防、控制措施。目前,新型冠状病毒肺炎防控…

电脑蓝牙与蓝牙适配器使用

这篇文章一开始写的很水,但最近重装电脑还是遇到了这个问题。下面更新一下,解决搜不到的问题。 ------------------------------------------------------------------------------------------------------ 1.确保你的手机能够蓝牙连接到耳机&#xf…

chatgpt赋能python:Python设置画布背景图——让你的图像更具美感

Python设置画布背景图——让你的图像更具美感 Python是一门流行的编程语言,被广泛使用于数据分析、科学计算和图像处理等多个领域。在图像处理方面,Python使用matplotlib作为主要的作图工具,matplotlib带来了许多方便易用的工具,…

为什么ChatGPT用强化学习而非监督学习?

为什么ChatGPT非得用强化学习,而不直接用监督学习?原因不是那么显而易见。在上周发布的《John Schulman:通往TruthGPT之路》一文中,OpenAI联合创始人、ChatGPT主要负责人John Schulman分享了OpenAI在人类反馈的强化学习&#xff0…

适配PyTorch FX,OneFlow让量化感知训练更简单

作者 | 刘耀辉 审稿 | BBuf、许啸宇 1 背景 近年来,量化感知训练是一个较为热点的问题,可以大大优化量化后训练造成精度损失的问题,使得训练过程更加高效。 Torch.fx在这一问题上走在了前列,使用纯Python语言实现了对于Torch.nn.M…

mongodb charts对mongodb数据进行分析和展示

mongodb charts 安装教程 安装环境什么是mongodb charts下载mongodb charts等准备工作配置mongodb charts创建用户启动和停止MongoDB图表故障排除web展示 安装环境 系统环境:ubuntu 16.04 docker 版本:Docker version 18.09.0 mongo 版本:Mo…

小白量化彩票实战(4)彩票特征号码重号、邻号、连号和表格展示

小白量化彩票实战(4)彩票特征号码重号、邻号、连号和表格展示 我写彩票的博客,不是鼓励大家去买彩票,读者要以学习编程和娱乐的思想来看待。兴趣是学习最大的动力! 彩票的号码特征很多,我们本篇介绍几个简单的号码特征…

一个小把戏算法,获取大乐透,并且计算出最佳的结果(Qt C++ 和Android共用)

无聊的国庆,总得做点什么好玩的是不是,那就写代码获取大乐透,让后按照自己的算法推测下一期的结果吧。 话不多说,上代码 Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);initDat…

算力军备竞赛白热化 “卖铲人”联想集团竞争力如何?

继微软通过OpenAI推出GPT系列、谷歌推出Bard和PaLM-E2之后,国内AI大模型也呈百家争鸣态势,年初至今,国内科技巨头几乎都发布了自研AI大模型产品,AI竞赛全面升级的背后,是全球科技巨头们对算力的争夺,作为算…

chatgpt赋能python:Python制图中如何添加文字

Python 制图中如何添加文字 介绍 制图通常不仅需要展示数据,还需要向读者传递信息。而添加文字是一种直接有效的方式,可以帮助读者更好地理解图表。 Python 图形库众多,如 Matplotlib、Seaborn、Plotly 等,它们都提供了向图表中…

【送书福利-第八期】《硅基物语.AI大爆炸: ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来》

大家好,我是洲洲,欢迎关注,一个爱听周杰伦的程序员。关注公众号【程序员洲洲】即可获得10G学习资料、面试笔记、大厂独家学习体系路线等…还可以加入技术交流群欢迎大家在CSDN后台私信我! 本文目录 一、前言二、内容介绍三、作者介…

算法工程师体验了一下chatGPT,已经上瘾了!

chatGPT持续刷屏,作为能写代码,能修bug的超级工具,CV君必须体验一把! 首先来一个基本操作,让chatGPT写一段Python程序,使用YOLOv5对图像中的目标进行检测,找出有狗没有猫的图片: 对YOLOv5这种公…

还有人不懂 ChatGPT,不焦虑吗?(文末赠书)

,不 如果有一本书 可以让人理解“AI大爆炸”新纪元 那就是《碳基物语》 半年以来,ChatGPT点燃文明新火把 对AIGC和AGI的讨论也甚嚣尘上‍‍‍‍ AI会取代人类吗? 人工智能会拥有智慧吗? ChatGPT到底该怎么玩? 我该如何…

一想到还有95%的人不懂ChatGPT,我就焦虑了

如果有一本书 可以让人理解“AI大爆炸”新纪元 那就是《碳基物语》 半年以来,ChatGPT点燃文明新火把 对AIGC和AGI的讨论也甚嚣尘上‍‍‍‍ AI会取代人类吗? 人工智能会拥有智慧吗? ChatGPT到底该怎么玩? 我该如何利用AIGC提升生产…

5月书讯 | 《这就是ChatGPT》来了!

叮~又到了书讯时间,本月好书众多,姗姗来迟。 在这个数字化的时代,我们仍然相信纸质书的魅力,可以让人沉静下来,回归到阅读的本质。五月盛夏伊始,炎炎夏日,我们精心挑选了 10 本好书,…

通过AI的自白,开启ChatGPT学习之旅!

如果有一本书 可以让人理解“AI大爆炸”新纪元 那就是《碳基物语》 半年以来,ChatGPT点燃文明新火把 对AIGC和AGI的讨论也甚嚣尘上‍‍‍‍ AI会取代人类吗? 人工智能会拥有智慧吗? ChatGPT到底该怎么玩? 我该如何利用AIGC提升生产…

Anaconda安装的python环境中“No module named pip” 和 “ ‘pip‘ is a package and cannot be directly executed”问题

一. 没有pip3问题 找到安装anaconda的文件夹,点击Scripts(利用anaconda安装的python虚拟环境都在这里),确定是否存在一个easy_install.exe的程序,如果有请往下看,如果没有进入直接进入第4步。 打开 Anaconda Prompt 或 cmd &…

chatgpt赋能python:Python.head()方法:介绍和使用

Python .head()方法:介绍和使用 在Python编程中,我们经常需要处理大型数据集。为了更好地理解和使用这些数据,我们需要查看开头部分的数据。在这种情况下,.head()方法是非常有用的。 什么是.head()方法? .head()方法…

用ChatGPT解析Wireshark抓取的数据包样例

用Wireshark抓取的数据包,常用于网络故障排查、分析和应用程序通信协议开发。其抓取的分组数据结果为底层数据,看起来比较困难,现在通过chatGPT大模型,可以将原始抓包信息数据提交给AI进行解析,本文即是进行尝试的样例…

如何利用ChatGPT实现推荐模型的能力?

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年3月份热门报告合集 无需翻墙,ChatGPT直接使用 万字干货:ChatGPT的工作原理 2023年创业(有创业想法)必读手册 ChatGPT等…