python实战三-提取Word数据到Excel

视频+源码:
链接:https://pan.quark.cn/s/83db5bb15383

一个文件夹下有大量会议通知文件,为word文件,文件格式都是一致的,现在要将文件中的一些字段提取出来汇总到Excel文件中。
会议通知文件格式如下:

要提取学习时间、学习内容、学习形式、主持人汇总到 会议汇总.xlsx 中,每新增一条记录序号加1

Excel表格式如下:

代码如下:

from docx import Document
from openpyxl import load_workbook
import globdef 提取数据汇总(file_dir):tempfile = file_dir + r'\汇总模版.xlsx'workbook = load_workbook(tempfile)  # 打开模板文件sheet = workbook.activenumber = 1  # 计数docFiles = glob.glob(file_dir + r'\*.docx')  # 筛选出指定文件下所有.docx后缀文件for file in docFiles:print(file)doc = Document(file)contentList = []  # 学习内容studyTime = ''  # 学习时间studyType = ''  # 学习形式host = ''  # 主持人for paragraph in doc.paragraphs:if paragraph.text[2:7] == '学习时间:':studyTime = paragraph.text[7:]if paragraph.text[2:6] == '主持人:':host = paragraph.text[6:]if paragraph.text[2:7] == '学习形式:':studyType = paragraph.text[7:]if len(paragraph.text) >= 2:if paragraph.text[0].isdigit() and paragraph.text[1] == '、':contentList.append(paragraph.text)content = ' '.join(contentList)  # 列表转化为字符串sheet.append([number, studyTime, content, studyType, host])number += 1workbook.save(file_dir + r'\会议汇总.xlsx')if __name__ == '__main__':提取数据汇总(r'D:\自动化')

很简单自己创建 几个word试试吧:

关于党委理论学习中心组

2021 年第一次学习会的通知

公司党委领导班子成员:

定于3月1日组织公司党委理论学习中心组2021年第一次学习会,现将有

关事项通知如下:

一、学习时间:2021年3月10日下午4:00.

二、学习地点:5楼会议室,

三、参加人员:公司领导班子成员

四、主持人:李 XX。

五、学习形式:集中学习。I

六、学习内容:

                 1、2022谢谢小星星

                 2、生的点点滴滴

七、相关要求:

1.学习资料提前发给与会人员,请与会人员做好学习及发言准备;

2.请与会人员妥善安排工作,准时参加,学习时间如有变

运行结果: 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/413335.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路笔记(PCB): 椭圆形板框绘制

使用 QCAD绘制并导出dxf文件 https://www.qcad.org/en/,QCAD 是一个免费的开源应用程序,用于二维 (2D) 计算机辅助绘图 (CAD)。 导入dxf文件

【Apache Doris】数据均衡问题排查指南

原文阅读:【巨人肩膀社区博客分享】【Apache Doris】数据均衡问题排查指南 一、前提概要 当集群处于以下几种情况时,可参考本文进行问题排查。 •BE节点之间的数据不均 •单个BE节点上的多个磁盘之间的数据不均 •BE节点的上线和下线进度卡死&#…

路由策略工具

1.产生背景 a.保证数据访问的安全性 b.提高链路带宽利用率 c.流量路径不优 2.解决方案: 解决方案一:路由策略:可通过修改路由条目(即对接收和发布的路由进行过滤)来控制流量可达性 解决方案二:流量过滤:可使用Traffic-Filter工具对数据直接进行过滤 3.路由策略工具 a.可利…

基于jstat 分析垃圾回收情况,进行JVM调优

文章目录 引言I jstat 统计信息工具JVM 堆内存布局命令格式元数据空间统计堆内存统计JVM编译方法统计编译统计类加载统计II JVM调优基本概念: 应用程序的响应时间(RT)和吞吐量(QPS)JVM调优原理调优思路调优方法JVM调优技巧建议III 基于jstat 分析垃圾回收情况,进行JVM调优…

gitee 简单使用

目录 1. github 介绍 2. gitee 介绍 2.1 下载工具 2.2 创建仓库 2.3 clone 远程仓库到本地 2.4 上传代码 2.4.1 add:预添加到本地仓库 2.4.2 commit:提交代码到仓库 2.4.3 push:推送添加操作到远程仓库 3. 问题解决 3.1 文件推送成功,gitee没有绿点 3.2…

如何实现OpenHarmony的OTA升级

OTA简介 随着设备系统日新月异,用户如何及时获取系统的更新,体验新版本带来的新的体验,以及提升系统的稳定性和安全性成为了每个厂商都面临的严峻问题。OTA(Over the Air)提供对设备远程升级的能力。升级子系统对用户…

.NET WPF 抖动动画

.NET WPF 抖动动画 文章目录 .NET WPF 抖动动画1. WPF 动画的基本概念2. 动画类型3. 使用XAML定义动画4. 使用代码后台定义动画5. 组合动画6. 动画控制7. 自定义动画8. 动画的性能优化9. Demo - 抖动动画1. WPF 动画的基本概念 动画(Animation):在WPF中,动画指的是在一段时…

三级_网络技术_53_应用题

一、 请根据下图所示网络结构回答下列问题。 1.设备1应选用__________网络设备。 2.若对整个网络实施保护,防火墙应加在图中位置1~3的__________位置上。 3.如果采用了入侵检测设备对进出网络的流量进行检测,并且探测器是在交换机1上通过端口镜像方式…

完整指南:CNStream流处理多路并发框架适配到NVIDIA Jetson Orin (一) 依赖库编译、第三方库编译安装

目录 1 jetson-ffmpeg的编译安装与配置--用来做视频编码、视频解码 2 CV-CUDA库的编译安装与配置--用来做图像缩放、裁剪、色域转换 3 cuda cudnn TensorRT相关库的拷贝与配置 3.1将cuda cudnn TensorRT相关的头文件拷贝到工程中 3.2 将cuda cudnn TensorRT相关的库拷贝到…

ArcGIS Pro技术应用

GIS是利用电子计算机及其外部设备,采集、存储、分析和描述整个或部分地球表面与空间信息系统。简单地讲,它是在一定的地域内,将地理空间信息和 一些与该地域地理信息相关的属性信息结合起来,达到对地理和属性信息的综合管理。GIS的…

学习之SQL语句之DQL(数据库查询语言)

DQL英文全称是Data Query Language(数据查询语言),数据查询语言,用来查询数据库中表的记录 查询关键字:SELECT 数据准备: CREATE TABLE emp ( id INT COMMENT “编号”, workno VARCHAR ( 10 ) COMMENT “工号”, NAME VARCHAR ( 10 ) COMME…

day45.动态规划

1035.不相交的线: 在两条独立的水平线上按给定的顺序写下 nums1 和 nums2 中的整数。 现在,可以绘制一些连接两个数字 nums1[i] 和 nums2[j] 的直线,这些直线需要同时满足: nums1[i] nums2[j] 且绘制的直线不与任何其他连线(非水…

【Python】家庭用电数据的时序分析

Household Electricity Consumption | Kaggle 目录 数据简介 探索分析 数据清洗 用电占比 趋势分析 序列分解 周期分析 周期分解 分析小结 数据简介 240000-household-electricity-consumption-records数据集包含了一个家庭6个月的用电数据,收集于2007年1…

安防监控/软硬一体/视频汇聚网关EasyCVR硬件启动崩溃是什么原因?

安防视频监控EasyCVR安防监控视频系统采用先进的网络传输技术,支持高清视频的接入和传输,能够满足大规模、高并发的远程监控需求。EasyCVR平台支持多种视频流的外部分发,如RTMP、RTSP、HTTP-FLV、WebSocket-FLV、HLS、WebRTC、WS-FMP4、HTTP-…

MySql【数据查询语言DQL】

DQL[非常重要] DQL 主要指查询语句,有查询单表数据,也有查多表数据表,单表查询 基本查询 条件查询 模糊查询 排序查询 聚合查询 去重查询 分组查询 限制查询 1、 数据准备 将发的stu.sql导入到MySql中 2、 基本查询 select 字段1,字段2,... from 表名; 查询返回的是一张…

C语言 ——— 文件读取结束的判定

目录 判定文件读取结束的方式 被错误使用的feof函数 判定文件结束的正确使用 判定文件读取结束的方式 判断文本文件是否读取结束: 利用 fgetc 判断返回值是否为 EOF 利用 fgets 判断返回值是否为 NULL 判断二进制文件是否读取结束: 利用 fread 判…

MAC环境导出项目的目录结构

一、安装Homebrew包管理工具 /bin/bash -c "$(curl -fsSL https://gitee.com/ineo6/homebrew-install/raw/master/install.sh)" 官网网址:https://brew.idayer.com/ 二、用brew包管理工具安装tree brew install tree 三、打开终端,导出项目…

axios响应

一.axios请求配置项(axios在调用时所接收的参数对象) 以下是请求时可用的配置选项,只有url是必须的,如果没有指定method,请求将默认使用get方法 { // url 是用于请求的服务器 URL url: "/user", // method 是创建请…

【三维重建】三角网格中轴骨架线提取

三维网格中轴线提取 方法介绍实现提取 三维网格中轴线提取是计算机图形学和三维建模领域中的一个重要技术,它对于理解三维形状的拓扑结构和几何特性具有重要意义。 方法介绍 以下是几种常见的三维网格中轴线提取方法: 基于距离变换的方法 基本原理&…

大数据计算-SQL优化手段(CBO)-以Flink为例

文章目录 背景理论知识示例结果展示结果解释 背景 大数据计算中,SQL生成的执行计划第一轮会经过固定规则的优化,第二轮会根据原计划,生成多条结合成本的的执行计划,根据cost 进行排序,选出最优的执行计划。 理论知识…