【python】将word文档内容转换为excel表格

        在日常工作中,我们经常需要将Word文档中的内容提取并转换为Excel表格,以便进行数据分析和处理。本文将介绍如何使用Python编写一个简单的程序,将Word文档中的内容转换为Excel表格。

一.实例

        使用以下word文档作为例子:

        工具界面如下:

        第一个弹窗选择对应的文档后选择打开:

        第二个弹窗选择保存路径以及excel表格的名字:

        生成后的效果如下:

二.环境准备

        我们将使用tkinter库创建一个图形用户界面(GUI),使用python-docx库读取Word文档,并使用openpyxl库将内容写入Excel文件。

pip install python-docx openpyxl

三.代码实现

        以下是完整的代码示例:

import tkinter as tk
from tkinter import filedialog
from docx import Document
import openpyxldef convert_word_to_excel_full():# 选择Word文件word_file = filedialog.askopenfilename(filetypes=[("Word files", "*.docx")])if not word_file:return# 创建Excel工作簿workbook = openpyxl.Workbook()sheet = workbook.active# 读取Word文档doc = Document(word_file)for paragraph in doc.paragraphs:if paragraph.text.strip():  # 只处理非空段落# 检查段落中是否包含#符号parts = paragraph.text.split("#")# 处理以#分割的内容for part in parts:if part.strip():  # 只处理非空部分sheet.append([part.strip()])  # 将每个部分写入单独的单元格# 添加一个空行以分隔不同段落sheet.append([""])  # 添加空行以分隔段落# 遍历文档中的表格for table in doc.tables:# 在表格前添加一个空行以分隔段落和表格sheet.append([""])  # 添加空行以分隔for row in table.rows:row_data = []for cell in row.cells:row_data.append(cell.text)sheet.append(row_data)  # 将表格行写入Excel# 保存Excel文件excel_file = filedialog.asksaveasfilename(defaultextension=".xlsx", filetypes=[("Excel files", "*.xlsx")])if excel_file:workbook.save(excel_file)# 创建主窗口
root = tk.Tk()
root.title("Word to Excel Converter")
root.geometry("400x250")  # 设置窗口大小# 创建按钮
convert_button_full = tk.Button(root, text="Word文档转换为Excel", command=convert_word_to_excel_full, width=30)
convert_button_full.pack(pady=50)  # 增加上下间距# 运行主循环
root.mainloop()

四.代码解析

1.导入库:

   import tkinter as tkfrom tkinter import filedialogfrom docx import Documentimport openpyxl

- tkinter:用于创建图形用户界面(GUI)。

  • filedialog:用于打开文件选择对话框。
  • Document:来自python-docx库,用于读取Word文档。
  • openpyxl:用于创建和操作Excel文件。

2.选择Word文件:

   word_file = filedialog.askopenfilename(filetypes=[("Word files", "*.docx")])if not word_file:return

- 使用filedialog.askopenfilename方法让用户选择要转换的Word文件。如果用户没有选择文件,程序将返回,不继续执行。

3.创建Excel工作簿:

   workbook = openpyxl.Workbook()sheet = workbook.active

- 使用openpyxl.Workbook()创建一个新的Excel工作簿,并获取活动的工作表。

4. 读取Word文档:

   doc = Document(word_file)

- 使用Document类读取用户选择的Word文档。

5. 处理段落内容:

   for paragraph in doc.paragraphs:if paragraph.text.strip():  # 只处理非空段落parts = paragraph.text.split("#")for part in parts:if part.strip():  # 只处理非空部分sheet.append([part.strip()])  # 将每个部分写入单独的单元格sheet.append([""])  # 添加空行以分隔段落

- 遍历Word文档中的每个段落,检查段落是否为空。

  • 使用split("#")方法将段落内容按“#”符号分割。
  • 对于每个分割后的部分,检查是否为空,如果不为空,则将其写入Excel的单独单元格。
  • 在每个段落处理完后,添加一个空行以分隔不同段落,确保Excel中的内容结构与Word文档一致。

6.处理表格内容:

   for table in doc.tables:sheet.append([""])  # 添加空行以分隔for row in table.rows:row_data = []for cell in row.cells:row_data.append(cell.text)sheet.append(row_data)  # 将表格行写入Excel

- 遍历Word文档中的表格,在表格前添加一个空行以分隔段落和表格。

  • 对于每个表格的行,遍历每个单元格,将其内容写入Excel。

7.保存Excel文件:

   excel_file = filedialog.asksaveasfilename(defaultextension=".xlsx", filetypes=[("Excel files", "*.xlsx")])if excel_file:workbook.save(excel_file)

- 使用filedialog.asksaveasfilename方法让用户选择保存的Excel文件名和位置。如果用户选择了文件名,则保存工作簿。

8.创建GUI:

   root = tk.Tk()root.title("Word to Excel Converter")root.geometry("400x250")  # 设置窗口大小convert_button_full = tk.Button(root, text="Word文档转换为Excel", command=convert_word_to_excel_full, width=30)convert_button_full.pack(pady=50)  # 增加上下间距root.mainloop()

- 创建主窗口,设置窗口标题和大小。

  • 创建一个按钮,用户点击按钮即可开始转换。
  • 运行主循环,保持窗口显示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/476802.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux|进程程序替换

目录 什么是进程替换 替换原理 exec函数 exec* 函数的共性 什么是进程替换 进程程序替换是指将一个进程中正在运行的程序替换为另一个全新的程序的过程,但替换不是创建新进程,只是将对应程序的代码和数据进行替换。具体来说,这个替换过程涉…

大数运算(加减乘除和输入、输出模块)

为什么会有大数呢?因为long long通常为64位范围约为 -9,223,372,036,854,775,808 到 9,223,372,036,854,775,807,最多也就19位,那么超过19位的如何计算呢?这就引申出来大数了。 本博客适合思考过这道题,但是没做出来或…

IntelliJ+SpringBoot项目实战(四)--快速上手数据库开发

对于新手学习SpringBoot开发,可能最急迫的事情就是尽快掌握数据库的开发。目前数据库开发主要流行使用Mybatis和Mybatis Plus,不过这2个框架对于新手而言需要一定的时间掌握,如果快速上手数据库开发,可以先按照本文介绍的方式使用JdbcTemplat…

flex布局 昵图网【案例】

效果展示 只是个大概&#xff0c;可自己完善。 昵图网 代码展示 <body><!-- https://static.ntimg.cn/original/images/soso.png --><div class"container"><div class"header"><!-- <div class"logo"><i…

[第五空间 2021]pklovecloud 详细题解

知识点: 构造POP链 PHP类的作用域 NULL强比较 目录穿越 源码如下: <?php include flag.php; class pkshow { function echo_name() { return "Pk very safe^.^"; } } class acp { protected $cinder; public $neutron;public $n…

dockerfile构建Nginx镜像练习二(5-2)

环境准备&#xff1a; (1)保证拥有centos基础镜像 docker images | grep centos (2)服务器保证可以连接外网 1.创建工作目录 mkdir nginx cd nginx 2.在工作目录中创建并编写Dockerfile文件 vim dockerfile #定义基础镜像 FROM centos:7#维护者信息(可缺省) MAINTAINER d…

Android Surfaceflinger显示图层合成方式

Android SurfaceFlinger是Android系统中负责窗口管理和图像合成的核心组件。它接收来自不同应用的图层数据&#xff0c;并将这些图层合并成一个单一的图像&#xff0c;然后输出到显示设备上。SurfaceFlinger的合成方式主要涉及两种&#xff1a;Client合成和Device合成。 adb s…

wsl安装

一. wsl简介 1. wsl和wsl2的区别 wsl需要把linux命令翻译为windows命令&#xff0c;性能差一些。 wsl2直接使用linux内核&#xff0c;不需要翻译&#xff0c;性能好&#xff0c;但开销相对大一点&#xff0c;因为需要多运行一个hyper-v虚拟机 (并非完整的虚拟机&#xff0c;是…

任务通知的本质(任务通知车辆运行) 软件定时器的本质(增加游戏音效)

任务通知的本质 没有任务通知 所谓"任务通知"&#xff0c;你可以反过来读"通知任务"。 我们使用队列、信号量、事件组等等方法时&#xff0c;并不知道对方是谁。使用任务通知时&#xff0c;可 以明确指定&#xff1a;通知哪个任务。 使用队列、信号量、…

Kubernetes的pod控制器

文章目录 一&#xff0c;什么是pod控制器二&#xff0c;pod控制器类型&#xff08;重点&#xff09;1.ReplicaSet2.Deployment3.DaemonSet4.StatefulSet5.Job6.Cronjob 三&#xff0c;pod与控制器的关系1.Deployment2.SatefulSet2.1StatefulSet组成2.2headless的由来2.3有状态服…

【单元测试】【Android】JUnit 4 和 JUnit 5 的差异记录

背景 Jetbrain IDE 支持生成 Test 类&#xff0c;其中选择JUnit5 和 JUnit&#xff0c;但是感觉这不是标准的单元测试&#xff0c;因为接口命名吧。 差异对比 两者生成的单测API名称同原API&#xff0c;没加test前缀的。使用差异主要表现在&#xff1a; setUp &#xff06; …

知识中台在多语言客户中的应用

在全球化的商业环境中&#xff0c;企业面临着多语言客户服务的挑战。HelpLook知识中台作为一种智能化解决方案&#xff0c;为企业提供了一个强大的工具&#xff0c;以实现多语言客户服务的自动化和优化。 一、多语言客户服务的重要性 多语言客户服务对于跨国企业至关重要&…

使用 Elastic AI Assistant for Search 和 Azure OpenAI 实现从 0 到 60 的转变

作者&#xff1a;来自 Elastic Greg Crist Elasticsearch 推出了一项新功能&#xff1a;Elastic AI Assistant for Search。你可以将其视为 Elasticsearch 和 Kibana 开发人员的内置指南&#xff0c;旨在回答问题、引导你了解功能并让你的生活更轻松。在 Microsoft AI Services…

【K8S问题系列 |18 】如何解决 imagePullSecrets配置正确,但docker pull仍然失败问题

如果 imagePullSecrets 配置正确&#xff0c;但在执行 docker pull 命令时仍然失败&#xff0c;可能存在以下几种原因。以下是详细的排查步骤和解决方案。 1. 检查 Docker 登录凭证 确保你使用的是与 imagePullSecrets 中相同的凭证进行 Docker 登录&#xff1a; 1.1 直接登录…

Redis的特性ubuntu进行安装

文章目录 1.六大特性1.1内存存储数据1.2可编程1.3可扩展1.4持久化1.5集群1.6高可用1.7速度快 2.具体应用场景&#xff08;了解&#xff09;3.Ubuntu安装Redis3.1安装指令3.2查看状态3.3查找配置文件3.4修改文件内容3.5重启服务器生效3.6安装客户端并进行检查 4.Redis客户端介绍…

【ASE】第八课_冰(ice)的效果

今天我们一起来学习ASE插件&#xff0c;希望各位点个关注&#xff0c;一起跟随我的步伐 今天我们来学习一个简单的冰的效果&#xff0c;这个是根据油管上的视频制作的 可在我的资源里下载模型&#xff0c;贴图&#xff0c;材质 思路 1.物体表面结冰的效果&#xff0c;也就是…

回溯法基础入门解析

回溯法 前 言 回溯法也可以叫做回溯搜索法&#xff0c;它是一种搜索的方式。回溯是递归的副产品&#xff0c;只要有递归就会有回溯。回溯法&#xff0c;一般可以解决如下几种问题&#xff1a; 组合问题&#xff1a;N个数里面按一定规则找出k个数的集合切割问题&#xff1a;一…

Redis原理及应用

Redis简介 Redis是开源的&#xff08;BSD许可&#xff09;&#xff0c;数据结构存储于内存中&#xff0c;被用来作为数据库&#xff0c;缓存和消息代理。它支持多种数据结构&#xff0c;例如&#xff1a;字符串&#xff08;string&#xff09;&#xff0c;哈希&#xff08;hash…

Ubuntu ESP32开发环境搭建

文章目录 ESP32开发环境搭建安装ESP-IDF搭建一个最小工程现象 ESP32开发环境搭建 最近有个小项目需要用到能够联网的mcu驱动&#xff0c;准备玩玩esp的芯片&#xff0c;记录下ESP32开发环境搭建的过程。 ESP-IDF 是乐鑫科技为其 ESP32 系列芯片提供的官方开发框架。这个框架主…

【C#设计模式(14)——责任链模式( Chain-of-responsibility Pattern)】

前言 责任链模式通过将请求和处理者解耦&#xff0c;关联多个处理者形成一个链条&#xff0c;使每个处理者都有机会处理请求&#xff0c;避免了将所有处理逻辑集中在一个对象中的复杂性。 代码 //请求者 public class Requestor {private string content;public string Cont…