python把Word题库转成Excle题库

又到了一年一度的背题时刻,但是收到的题库是Word版的,页数特别多

话不多说,上代码,有图有真相,代码里面备注的很详细

# 导入所需库
import csv
import os
import refrom docx import Document
from win32com import client as wc# 打开word文档def doc_to_docx(doc_file):full_path = os.path.abspath(doc_file)  # 绝对路径,便于分离文件位置、名和后缀word = wc.Dispatch("Word.Application")doc = word.Documents.Open(full_path)doc.SaveAs(os.path.splitext(full_path)[0] + '.docx', 12)  # 保存只改后缀 12 为docxdoc.Close()word.Quit()return os.path.splitext(full_path)[0] + '.docx'def save_to_csv(doc_name, date):  # date为list [[1],[2],[3]...]name = os.path.abspath(doc_name)# os.path.splitext(name)[0]out = open(f'{os.path.splitext(name)[0]}.csv', 'a', encoding='utf-8', newline='')csv_write = csv.writer(out, dialect='excel')for row in date:csv_write.writerow(row)out.close()print(f'文件{os.path.splitext(name)[0]}.csv生成完毕!请查看')if __name__ == '__main__':"""为防止格式错乱,请先在源文件里执行将^l替换为^p操作默认每个题目开头序号都是数字,如果不是,需要修改question_start_num对应的re代码"""file_name = input("请输入word文件名(带后缀):")  # "2.doc"TG_style = '一二三四五六七八九、'  # 大题干类型(最后一位为符号)choose_split = "、"  # 选项分割符号A、 A.if file_name.endswith('.doc'):  # 加快处理速度:.docx比doc处理速度快,所以如果不是x结尾的转成x的file_name = doc_to_docx(file_name)document = Document(file_name)# 获取所有段落all_paragraphs = document.paragraphsstart_num = 0  # 主干序号下角序号TX = ''  # 题型All_content = []  # 存储所有题内容tem = []  # 临时存储每个题类型、题干、选项、答案for paragraph in all_paragraphs:# 打印每一个段落的文字# print([paragraph.text])tittle_split = '、'question_start_num = re.compile(f'^\d')  # 识别题干头是否是数字p = re.compile(f'^{TG_style[start_num] + TG_style[-1]}')  # 匹配开头字符,筛选出大标号,区分题目类型tittle_ret = question_start_num.search(paragraph.text)  # 识别题干头ret = p.search(paragraph.text)  # 识别题型if ret:TX = paragraph.text.replace((TG_style[start_num] + TG_style[-1]), '', 1)start_num += 1# tittle_num = 1# print(TG)All_content.append(tem)tem = []All_content.append([paragraph.text])  # 读完题型,说明进入了题目内容else:if tittle_ret:  # 是否是题干All_content.append(tem)  # 如果是题干,证明上一题遍历完毕,进行缓存tem = [TX]  # 保存题型在第一位# print(f"{TG}{paragraph.text}")# tittle_num += 1  # 遇到题号不连续时继续处if All_content:  # 不是题干,缓存写了,说明在读取选项'''此处为了区分一行有多个选项的情况,逐个读取出来'''chooses = re.split(f"[A-Za-z]{choose_split}", paragraph.text)for choose in chooses:if choose.replace(' ', ''):  # 替换掉选项中空格进行过滤#print(choose)tem.append(choose)save_to_csv(file_name, All_content)

题库已打包,有环境的直接RUN,有问题可以咨询(不保证一定解决)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/181949.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子敲木鱼小程序源码系统 支持广告视频流量主 带完整搭建教程

大家好啊!好久不见。今天罗峰来给大家分享一款电子敲木鱼小程序源码系统。相信大家都听说这个电子敲木鱼小程序,是当代年轻人缓解压力的一款小程序。今天罗峰就来给大家介绍一下他的功能,这款小程序自带广告视频流量,帮你轻松赚钱…

皮肤病辅助诊断软件,基于Android编写

1.系统介绍 编写的皮肤病辅助诊断软件,包括皮肤病识别、皮肤病区域分割、皮肤病信息介绍、识别历史记录查询、简单图像处理操作以及本机信息查询等功能 2.登录界面 运行之后首先显示登录界面 3.注册界面 注册一个账号 4.主界面 输入用户名密码点击登录按钮…

基于SpringAOP实现自定义接口权限控制

文章目录 一、接口鉴权方案分析1、接口鉴权方案2、角色分配权限树 二、编码实战1、定义权限树与常用方法2、自定义AOP注解3、AOP切面类(也可以用拦截器实现)4、测试一下 一、接口鉴权方案分析 1、接口鉴权方案 目前大部分接口鉴权方案,一般…

中文sd:SkyPaint-AI-Diffusion

https://huggingface.co/SkyworkAIGC/SkyPainthttps://huggingface.co/SkyworkAIGC/SkyPainthttps://github.com/SkyWorkAIGC/SkyPaint-AI-Diffusionhttps://github.com/SkyWorkAIGC/SkyPaint-AI-Diffusion从model_index.json看,应该算是标准的sd1.5架构了。 {&quo…

【Head First 设计模式】-- 观察者模式

背景 客户有一个WeatherData对象,负责追踪温度、湿度和气压等数据。现在客户给我们提了个需求,让我们利用WeatherData对象取得数据,并更新三个布告板:目前状况、气象统计和天气预报。 WeatherData对象提供了4个接口: …

linux系统SQL server数据库定时收缩

问题现象 出现下图问题,导致连接该数据库的程序不能正常启动 解决办法 定时收缩数据库 数据库定时收缩脚本 需要三个脚本文件 linux_sqlcmd_timing_task_shrink.sh:主脚本文件 # 设置数据库名称、用户名、密码等信息 # db_name"volador"…

Elasticsearch:使用你的 RAG 来进行聊天

什么是人工智能中的检索增强生成(RAG)? 检索增强生成 (RAG),与你的文档聊天的超级英雄,架起信息检索和文本生成世界的桥梁! 这就像福尔摩斯和莎士比亚联手解决需要大量知识的复杂任务。 RAG 突然介入&…

使用Python自动修改电脑的静态IP地址

目录 一、引言 二、实现思路 三、详细步骤 四、Python代码 五、注意事项 六、适用性和局限性 七、总结 一、引言 在网络应用中,有时我们需要频繁更改电脑的静态IP地址。例如,当我们在不同网络环境(家庭、办公室)中使用电脑…

洗衣洗鞋柜洗衣洗鞋小程序

支持:一键投递、上门取衣、自主送店、多种支付方式 TEL: 17638103951(同V) -----------------用户下单-------------- -------------------------多种支付和投递方式------------------------- -----------------商家取鞋--------------

C++前缀和算法的应用:最大化城市的最小供电站数目

本文涉及的基础知识点 C算法:前缀和、前缀乘积、前缀异或的原理、源码及测试用例 包括课程视频 二分法 题目 给你一个下标从 0 开始长度为 n 的整数数组 stations ,其中 stations[i] 表示第 i 座城市的供电站数目。 每个供电站可以在一定 范围 内给所…

算法题:203. 移除链表元素(递归法、设置虚拟头节点法等3种方法)Java实现创建链表与解析链表

1、算法思路 讲一下设置虚拟头节点的那个方法,设置一个新节点指向原来链表的头节点,这样我们就可以通过判断链表的当前节点的后继节点值是不是目标删除值,来判断是否删除这个后继节点了。如果不设置虚拟头节点,则需要将头节点和后…

产品经理墨刀学习----注册页面

我们做的产品是一个校园论坛学习开发系统,目前才开始学习。 (一)流程图 (二)简单墨刀设计--注册页面 (1)有账号 (a)直接登录: (b)忘…

在Google Kubernetes集群创建分布式Jenkins(一)

因为项目需要,在GKE的集群上需要创建一个CICD的环境,记录一下安装部署一个分布式Jenkins集群的过程。 分布式Jenkins由一个主服务器和多个Agent组成,Agent可以执行主服务器分派的任务。如下图所示: 如上图,Jenkins Ag…

从零开始搭建微服务(一)

构建项目父工程 添加公共核心模块 安装nacos 安装nacos nacos 文档地址: https://nacos.io/zh-cn/docs/what-is-nacos.html 本文使用版本2.2.2 下载地址:https://github.com/alibaba/nacos/archive/refs/tags/2.2.2.zip 使用nacos 我们下载是源代码 解…

20.8 OpenSSL 套接字SSL传输文件

有了上面的基础那么传输文件的实现就变得简单了,在传输时通常我们需要打开文件,并每次读入1024个字节的数据包,通过SSL加密传输即可,此处的文件传输功能在原生套接字章节中也进行过详细讲解,此处我们还是使用原来的密钥…

【Verilog 教程】7.3 Verilog 串行 FIR 滤波器设计

串行 FIR 滤波器设计 设计说明 设计参数不变,与并行 FIR 滤波器参数一致。即,输入频率为 7.5 MHz 和 250 KHz 的正弦波混合信号,经过 FIR 滤波器后,高频信号 7.5MHz 被滤除,只保留 250KMHz 的信号。 输入频率&#x…

VMware安装CentOS最小化开发环境导引

目录 一、概要 二、介绍 三、下载 四、安装 4.1 创建虚拟机 4.2 安装CentOS 五、配置网卡 六、配置本地安装源 七、安装软件 7.1 gcc/g 7.2 C的atomic库 7.3 java 7.4 Cmake 7.5 MariaDB客户端(兼容mysql) 八、用户配置文件.bash_profile…

[开源]企业级在线办公系统,基于实时音视频完成在线视频会议功能

一、开源项目简介 企业级在线办公系统 本项目使用了SpringBootMybatisSpringMVC框架,技术功能点应用了WebSocket、Redis、Activiti7工作流引擎, 基于TRTC腾讯实时音视频完成在线视频会议功能。 二、开源协议 使用GPL-3.0开源协议 三、界面展示 部分…

什么是单片机?它是如何工作的?

一.单片机是什么? 家用电器包含各种各样的集成电路板。 在集成电路板上最重要的就是单片机(单片微型计算机)。它是一种集成电路芯片。 二.单片机的组成 2.1 CPU CPU的主要功能是运算和控制。2.2 ROM 1.是什么? ROM的全称是Re…

Redis03-过期策略和淘汰策略

目录 Redis数据过期策略 Redis数据淘汰策略 Redis数据过期策略 Redis使用一种基于过期策略来处理键的过期和自动失效。这种策略可以确保不再需要的数据被自动删除,以释放内存并避免数据过期后仍然在缓存中存留。 Redis的过期删除策略主要有两种: 惰性…