精准读取CSV/Excel数据 - 灵活指定行列范围的 Python 解决方案

文章目录

  • 源代码
  • 项目简介
  • 导入相关库
  • __file_exists 装饰器
  • 函数的签名和注释
  • 主要功能的实现
  • 运行演示
  • 读取 Excel 文件

源代码

https://github.com/ma0513207162/PyPrecip。pyprecip\reading\read_api.py 路径下。

项目简介

PyPrecip 是一个专注于气候数据处理的 Python 库,旨在为用户提供方便、高效的气候数据处理和分析工具。该库致力于处理各种气候数据,并特别关注于降水数据的处理和分析。

在这里插入图片描述

导入相关库

在这里,读取 csv 和 excel 文件分别使用 csv 库和 openpyxl 库。utits 路径下是笔者自定义的一些工具函数,在源码中可以找到。

import os, csv 
from openpyxl import load_workbook
from ..utits.except_ import RaiseException as exc 
from ..utits.warn_ import RaiseWarn as warn 
from ..utits.sundries import check_param_type

__file_exists 装饰器

一个简易的 python 装饰器 __file_exists,用于检测 path 参数有无正常输入,否则抛出自定义异常。

def __file_exists(func):def wrapper(*args, **kwargs):     if not args and not kwargs:exc.raise_exception("The file path is required.", TypeError) return func(*args, **kwargs)return wrapper 

函数的签名和注释

  • 以 read_csv 函数为示例,定义了一些必要的参数。
  • by_row 参数表示是否按行读取数据。
  • 其中 row_indices 和 column_indices 参数为 tuple 类型时,表示指定行索引或列索引。指定为 list 类型时,表示指定行范围或列范围。
  • check_param_type 函数负责检查参数的类型。
@__file_exists    
def read_csv(path: str, by_row: bool = False, row_indices: (tuple|list) = (), column_indices: (tuple|list) = ()): """     Reads data for specified rows and columns from a CSV file.Parameters:- path: indicates the path of the CSV file- row_indices: Specifies the read row range (list length 2) or row index (tuple)- column_indices: specifies the read column range (list length 2) or column index (tuple)- by_row: If True, read the file by rows (default). If False, read the file by columns.Returns:- Dictionary. The key indicates the file name and the value indicates the read data"""# 检查参数类型 check_param_type(path, str, "path");check_param_type(row_indices, (tuple|list), "row_indices"); check_param_type(column_indices, (tuple|list), "column_indices");

主要功能的实现

根据传入的 row_indices 和 column_indices 参数搭配 zip 函数进行行列的转换, 使用切片和索引操作从原始 CSV 数据中提取指定的行列数据区域。这里最大的特点就是避免了使用大量的 for 循环进行同样功能的实现。

	read_csv_result: dict = {}; with open(path, "r", encoding="gbk") as csv_file:reader_csv = list(csv.reader(csv_file)) # 指定行范围  if isinstance(row_indices, list) and row_indices != []:if len(row_indices) == 2:start, end = row_indices[0], row_indices[1]reader_csv = reader_csv[start-1: end]else:warn.raise_warning("The row_indices parameter must contain only two elements, otherwise it is invalid.") # 指定行索引 if isinstance(row_indices, tuple) and row_indices != ():row_idx_list = []for idx in row_indices:if idx >= 1 and idx <= len(reader_csv):row_idx_list.append(reader_csv[idx-1]) else:exc.raise_exception("The index must be greater than 0 and less than the sequence length.", IndexError)reader_csv = row_idx_list; # list 类型指定行范围reader_csv = list(zip(*reader_csv)) if isinstance(column_indices, list) and column_indices != []:if len(column_indices) == 2:start, end = column_indices[0], column_indices[1]; reader_csv = reader_csv[start-1: end]else:warn.raise_warning("The column_indices parameter must contain only two elements, otherwise it is invalid.") # tuple 类型指定列索引 if isinstance(column_indices, tuple) and column_indices != ():col_idx_list = [] for idx in column_indices:if idx >= 1 and idx <= len(reader_csv):col_idx_list.append(reader_csv[idx-1]); else:exc.raise_exception("The index must be greater than 0 and less than the sequence length.", IndexError)reader_csv = col_idx_list;# 按行读取 if by_row:reader_csv = list(zip(*reader_csv)) # 封装 dict 对象file_name = os.path.splitext(os.path.basename(path))[0]; read_csv_result[file_name] = reader_csv; return read_csv_result;

运行演示

# 以主进程的方式运行 
if __name__ == "__main__": path = "./static/test_data.xlsx"read_result = read_excel(path=path, row_indices=(1,3), column_indices=[1,5]);for key in read_result:for value in read_result[key]:print(value)

在这里插入图片描述

读取 Excel 文件

同样的逻辑,也适用于读取 Excel 文件。

@__file_exists    
def read_excel(path: str, by_row: bool = False,  sheet_names: tuple = (), row_indices: (tuple|list) = (),column_indices: (tuple|list) = ()) -> dict: """Reads data from a specified worksheet, row, and column from an Excel file.Parameters:- path: indicates the Excel file path- sheet_names: A tuple of sheet names to be read. If empty, the active sheet is read- row_indices: Specifies the read row range (list length 2) or row index (tuple)- column_indices: specifies the read column range (list length 2) or column index (tuple)- by_row: If True, read the file by rows (default). If False, read the file by columns.Return:- Dictionary. The key is the name of the worksheet and the value is the read data"""# 检查参数类型 check_param_type(path, str, "path");check_param_type(sheet_names, tuple, "sheet_names");check_param_type(row_indices, (tuple|list), "row_indices"); check_param_type(column_indices, (tuple|list), "column_indices");workbook = load_workbook(filename = path, data_only = True) # Gets the specified worksheet sheet_list = []if sheet_names != ():for sheet_name in sheet_names:sheet_list.append(workbook[sheet_name])else:sheet_list.append(workbook.active) read_excel_result: dict = {}; # 遍历工作簿 sheet_listfor sheet in sheet_list:sheet_iter_rows: list = list(sheet.iter_rows(values_only = True)) # 指定行范围 if isinstance(row_indices, list) and row_indices != []:if len(row_indices) == 2:start, end = row_indices[0], row_indices[1] sheet_iter_rows = sheet_iter_rows[start-1: end]else:warn.raise_warning("The row_indices parameter must contain only two elements, otherwise it is invalid.") # 指定行索引 if isinstance(row_indices, tuple) and row_indices != ():temp_iter_rows = []for idx in row_indices:if idx >= 1 and idx <= len(sheet_iter_rows):temp_iter_rows.append(sheet_iter_rows[idx-1]) else:exc.raise_exception("The index must be greater than 0 and less than the sequence length.", IndexError)sheet_iter_rows = temp_iter_rows   # list 类型指定行范围sheet_iter_cols = list(zip(*sheet_iter_rows)) if isinstance(column_indices, list) and column_indices != []:if len(column_indices) == 2:start, end = column_indices[0], column_indices[1]; sheet_iter_cols = sheet_iter_cols[start-1: end]  else:warn.raise_warning("The column_indices parameter must contain only two elements, otherwise it is invalid.")   # tuple 类型指定列索引 if isinstance(column_indices, tuple) and column_indices != ():col_idx_list = [] for idx in column_indices:if idx >= 1 and idx <= len(sheet_iter_cols):col_idx_list.append(sheet_iter_cols[idx-1]); else:exc.raise_exception("The index must be greater than 0 and less than the sequence length.", IndexError)sheet_iter_cols = col_idx_list; # 是否按行读取 if by_row:sheet_iter_cols = list(zip(*sheet_iter_cols)) read_excel_result[sheet.title] = sheet_iter_cols; return read_excel_result;  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/323607.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

9.为什么有时候会“烫烫烫”——之函数栈桢

目录 1. 什么是函数栈帧 2. 理解函数栈帧能解决什么问题呢&#xff1f; 3. 函数栈帧的创建和销毁解析 3.1 什么是栈&#xff1f; 3.2 认识相关寄存器和汇编指令 3.3 解析函数栈帧的创建和销毁 小知识&#xff1a;烫烫烫~ Q&A 1. 什么是函数栈帧 我们在写C语言代码…

大模型面试常考知识点1

文章目录 1. 写出Multi-Head Attention2. Pre-Norm vs Post-Norm3. Layer NormRMS NormBatch Norm 4. SwiGLU从ReLU到SwishSwiGLU 5. AdamW6. 位置编码Transformer位置编码RoPEALibi 7. LoRA初始化 参考文献 1. 写出Multi-Head Attention import torch import torch.nn as nn …

毕业设计参考-PyQt5-YOLOv8-鱼头鱼尾鱼长测量程序,OpenCV、Modbus通信、YOLO目标检测综合应用

“PyQt5-YOLOv8-鱼头鱼尾鱼长测量程序”是一个特定的软件程序&#xff0c;用于通过图像处理和目标检测技术来测量鱼类的长度。 视频效果&#xff1a; 【毕业设计】基于yolo算法与传统机器视觉的鱼头鱼尾识别_哔哩哔哩_bilibili 这个程序结合了多种技术&#xff1a; 1. OpenCV…

链表第7/9题--链表相交--双指针

leetcode160&#xff1a; 给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表没有交点&#xff0c;返回 null 。 图示两个链表在节点 c1 开始相交&#xff1a; 题目数据 保证 整个链式结构中不存在环。 注意&#xf…

记录如何查询域名txt解析是否生效

要查询域名的TXT记录&#xff0c;可以使用nslookup命令。具体步骤如下&#xff1a;12 打开命令行终端。输入命令 nslookup -qttxt 域名&#xff0c;将"域名"替换为你要查询的实际域名。执行命令后&#xff0c;nslookup会返回域名的TXT记录值。 如何查询域名txt解析是…

厂家自定义 Android Ant编译流程源码分析

0、Ant安装 Windows下安装Ant&#xff1a; ant 官网可下载 http://ant.apache.org ant 环境配置&#xff1a; 解压ant的包到本地目录。 在环境变量中设置ANT_HOME&#xff0c;值为你的安装目录。 把ANT_HOME/bin加到你系统环境的path。 Ubuntu下安装Ant&#xff1a; sudo apt…

基于 Linux 自建怀旧游戏之 - 80 款 H5 精品小游戏合集

1&#xff09;简介 最近又找到了一款宝藏游戏资源分享给大家&#xff0c;包含 80 款 H5 精品小游戏&#xff0c;都是非常有趣味耐玩的游戏&#xff0c;比如 植物大战僵尸、捕鱼达人、贪吃蛇、俄罗斯方块、斗地主、坦克大战、双人五子棋、中国象棋 等等超级好玩的 H5 小游戏&…

添加对象方法

添加对象方法的方法如下&#xff0c;这是一个通用模式 注意灵活运用。

Python深度学习基于Tensorflow(4)Tensorflow 数据处理和数据可视化

文章目录 构建Tensorflow.data数据集TFRecord数据底层生成TFRecord文件数据读取TFRecord文件数据图像增强 数据可视化 构建Tensorflow.data数据集 tf.data.Dataset表示一串元素&#xff08;element&#xff09;&#xff0c;其中每个元素包含一个或多个Tensor对象。例如&#xf…

如何在IDEA中找到jar包路径对应的maven依赖

1.找到文件所对应的jar包路径 2.按照箭头顺序操作 3.查找文件所对应的依赖

商场综合体能源监管平台,实现能源高效管理

商场作为大型综合体建筑&#xff0c;其能源消耗一直是备受关注的问题。为了有效管理商场能耗&#xff0c;提高商场能源效率&#xff0c;商场综合体能源监管平台应运而生。 商场综合体能源监管平台可通过软硬件一起进行节能监管&#xff0c;硬件设备包括各种传感器、监测仪表和…

FastReID使用教程、踩坑记录

近期在尝试使用FastReID&#xff0c;期间对FastReID架构、损失函数、数据集准备、模型训练/评估/可视化/特征向量输出、调试debug记录等进行记录。 FastReID架构理解 关于FastReID的介绍&#xff0c;可点击此链接前往查询。 ReID和FastReID架构 对于模型架构、损失函数、实验…

进程间通信 管道

前言 ubuntu系统的默认用户名不为root的解决方案&#xff08;但是不建议&#xff09;&#xff1a;轻量应用服务器 常见问题-文档中心-腾讯云 (tencent.com) 进程间通信的基本概念 进程间通信目的&#xff1a;进程间也是需要协同的&#xff0c;比如数据传输、资源共享、通知事件…

PG的事务ID回卷逻辑

PG到目前为止使用的事务ID仍然是32位的&#xff0c;在内存计算时虽然已经使用64位事务ID&#xff0c;但是存储在页中tuple仍然使用32位事务ID&#xff0c;这就是说&#xff0c;事务ID回卷仍然是必须处理的问题。 所谓PG事务ID回卷&#xff0c;简单地说&#xff0c;就是在数据库…

基于FPGA实现的HDMI TO MIPI扩展显示器方案

FPGA方案&#xff0c;HDMI IN接收原始HDMI 信号&#xff0c;输出显示到LCD 屏上 客户应用&#xff1a;扩展显示器 主要特性&#xff1a; 1.支持2K以下任意分辨率显示 2.支持OSD 叠加多个图层 3.支持MIPI/EDP/LVDS/RGB屏 4.支持放大缩小匹配屏分辨率 5.零延时&#xff0c;输…

【vue-echarts】 报错问题解决 “Error: Component series.pie not exists. Load it first.“

目录 问题描述解决【解决1】【解决2】 问题描述 使用 vue-echarts 时导入的文件 import VChart from vue-echarts/components/ECharts import echarts/lib/chart/line import echarts/lib/chart/bar import echarts/lib/chart/pie import echarts/lib/component/legend impor…

文心一言 VS 讯飞星火 VS chatgpt (255)-- 算法导论18.3 1题

一、请说明依次从图18-8(f)中删除C、P和V后的结果。如果要写代码&#xff0c;请用go语言。 文心一言&#xff1a; 首先&#xff0c;让我们明确一点&#xff1a;由于您没有提供具体的图18-8(f)的内容&#xff0c;我只能假设它是一个数据结构&#xff08;可能是图、树或列表等&…

Wireshark下载安装和使用教程

Wireshark下载安装和使用教程 Wireshark&#xff08;前身 Ethereal&#xff09;是一个网络包分析工具。该工具主要是用来捕获网络数据包&#xff0c;并自动解析数据包&#xff0c;为用户显示数据包的详细信息&#xff0c;供用户对数据包进行分析。 它可以运行在 Windows 和 L…

JavaScript初了解

JS的三种书写位置&#xff1a;行内&#xff0c;内嵌&#xff0c;外部 JS的注释的书写&#xff1a;单行注释&#xff1a;// ctrl/ 多行注释&#xff1a;/**/ ShiftAltA JavaScript输入输出语句

【Java orm 框架比较】九 新增wood框架对比

【Java orm 框架比较】九 新增wood框架对比 本次新增wood 框架测试 测试数据存储、分页查询&#xff0c;文档及框架比较稳定半天时间加入测试使用 迁移到&#xff08;https://gitee.com/wujiawei1207537021/spring-orm-integration-compare&#xff09; orm框架使用性能比较…