使用Pandas处理Excel文件

Excel工作表是非常本能和用户友好的，这使得它们非常适合操作大型数据集，即使是技术人员也不例外。如果您正在寻找学习使用Python在Excel文件中操作和自动化内容的地方，请不要再找了。你来对地方了。
在本文中，您将学习如何使用Pandas来处理Excel电子表格。在文章的最后，您将了解：

为此需要必要的模块以及如何在系统中设置它们。
使用Python从excel文件阅读数据到pandas中。
在Pandas中浏览Excel文件中的数据。
在Pandas中使用函数来操作和重塑数据。

安装

要在Anaconda中安装Pandas，我们可以在Anaconda终端中使用以下命令：

conda install pandas

要在常规Python（非Anaconda）中安装Pandas，我们可以在命令提示符中使用以下命令：

pip install pandas

开始使用

首先，我们需要导入Pandas模块，这可以通过运行命令来完成：

import pandas as pd

输入文件： 让我们假设excel文件看起来像这样

Sheet 1:

在这里插入图片描述
Sheet 2:

在这里插入图片描述
现在我们可以使用Pandas中的read_excel函数导入excel文件。第二个语句从excel中读取数据并将其存储到pandas数据框中，该数据框由变量newData表示。如果excel工作簿中有多个工作表，则该命令将导入第一个工作表的数据。要使用工作簿中的所有工作表创建数据框，最简单的方法是分别创建不同的数据框，然后将它们连接起来。read_excel方法接受参数sheet_name和index_col，我们可以指定数据框应该由哪个工作表组成，index_col指定标题列，如下所示：

file =('path_of_excel_file')
newData = pd.read_excel(file)
newData

在这里插入图片描述
示例：
第三个语句连接两个表。现在要检查整个数据帧，我们可以简单地运行以下命令：

sheet1 = pd.read_excel(file,sheet_name = 0,index_col = 0)sheet2 = pd.read_excel(file,sheet_name = 1,index_col = 0)newData = pd.concat([sheet1, sheet2])newData

在这里插入图片描述
要从数据框的顶部和底部查看5列，可以运行命令。这个head()和tail()方法也接受参数作为要显示的列数的数字。

newData.head()
newData.tail()

在这里插入图片描述

shape方法可用于查看数据框中的行数和列数，如下所示：

newData.shape

在这里插入图片描述
如果任何列包含数值数据，我们可以使用pandas中的sort_values()方法对该列进行排序，如下所示：

sorted_column = newData.sort_values(['Height'], ascending = False)

现在，假设我们想要排序列的前5个值，我们可以在这里使用head()方法：

sorted_column['Height'].head(5)

在这里插入图片描述
我们可以使用数据框的任何数值列来执行此操作，如下所示：

newData['Weight'].head()

在这里插入图片描述
现在，假设我们的数据主要是数字。我们可以得到统计信息，如平均值，最大值，最小值等。使用describe()方法对数据帧进行处理，如下所示：

newData.describe()

在这里插入图片描述
也可以使用以下命令对所有数值列单独执行此操作：

newData['Weight'].mean()

在这里插入图片描述
也可以使用相应的方法来计算其他统计信息。与Excel一样，也可以应用公式并创建计算列，如下所示：

newData['calculated_column'] =newData[“Height”] + newData[“Weight”]
newData['calculated_column'].head()

在这里插入图片描述
对数据框中的数据进行操作后，我们可以使用to_excel方法将数据导出回Excel文件。为此，我们需要指定一个输出excel文件，其中要写入转换后的数据，如下所示：

newData.to_excel('Output File.xlsx')

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/96291.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

使用Pandas处理Excel文件

安装

开始使用

相关文章

antd5源码调试环境搭建（window系统）

云计算虚拟仿真实训平台

Apache Dubbo 云原生可观测性的探索与实践

无脑入门pytorch系列（四）—— scatter_

musl libc ldso 动态加载研究笔记：02

如何快速的合并多个PPT使之成为一个PPT？

JMeter接口自动化测试实例—JMeter引用javaScript

7.maven

AI工程师招募；60+开发者AI工具清单；如何用AI工具读懂插件源码；开发者出海解读；斯坦福LLM课程 | ShowMeAI日报

Harmony OS教程学习笔记

Java中的异常

【Windows系统编程】03.远线程注入ShellCode

[JavaWeb]【六】web后端开发-请求响应

苹果iOS16曝出新漏洞：飞行模式下依旧可连接网络

【C++】AVL树（平衡二叉树）

广州华锐互动：3D数字孪生开发编辑器助力企业高效开发数字孪生应用

openGauss学习笔记-43 openGauss 高级数据管理-事件触发器

BIO、NIO和AIO

韦东山-电子量产工具项目：页面系统

爬虫逆向实战（三）--天某云登录