Python语言学习-pandas库学习

一、什么是Pandas库

Pandas是python的第三方库,他用于灵活的数据操作,数据可视化,数据清洗,数据的聚合和转换,数据的可视化

二、安装pandas库

在终端中运行

pip install pandas

导入Pandas库并重命名为pd

import pandas as pd

三、操作教学 

1.基础操作

我想存储一些人的信息和对应的数据

import pandas as pd
df = pd.DataFrame({"Name": ["Alice", "Bob", "Charlie"],"Age": [25, 30, 35],"City": ["New York", "Los Angeles", "Chicago"]}
)
print(df)

 结果如下:

DataFrame是一个二维数据结构,可以存储 不同类型的 (包括字符、整数、浮点值、 分类数据等)。它类似于电子表格,每一行都有自己的列标签和值

2.拿取指定列的数据

df['City']

打印的结果为:

3.从头开始创建DataFrame

a = pd.Series(["黑色","红色","白色"],name="color")
print(a)

我们打印出来的结果是:

4.如果你只是对你表的统计的数据感兴趣的话 

df = pd.DataFrame({"Name": ["Alice", "Bob", "Charlie"],"Age": [25, 30, 35],"City": ["New York", "Los Angeles", "Chicago"]}
)
print(df.describe())

结果为:

 5.分析csv文件中的数据

如果只读取数据

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df)

结果为:

如果你只想看前几行的数据

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df.head(8))

结果为:

如果你想分析每列的数据类型 

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df.dtypes)

结果为:

如果你想读取更加详细的数据 

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df.info)

结果为:

6.excel表格的操作 

与csv同理,读取方法换成read_excel()这个就可以了

7.如何选择感兴趣的列呢 

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df['order_no'])

结果为:

需要选择多个列直接使用逗号拼接在中括号里面就OK了

如果你想知道返回数据的行数以及列数 

df = pd.read_csv("C:/Users/23226/Desktop/order_food.csv")
print(df[["order_no"]].shape)

结果为:

请注意,返回的数据包括行数和列数 

如果你想筛选固定条件的数据 

above_35 = df[df["Age"] > 35]

结果为:

如果你想检查数据是否大于某个值:

df["Age"] > 35

结果为:

如果你对某个列中的多个值的数据感兴趣

class_23 = df[df["Pclass"].isin([2, 3])]

isin中放入的是数据,df中放置的是列名

结果为: 

 

那么组合多个条件查询怎么办呢 

df[(df["Pclass"] == 2) | (df["Pclass"] == 3)]

结果为:

如果你想验证列中的数据是不是空值 

age_no_na = df[df["Age"].notna()]

筛选出所有“Age”列不为缺失值(NaN)的行,并将结果存储在一个新的 DataFrame 变量 

结果为

那么如果我对一个列名下35以上的人的姓名感兴趣呢

adult_names = df.loc[df["Age"] > 35, "Name"]

结果为:

如果我对特定行到特定行,特定列到特定列的数据感兴趣 

df.iloc[9:25, 2:5]

结果为:

切记 

  • 选择数据子集时,使用方括号。[]

  • 在这些括号内,您可以使用单个列/行标签、列表 的列/行标签、标签切片、条件表达式或 一个冒号。

  • 使用行时选择特定行和/或列 和列名称。loc

  • 使用 在表中的位置。iloc

  • 您可以根据 / 为选择分配新值。lociloc

8.增加列

df = pd.read_excel("C:/Users/23226/Desktop/ce.xlsx",sheet_name="sheet")
print(df)
df["超级无敌"] = df["实付金额"]*100
print(df.head())

等号前面为你要新增加的列名,后面是原本存在的列名,执行之后会帮我们新建一个列名“超级无敌”

运行结果为:

 

且等号后面的数据是可以和其他类的数据运算或者直接运算的 

9.修改列名

df = pd.read_excel("C:/Users/23226/Desktop/ce.xlsx", sheet_name="sheet")
print(df)
c = df.rename(columns={"订单编号": "订单ID"})
print(c)

columns中键值对里面的key是原表格中的列,value是要替换的列名

结果为:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/427841.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年9月第3周AI资讯

阅读时间:3-4min 更新时间:2024.9.16-2024.9.20 目录 OpenAI 推出 o1:一种新的“推理”人工智能模型 微软为 Excel 和 Word 添加了更快的 Copilot World Labs 利用 AI 创建 3D 世界 AI 利用文本创建开放世界视频游戏 OpenAI 推出 o1&#x…

【vue element-ui】关于删除按钮的提示框,可一键复制

实现效果: Delete: function (id) {this.$confirm(此操作将永久删除该文件, 是否继续?, 提示, {confirmButtonText: 确定,cancelButtonText: 取消,type: warning,center: true,}).then(() > {Delete(id).then(() > {this.$message({type: success,message: 删…

工业交换机如何保证数据的访问安全

在现代工业自动化环境中,工业交换机作为关键的网络设备,扮演着数据传输和信息交互的重要角色。为了确保数据的访问安全,工业交换机不仅具备高效的转发性能,还集成了多层次的安全防护机制,以抵御各种潜在的网络威胁。 首…

传输大咖44 | 云计算企业大数据迁移如何更安全高效?

在云计算时代,数据已成为企业最宝贵的资产之一。对于依赖云服务的企业和组织来说,大数据迁移是实现业务扩展和优化的关键步骤。然而,这一过程并非没有挑战。传统的文件传输方式在安全性、稳定性和速度上往往无法满足云计算企业的需求。本文将…

C++(Qt)软件调试---断点高级用法(20)

C(Qt)软件调试—断点高级用法(20) 文章目录 C(Qt)软件调试---断点高级用法(20)[toc]1、概述2、断点高级用法1.1 条件断点1.2 日志断点/记录点/消息追踪点1.3 函数断点1.4 命中次数断点1.5 异常断点1.6 等待断点/触发断点1.7 临时断…

掌握数据中心虚拟化:关键挑战与解决方案

数据中心虚拟化是使用云软件平台将物理数据中心转变为数字数据中心的过程,使企业能够远程访问信息和应用程序。它包括在数据中心内创建物理基础设施的多个虚拟版本,通过将服务器、存储和网络等资源划分为虚拟实体来实现资源的高效利用。 虚拟化环境中的关…

Tomcat CVE-2017-12615 靶场攻略

漏洞描述 当 Tomcat运⾏在Windows操作系统时,且启⽤了HTTP PUT请求⽅法(例如,将 readonly初始化参数由默认值设置为false),攻击者将有可能可通过精⼼构造的攻击请求数据包向服务器上传包含任意代 的 JSP ⽂件&#xf…

MySQL —— 索引

索引的概念 MySQL的索引是⼀种数据结构,它可以帮助数据库高效地查询、更新数据表中的数据。索引通过 ⼀定的规则排列数据表中的记录,使得对表的查询可以通过对索引的搜索来加快速度。 MySQL索引类似于书籍的目录,通过指向数据行的位置&…

Docker + Win 10 学习记录

下载Docker Release notes | Docker Docs 推荐使用4.33版本,最新的Docker版本在win10 22H2无法安装。需要升级到win11. 查看Win10版本是否与最新版的Docker兼容 运行 win R, 然后输入winver 如果你的Docker版本无法在当前的win10安装,请更…

基于云计算的虚拟电厂负荷预测

基于云计算的虚拟电厂负荷预测 随着电网规模的扩大及新能源的不断应用,并网电网的安全性和经济性备受关注。 电网调度不再是单一或局部控制,而是采用智能网络集成方式调度 。 智能电网应具有以下特点:坚强自愈,可以抵御外来干扰甚…

如何删除EXCELL文件中的空行?

1,选择某一列 2,点击《开始》《查找和选择》>《定位条件》,调出《定位条件》的选择框; 3,在定位条件选项框,选择《空值》; 4,找到变灰被选中的某一行,右击《删除》 5&…

Qt 构建版本

Qt提供了三种不同的构建版本:Debug版本(调试版本)、Release版本(发布版本)和Profile版本(概述版本),每种版本都有其特定的用途和编译设置。 Debug版本(调试版本&#x…

基于 SpringBoot 的在线考试系统

专业团队,咨询就送开题报告,欢迎大家私信留言,联系方式在文章底部 摘 要 网络的广泛应用给生活带来了十分的便利。所以把在线考试管理与现在网络相结合,利用java技术建设在线考试系统,实现在线考试的信息化管理。则对…

Python类及元类的创建流程

Python类及元类的创建流程 代码运行结果再看type和object的关系和约定type和object具有的方法不一样看代码和运行结果,可以完全理解python的执行过程。再补充几点, 代码 class MetaCls(type):print(0>>>, MetaCls, 0)def __init__(self, name,…

uniapp vue3 梯形选项卡组件

实现的效果图&#xff1a; 切换选项卡显示不同的内容&#xff0c;把这个选项卡做成了一个组件&#xff0c;需要的自取。 // 组件名为 trapezoidalTab <template> <view class"pd24"><view class"nav"><!-- 左侧 --><view cla…

idea启动oom了解决

解决 Error:java: java.lang.OutOfMemoryError: WrappedJavaFileObject[org.jetbrains.jps.javac.InputFileObject[file:///D:/mingan/pb/backend/src/main/java/com/cy/backend/service/impl/StorageServiceImpl.java]]pos36199: WrappedJavaFileObject[org.jetbrains.jps.j…

你是不是分不清哪些字体是商用,哪些非商用?快来看,免得莫名其妙负债。

前言 最近发现有好多小伙伴在做PPT的时候&#xff0c;都有一个很不好的习惯&#xff1a;没有调整好字体。 这里说的没有调整好字体的意思是&#xff1a;在一些公开发布的内容上使用一些可能造成侵权的字体。 字体侵权‌的后果相当严重。轻者可能面临法律纠纷&#xff0c;重者…

consul服务注册发现与配置中心

目录 1 consul安装与运行 1.1 下载方式 1.2 安装 1.3 启动 1.4 访问方式 2 consul 实现服务注册与发现 2.1 引入 2.2 服务注册 2.3 服务发现 3 consul配置中心 3.1 基础配置 Eureka已经停止更新了&#xff0c;consul是独立且和微服务功能解耦的注册中心&#xff0c;…

Nginx配置虚拟主机

基于域名的虚拟主机 修改配置 进入nginx里的conf目录 修改nginx配置文件nginx.conf vi nginx.conf worker_processes auto;(自动识别CPU数) worker_rlimit_nofile 20480;&#xff08;指定 worker 子进程可以打开的最大文件句柄数&#xff0c;默认为1024&#xff09; use …

杀死端口占用的进程

1、查看端口的进程&#xff0c;以9023为例 &#xff08;1&#xff09;方法1 netstat -tunpl|grep 9023 &#xff08;2&#xff09;方法2 ss -tulpan |grep 9023 &#xff08;3&#xff09;方法3 netstat -ntlp |grep 9023 &#xff08;4&#xff09;方法4 lsof -i:9023 …