pandas基本使用

文章目录

  • pandas基本使用
    • 一、引言
    • 二、安装与导入
      • 1、安装 Pandas
      • 2、导入 Pandas
    • 三、创建数据表
      • 1、创建 DataFrame
      • 2、查看数据
      • 3、数据操作
        • 1.1、数据筛选
        • 1.2、数据排序
        • 1.3、数据分组
    • 四、数据清洗
      • 1、处理缺失值
      • 2、删除重复值
    • 五、数据导出
      • 1、导出到 CSV
      • 2、导出到 Excel
    • 四、总结

pandas基本使用

一、引言

Pandas 是基于 Python 的一个开源数据分析库,它提供了快速、灵活以及富有表达力的数据结构,旨在使数据清洗和分析工作变得更加简单易行。Pandas 包含了 Series 和 DataFrame 两种主要的数据结构,可以用于处理结构化数据。Pandas 广泛用于数据挖掘和数据分析,同时也非常适合处理现实世界中的数据。

二、安装与导入

1、安装 Pandas

在开始使用 Pandas 之前,需要先安装它。可以通过 pip 命令轻松安装:

pip install pandas

2、导入 Pandas

在 Python 代码中使用 Pandas 时,通常使用 pd 作为别名:

import pandas as pd

三、创建数据表

1、创建 DataFrame

DataFrame 是 Pandas 中用于数据处理和分析的主要数据结构,类似于 Excel 中的表格。可以手动创建一个 DataFrame,也可以从外部数据源如 CSV 文件、数据库等导入数据。

data = {'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen'],'Population': [21500000, 24200000, 13500000, 10700000],'Area': [16410, 6340, 7434, 1996]
}
df = pd.DataFrame(data)

2、查看数据

可以使用 head()tail() 方法来查看 DataFrame 的前几行或后几行数据。

print(df.head())  # 查看前五行
print(df.tail())  # 查看后五行

3、数据操作

Pandas 提供了丰富的数据操作功能,包括数据筛选、排序、分组等。

1.1、数据筛选

可以基于条件来筛选数据:

filtered_data = df[df['Population'] > 20000000]
print(filtered_data)
1.2、数据排序

可以对 DataFrame 进行排序:

sorted_data = df.sort_values(by='Population', ascending=False)
print(sorted_data)
1.3、数据分组

可以使用 groupby 方法对数据进行分组:

grouped_data = df.groupby('City')
print(grouped_data)

四、数据清洗

Pandas 在数据清洗方面也非常强大,可以轻松处理缺失值、重复值等。

1、处理缺失值

可以使用 fillna() 方法填充缺失值:

df.fillna(value=0, inplace=True)

2、删除重复值

可以使用 drop_duplicates() 方法删除重复数据:

df.drop_duplicates(inplace=True)

五、数据导出

分析完成后,可以将数据导出到 CSV 或 Excel 文件中。

1、导出到 CSV

使用 to_csv() 方法:

df.to_csv('output.csv', index=False)

2、导出到 Excel

使用 to_excel() 方法:

df.to_excel('output.xlsx', index=False)

四、总结

Pandas 是一个功能强大的数据分析工具,它提供了丰富的数据结构和操作方法,使得数据分析工作变得简单高效。无论是数据清洗、转换还是分析,Pandas 都能提供有效的解决方案。通过本教程,你已经了解了 Pandas 的基本使用方法,包括数据的创建、操作、清洗和导出。


版权声明:本博客内容为原创,转载请保留原文链接及作者信息。

参考文章

  • Pandas 教程 | 菜鸟教程
  • pandas用法-全网最详细教程 - CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/419604.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab读取NC文件(含group)

matlab读取NC文件(含group): NC文件数据结构: 代码: % 打开 NetCDF 文件 filename your_file.nc; % 替换为你的文件名% 使用 netcdf.open 函数打开文件 ncid netcdf.open(filename, NC_NOWRITE);% 查看文件中的组 …

手把手教你使用亚马逊云服务器创建EC2实例

陈老老老板🤴 🧙‍♂️本文专栏:生活(主要讲一下自己生活相关的内容)生活就像海洋,只有意志坚强的人,才能到达彼岸。 🧙‍♂️本文简述:如何使用亚马逊云服务器创建EC2实例。 🧙‍♂…

钢琴灯哪个牌子好?五款学生钢琴灯测评

在这个快节奏的时代,孩子们都面临着长时间用眼的问题,而长时间处于室内不良的光线环境很容易对孩子的视力健康产生影响,对于目前有娃的家庭,很多家长都在给孩子寻找可以提高室内光学环境的钢琴灯,钢琴灯作为一种通过专…

【分支-快速排序】

【分支-快速排序】 1. 颜色分类1.1 题目来源1.2 题目描述1.3 题目解析 2. 排序数组2.1 题目来源2.2 题目描述2.3 题目解析 3. 数组中的第K个最大元素3.1 题目来源3.2 题目描述3.3 题目解析 4. 库存管理 III4.1 题目来源4.2 题目描述4 .3 题目解析 1. 颜色分类 1.1 题目来源 7…

如何使用QT完成记事本程序的UI界面布局

每日QT技巧查询表-CSDN博客 会持续更新记事本编写的全部过程,关注不迷路 一、相关控件 ①水平和垂直布局 ②按键 ③文本框 ④水平弹簧 ⑤标签 ⑥Widget 二、控件使用方法 1、PushButton 拖出三个按键,并对其进行命名,两处地方命名可以不一…

数据结构——线性表(顺序存储结构和单链表结构)

线性表的定义 线性表(List):由零个或多个数据元素组成的有限序列。 (1)它是一个序列,也就是元素之间有个先来后到的; (2)若元素有多个,则第一个元素无前驱…

[数据集][目标检测]人脸口罩佩戴目标检测数据集VOC+YOLO格式8068张3类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):8068 标注数量(xml文件个数):8068 标注数量(txt文件个数):8068 标注…

Spring Boot实现文件上传和下载

1.背景 项目中经常会有上传和下载的需求&#xff0c;这篇文章简述一下springboot项目中实现简单的上传和下载。 2.代码工程 实验目标 实现简单的文件上传和下载 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://…

JDBC:连接数据库

文章目录 报错 报错 Exception in thread “main” java.sql.SQLException: Can not issue SELECT via executeUpdate(). 最后这里输出的还是地址&#xff0c;就是要重写toString()方法&#xff0c;但是我现在还不知道怎么写 修改完的代码&#xff0c;但是数据库显示&#…

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标…

第三次去银行办事,核心是犯了抓不住重点这个毛病

手机银行不小心输错了两次密码&#xff0c;然后就限制了交易&#xff0c;只能在柜台操作。 由此引发了比如提示密码错误、定期转活期、转账等功能的异常。 前两次去银行&#xff0c;竟然只是去解决了这些附带问题。 核心问题是限制非柜面交易啊。 哎 这就是抓不住重点&…

2024年9月最新界面:自己如何在电脑上注册新的Google谷歌账号,图文详解和关键点解析、常见问题

有一些朋友需要通过谷歌账号来工作、学习或娱乐&#xff08;例如很多游戏需要用谷歌账号来注册和使用&#xff09;&#xff0c;但是不知道如何注册谷歌账号&#xff0c;或者知道如何注册&#xff0c;但是对于一些步骤或者注意事项不太熟悉&#xff0c;导致注册不成功&#xff0…

web群集--nginx配置文件location匹配符的优先级顺序详解及验证

文章目录 前言优先级顺序优先级顺序(详解)1. 精确匹配&#xff08;Exact Match&#xff09;2. 正则表达式匹配&#xff08;Regex Match&#xff09;3. 前缀匹配&#xff08;Prefix Match&#xff09; 匹配规则的综合应用验证优先级 前言 location的作用 在 NGINX 中&#xff0…

证书学习(四)X.509数字证书整理

目录 一、X.509证书 介绍1.1 什么是 X.509证书?1.2 什么是 X.509标准?1.3 什么是 PKI?二、X.509证书 工作原理2.1 PKI 的基础——加密算法2.2 PKI 证书编码三、X.509证书 结构3.1 证书字段3.2 证书扩展背景: 我们在日常的开发过程中,经常会遇到各种各样的电子证书文件,其…

Ubuntu: 配置OpenCV环境

从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次&#xff0c;点赞4次&#xff0c;收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、…

vue通过html2canvas+jspdf生成PDF问题全解(水印,分页,截断,多页,黑屏,空白,附源码)

前端导出PDF的方法不多&#xff0c;常见的就是利用canvas画布渲染&#xff0c;再结合jspdf导出PDF文件&#xff0c;代码也不复杂&#xff0c;网上的代码基本都可以拿来即用。 如果不是特别追求完美的情况下&#xff0c;或者导出PDF内容单页的话&#xff0c;那么基本上也就满足业…

ChatGPT+Simple Mind Map生成思维导图:快速提升学习效率

一、告别杂乱笔记&#xff0c;一键生成清晰思维导图&#xff01; 最近开始学习网络安全&#xff0c;一头扎进了各种协议、漏洞、防御机制的海洋中。信息量巨大&#xff0c;知识点零散&#xff0c;让我很快便陷入了“知识焦虑”——笔记越记越多&#xff0c;却越来越混乱&#…

第50课 Scratch入门篇:放烟花

放烟花 故事背景: 水在一个宁静的小镇上,生活着一位充满好奇心和创造力的小朋友。   有一天晚上,小镇的天空格外黑暗,星星也躲在了云层后面。小朋友望着黑漆漆的夜空,心想:要是能有一场绚丽的烟花表演,那该多好啊!于是,他决定用自己所学的 Scratch 编程知识来创造一…

通过域名无法访问不到网站,IP可正常访问(DNS污染)

一 DNS被污染 就在刚刚突然访问不到csdn&#xff0c;域名无法访问如下图&#xff1a; 确认DNS是否解析有问题 1 ping 域名 先ping一下域名&#xff0c;ping 域名后得到ip, ping通了如下图&#xff1a; 2 使用IP访问测试 通过ip再访问网站&#xff0c;ip可以正常访问如下图&…

.NetCore+vue3上传图片 Multipart body length limit 16384 exceeded.

实现目标。点击图片上传头像 效果图 前端部分图片上传关键代码 <div class"avatar-wrap"><el-imagestyle"width: 154px; height: 154px":src"form.headPic":fit"fit"/></div><div class"upload-box"…