4-pandas常用操作


前言


一、DataFrame修改index、columns

1.获取index       

df2 = pd.DataFrame(np.arange(9).reshape(3,3),index=['sh','cs','bj'],columns=['a','b','c'])
df2.index

2.修改index

df2.index = ['shanghai','changsha','beijing']

df2.columns = ['A','B','C'] # 注意赋值的顺序

3.批量修改,通过函数

def test_map(x):
    return x+'_ABC'

# rename()重命名
df2.rename(index=test_map,columns=test_map,inplace=True)  # 给index和columns都运用上面函数的规则.直接df2上进行修改


4.单独修改,通过字典

df2.rename(index={'shanghai_ABC':'shanghai'},columns={'c_ABC':'C'})

二、设置索引set_index

df3.set_index('销售日期',inplace=True)

三、表格合并

1.concat使用

拼接

pd.concat([df4,new_row],ignore_index=True)

pd.concat([df4,new_row],axis=1)

代码如下(示例):

import pandas as pddata = {'Date': ['2023-09-01', '2023-09-02', '2023-09-03'],'Steps': [8000, 9000, 7500]  # 步数
}
df4 = pd.DataFrame(data)new_data = {'Date':'2023-09-04','Steps':8000}
new_row = pd.DataFrame([new_data])pd.concat([df4,new_row],ignore_index=True)

2.merge使用

pd.merge(user_df,buy_df,on='CustomerID',how='inner')  
how='inner'求交集  默认设置how='inner'

代码如下(示例):

import pandas as pd
user_data = {'CustomerID': [1, 2, 3, 4, 5],'Name': ['Rose', 'Bob', 'Jack', 'David', 'Lucy'],'Email': ['rose@163.com', 'bob@163.com', 'jack@163.com', 'david@163.com', 'lucy@163.com']
}
user_df = pd.DataFrame(user_data)buy_data = {'CustomerID': [1, 2, 1, 3, 4, 3, 6],'OrderID': [101, 102, 103, 104, 105, 106, 107],'Product': ['A', 'B', 'C', 'D', 'E', 'A', 'B'],'Quantity': [2, 1, 3, 2, 4, 1, 2]
}
buy_df = pd.DataFrame(buy_data)pd.merge(user_df,buy_df,on='CustomerID',how='inner')  # how='inner'求交集  默认设置how='inner'
pd.merge(user_df,buy_df,on='CustomerID',how='outer')  # how='outer' 求并集pd.merge(user_df,buy_df,on='CustomerID',how='left')   # how='left'左连接pd.merge(user_df,buy_df,on='CustomerID',how='right')  # how='right'右连接

3.join使用

基于索引合并
students_df.join(scores_df,on='StudentID',how='inner')  # 默认how='left'
代码如下(示例):
students_data = {'StudentID': [1, 2, 3, 4, 5],'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],'Age': [18, 19, 18, 20, 19]
}
students_df = pd.DataFrame(students_data)
students_df.set_index('StudentID',inplace=True)scores_data = {'StudentID': [1, 2, 3, 4, 5],'Math': [90, 85, 92, 78, 88],'Science': [88, 87, 91, 79, 90]
}
scores_df = pd.DataFrame(scores_data)
scores_df.set_index('StudentID',inplace=True)students_df.join(scores_df,on='StudentID',how='inner')  # 默认how='left'

四,数据查询

1.df3.info()  # 查看数据类型

2.df3.query('A>2')  查询,引号内是筛选的条件

df3.query('(A>2) and (B<40)')

data = {'A': [1, 2, 3, 4, 5],'B': [10, 20, 30, 40, 50]
}
df3 = pd.DataFrame(data)df3[df3['A']>2]df3.query('A>2')  # 查询   条件一定要用引号   然后引号内是筛选的条件

3.isin

data = {'City': ['长沙', '北京', '上海', '成都', '云南'],'Population (millions)': [84, 39, 27, 23, 15]
}
df4 = pd.DataFrame(data)
df4[df4['City'].isin(['长沙','成都'])]  # df4['City'].isin(['长沙']) City列是否包含指定内容,isin()里接列表

五,拆包 

1.展开为多列

df5[['a','b','c']] = df5['B'].apply(pd.Series)
df5['B'].apply(pd.Series)
data = {'A': [1, 2, 3],'B': [['x', 'y'], ['p', 'q', 'r'], ['m']]
}
df5 = pd.DataFrame(data)df5[['a','b','c']] = df5['B'].apply(pd.Series)

2. 展开多行

df5.explode('B')

六、拓展

1.添加整行数据
df3.loc[4] =['hadoop入门到精通','**',100,10]

2.regex=True启用正则

df6['价格'].replace({'\$':'',',':''},regex=True).astype(float)

3.jyputer中光标定位到函数内,shift+tab出参数提示


总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/495626.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RK3506开发板:智能硬件领域的新选择,带来卓越性能与低功耗

在现代智能硬件开发中&#xff0c;选择一款性能稳定、功耗低的开发板是确保产品成功的关键。Rockchip最新推出的RK3506芯片&#xff0c;凭借其卓越的能效比、多功能扩展性和优秀的实时性能&#xff0c;已经成为智能家电、工业控制、手持终端等领域的热门选择。而基于RK3506的Ar…

【AIGC-ChatGPT进阶副业提示词】星际占卜师:探索星象能量的艺术【限时免费阅读,一天之后自动进入进阶课程】

引言 在这个数字化的时代&#xff0c;我们创造了一个独特的角色 —— 星际占卜师。这不仅是一个简单的运势预测工具&#xff0c;更是一个融合了玄学、预言和能量解读的智能向导。通过精心设计的系统提示词和独特的画境生成机制&#xff0c;星际占卜师能够为用户带来沉浸式的占…

机器学习之PCA降维

主成分分析&#xff08;PCA&#xff0c;Principal Component Analysis&#xff09; 主成分分析&#xff08;PCA&#xff09;是一种常见的无监督学习技术&#xff0c;广泛应用于数据降维、数据可视化以及特征提取等任务。PCA的目标是通过线性变换将数据从高维空间映射到低维空间…

SOTA简繁中文拼写检查工具:FASPell Chinese Spell Checker 论文

拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法&#xff0c;如果提升 100W 倍的性能&#xff1f; NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正&#xff1f;可我只会写 CRUD 啊&#xff01; 一个提升英文单词拼…

Visual Studio Code历史版本下载

本章教程&#xff0c;介绍如何找到Visual Studio Code的历史版本官方下载地址。 一、历史版本下载地址 下载地址&#xff1a;https://code.visualstudio.com/updates/ 二、常用版本下载地址 August 2017 (version 1.16)&#xff1a;https://code.visualstudio.com/updates/v1_…

Kubernetes(k8s)离线部署DolphinScheduler3.2.2

1.环境准备 1.1 集群规划 本次安装环境为&#xff1a;3台k8s现有的postgreSql数据库zookeeper服务 1.2 下载及介绍 DolphinScheduler-3.2.2官网&#xff1a;https://dolphinscheduler.apache.org/zh-cn/docs/3.2.2 官网安装文档&#xff1a;https://dolphinscheduler.apach…

【自动化测试】windows下安装Selenium浏览器界面测试工具

Date: 2024.12.23 10:15:53 author: lijianzhan 简述&#xff1a;这篇教程详细介绍了如何在Windows环境下安装selenium&#xff0c;并设置Chrome浏览器驱动。什么是Selenium&#xff1f;Selenium是一个基于浏览器的自动化测试工具&#xff0c;它提供了一种跨平台、跨浏览器的端…

如何在 Ubuntu 22.04 上安装 phpMyAdmin

简介 PHPMyAdmin 是在 Ubuntu 22.04 上管理 MySQL 数据库的绝佳选择。它是一个流行的工具&#xff0c;拥有简单、高效且用户友好的基于 Web 的界面&#xff0c;让你能够轻松地管理 MySQL 数据库。因此&#xff0c;许多开发人员、数据库管理员和网站所有者都信任 PHPMyAdmin 来…

大数据-256 离线数仓 - Atlas 数据仓库元数据管理 正式安装 启动服务访问 Hive血缘关系导入

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; Java篇开始了&#xff01; 目前开始更新 MyBatis&#xff0c;一起深入浅出&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff0…

[Python3] Sanic中间件

在 Sanic 中&#xff0c;中间件&#xff08;middleware&#xff09;是指在请求和响应之间执行的代码。它们是一个非常强大的工具&#xff0c;用于处理请求的预处理、响应的后处理、全局错误处理、日志记录、认证、权限校验、跨域资源共享&#xff08;CORS&#xff09;等任务。中…

使用 OpenCV 绘制线条和矩形

OpenCV 是一个功能强大的计算机视觉库&#xff0c;它不仅提供了丰富的图像处理功能&#xff0c;还支持图像的绘制。绘制简单的几何图形&#xff08;如线条和矩形&#xff09;是 OpenCV 中常见的操作。在本篇文章中&#xff0c;我们将介绍如何使用 OpenCV 在图像上绘制线条和矩形…

操作系统课程设计

摘 要 本项目旨在深入设计与实现一套基于Java的模拟操作系统&#xff0c;模拟和实现常见操作系统的核心功能&#xff0c;包括进程管理、内存分配与调度、高效的文件系统和多样化设备的管理。通过该模拟操作系统的开发&#xff0c;探索计算机操作系统的基础理论与实际工程细节…

css改变输入右下角图标

前言 正常情况下&#xff0c;HTML textarea 多行文本输入框会存如下图所示图标&#xff0c; 用户可拉动它改变高度&#xff0c;这是我们不想看到的&#xff0c;所以要去掉它。 去掉后&#xff1a; 解决方案 设置 resize 属性即可&#xff0c;如下代码所示&#xff1a; <…

HTML-CSS(day01)

W3C标准&#xff1a; W3C&#xff08; World Wide Web Consortium&#xff0c;万维网联盟&#xff09; W3C是万维网联盟&#xff0c;这个组成是用来定义标准的。他们规定了一个网页是由三部分组成&#xff0c;分别是&#xff1a; 三个组成部分&#xff1a;&#xff08;1&…

2024-12-24 NO1. XR Interaction ToolKit 环境配置

文章目录 1 软件配置2 安装 XRToolKit3 配置 OpenXR4 安装示例场景5 运行测试 1 软件配置 Unity 版本&#xff1a;Unity6000.0.26 ​ 2 安装 XRToolKit 创建新项目&#xff08;URP 3D&#xff09;&#xff0c;点击进入 Asset Store。 进入“Unity Registry”页签&#xff0…

C语言基础——指针(4)

一&#xff0e; 字符指针变量 字符指针变量的使用和整型指针变量的使用方法相似&#xff0c;以下是其基本使用方法的例子&#xff1a; &#xff08;1&#xff09;字符指针变量还有一种使用方法&#xff1a; const char* p "abcd" 需…

week 11 - BCNF

1. More on functional dependencies (功能依赖的更多内容) Lossless decomposition (无损分解) 研究如何在分解表的过程中不丢失信息&#xff0c;也就是说&#xff0c;通过分解后的表可以无损地重建原始表。 2. BCNF (Boyce-Codd Normal Form, BCNF范式) &#xff08;1&…

嵌入式学习-QT-Day06

嵌入式学习-QT-Day06 六、多窗口编程 1、QMessageBox 消息对话框 2、QWidget类 3、parent参数 4、堆栈窗口&#xff08;QStackedWidget&#xff09; 5、新建自定义窗口类 6、对象传值 6.1 父对象 → 子对象 6.2 子对象 → 父对象 7、事件机制 8、QMainWindow主窗口类 8.1 QMenu…

《战神:诸神黄昏》游戏运行时提示找不到gamede.dll文件怎么办?gamede.dll丢失的修复指南

在沉浸于《战神&#xff1a;诸神黄昏》的壮阔世界时&#xff0c;突然弹出的“找不到gamede.dll文件”错误提示可能会让玩家措手不及。作为一名经验丰富的软件开发从业者&#xff0c;我深知这类问题对游戏体验的影响。今天&#xff0c;我将为大家详细解析gamede.dll文件丢失的原…

1.系统学习-线性回归

系统学习-线性回归 前言线性回归介绍误差函数梯度下降梯度下降示例 回归问题常见的评价函数1. MAE, mean absolutely error2. MSE, mean squared error3. R square &#xff08;决定系数或R方&#xff09; 机器学习建模流程模型正则化拓展阅读作业 链接: 2.系统学习-逻辑回归 …