初识Pandas函数是Python的一个库(继续更新...)

    
学习网页: 

Welcome to Python.orghttps://www.python.org/https://www.python.org/icon-default.png?t=N7T8https://www.python.org/

Pandas函数库

Pandas是一个Python库,提供了大量的数据结构和数据分析工具,包括DataFrame和Series等。Pandas的函数非常丰富,可以用于数据的各种操作和处理。

以下是一些Pandas函数的基本用法

  1. 读取数据

    • pandas.read_csv(filename):读取CSV文件。
    • pandas.read_excel(filename):读取Excel文件。
    • pandas.read_sql(sql, con):从SQL数据库中读取数据。
  2. 数据清洗

    • DataFrame.dropna():删除含有空值的行或列。
    • DataFrame.fillna(value):填充空值。
    • DataFrame.replace():替换值。
  3. 数据筛选

    • DataFrame.loc[]:基于标签进行筛选。
    • DataFrame.iloc[]:基于整数位置进行筛选。
  4. 数据排序

    • DataFrame.sort_values():根据列的值进行排序。
  5. 数据聚合

    • DataFrame.groupby():根据某一列或多列的值进行分组。
    • DataFrame.agg():对分组后的数据进行聚合操作,如求和、求平均等。
  6. 数据重塑

    • DataFrame.pivot():创建数据透视表。
    • DataFrame.melt():将宽格式数据转换为长格式数据。
  7. 数据连接

    • pandas.concat(objs, axis=0):沿着axis=0(即行方向)连接多个对象。
  8. 绘图

    • DataFrame.plot():绘制图表。
  9. 缺失值处理

    • DataFrame.dropna():删除含有空值的行或列。
    • DataFrame.fillna():填充空值。
  10. 重复值处理

  • DataFrame.drop_duplicates():删除重复的行。11.
  •      .时间序列处理: 
  • pandas.to_datetime():将字符串、整数、浮点数或日期对象转换为日期时间对象。
  • pandas.resample():对时间序列数据进行重采样。

    12.其他常用函数

  • DataFrame.info():显示DataFrame的信息概览。
  • DataFrame.describe():显示DataFrame的描述统计信息。
  • Series.map()Series.apply():对Series中的每个元素应用函数。
  • DataFrame.apply()DataFrame.applymap():对DataFrame中的每个元素或每个单元格应用函数。

小结

这只是Pandas功能的一个子集,Pandas还有许多其他功能和函数,建议查看官方文档或相关教程以获得更全面的了解。

  • 以下是一些Pandas函数的示例

  • 1、读取数据

    • 读取CSV文件:

      python`import pandas as pd df = pd.read_csv('data.csv')`

    • 读取Excel文件:

      python`import pandas as pd 
      df = pd.read_excel('data.xlsx')`

  • 2、数据清洗

    • 删除空值:

      python`df = df.dropna() # 删除含有空值的行或列`

    • 填充空值:

      python`df['column_name'].fillna(value='new_value', inplace=True) # 填充指定列的空值`

  • 3、数据筛选和查询

    • 使用标签选择数据:

      python`df = df.loc[df['column_name'] == 'value'] # 选择某一列中值为'value'的行`

  • 4、数据排序

    • 根据某一列的值进行排序:

      python`df = df.sort_values('column_name') # 对指定列进行升序排序`

  • 5、数据聚合和统计:

    python`df = df.groupby('column_name').sum() # 对按指定列分组的每组数据进行求和操作`

  • 6、数据重塑和转换

    • 将宽格式数据转换为长格式数据:
      ```pythondf = df.melt('column_name') # 将宽表转换为长表,'column_name'为转换的键列

      “举个栗子”

    • 以下是一个使用Pandas进行数据处理的实际例子:

      假设我们有一个包含员工信息的CSV文件,文件名为"employees.csv",内容如下:

      id,name,age,department  
      1,Alice,28,Sales  
      2,Bob,30,Marketing  
      3,Charlie,25,HR  
      4,David,35,Sales  
      5,Eve,29,Marketing

      我们想要对员工信息进行以下处理:

    • 读取CSV文件并将其转换为DataFrame对象。
    • 删除空值和重复行。
    • 下面是相应的Pandas代码示例:

    • 根据部门对员工进行分组,并计算每个部门的平均年龄。
    • 筛选出平均年龄大于25岁的部门。
    • 显示每个部门的员工人数。
      import pandas as pd  # 读取CSV文件  
      df = pd.read_csv('employees.csv')  # 删除空值和重复行  
      df = df.dropna().drop_duplicates()  # 根据部门对员工进行分组,并计算每个部门的平均年龄  
      average_age = df.groupby('department')['age'].mean()  # 筛选出平均年龄大于25岁的部门  
      filtered_departments = average_age[average_age > 25].index.tolist()  # 显示每个部门的员工人数  
      department_counts = df[df['department'].isin(filtered_departments)]['department'].value_counts()  print(department_counts)

      运行以上代码后,将输出每个部门的员工人数,其中平均年龄大于25岁的部门将被筛选出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/218567.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot3.1.6配置对应的Swagger

1. pom.xml导入Swagger依赖 <!--swagger3--> <dependency><groupId>org.springdoc</groupId><artifactId>springdoc-openapi-starter-webmvc-ui</artifactId><version>2.0.2</version> </dependency> 2.创建SwaggerCo…

自动化访客互动:提升网站效益与用户体验的关键优势

在激烈的市场竞争环境中&#xff0c;想抢占市场&#xff0c;获得收益并不容易。每一个订单的完成都要经过一定的销售周期&#xff0c;所以企业可以根据销售周期每个阶段的特点进行优化&#xff0c;留住客户。其中&#xff0c;企业可以在与客户在线互动的过程中&#xff0c;让互…

【第2期】Springboot如何快速集成SpringSecurity

简单介绍 本专栏主要结合实战讲解&#xff0c;不过多介绍细节的概念&#xff0c;概念可以通过搜索引擎查找&#xff0c;一搜一大把&#xff0c;切入正题。 本专栏的实战项目是基于SpringbootSpringSecurityRSAJWTVUE的全栈开发项目&#xff0c;每个环节都会专门讲&#xff0c;…

C语言 文件I/O(备查)

所有案列 跳转到其他。 文件打开 FILE* fopen(const char *filename, const char *mode); 参数&#xff1a;filename&#xff1a;指定要打开的文件名&#xff0c;需要加上路径&#xff08;相对、绝对路径&#xff09;mode&#xff1a;指定文件的打开模式 返回值&#xff1a;成…

遥感图像分割系统:融合空间金字塔池化(FocalModulation)改进YOLOv8

1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义 遥感图像分割是遥感技术领域中的一个重要研究方向&#xff0c;它的目标是将遥感图像中的不同地物或地物类别进行有效的分割和识别。随着遥感技术的不断发展和遥感…

2024年高效远程协同运维工具推荐

随着企业的不断发展以及变化&#xff0c;企业的内部IT环境也是日益复杂&#xff0c;一跨高效远程协同运维工具必不可少&#xff0c;不仅可以提高生产力&#xff0c;还能降低运营成本。这里就给大家推荐2024年高效远程协同运维工具。 高效远程协同运维工具应用场景 1、IT运维管…

(五)STM32 按键输入实验及 GPIO做普通 IO 的注意事项

目录 1. 按键硬件连接 2. 按键软件设计 3. 按键消抖 4. 使用 IO 口时的 注意事项&#xff08;踩坑&#xff09; 上一节我们介绍了 STM32F1 的 IO 口作为输出的使用&#xff0c;这一章&#xff0c;我们将介绍如何使用 STM32F1 的 IO 口作为输入用。在本章中&#xff0c;我们…

modbus 通信协议介绍与我的测试经验分享

1、简介 Modbus 协议是一种通信协议&#xff0c;用于工业自动化系统中的设备间通信。该协议最初由 Modicon 公司开发&#xff0c;并于 1979 年发布。 Modbus 协议通过串行通信格式进行通信&#xff0c;在物理层上支持 RS-232、RS-422 和 RS-485 等多种通信方式。在协议层面&am…

Guardrails for Amazon Bedrock 基于具体使用案例与负责任 AI 政策实现定制式安全保障(预览版)

作为负责任的人工智能&#xff08;AI&#xff09;战略的一部分&#xff0c;您现在可以使用 Guardrails for Amazon Bedrock&#xff08;预览版&#xff09;&#xff0c;实施专为您的用例和负责任的人工智能政策而定制的保障措施&#xff0c;以此促进用户与生成式人工智能应用程…

redis未授权漏洞复现

什么是redis redis就是个数据库&#xff0c;跟mysql不同的地方在于redis主要将数据存在内存中&#xff0c;读写速度非常快 redis未授权 其原因很简单&#xff0c;就是redis服务器在默认安装好不配置的情况下可以直接免密码登录&#xff0c;登录后在web目录写入一句话木马&am…

【Spark精讲】RDD特性之数据本地化

目录 首选运行位置 数据的本地化级别 谁来负责数据本地化 数据本地化执行流程 调优 代码中的设置方法 首选运行位置 上图红框为RDD的特性五&#xff1a;每个RDD的每个分区都有一组首选运行位置&#xff0c;用于标识RDD的这个分区数据最好能够在哪台主机上运行。通过RDD的…

亚信科技AntDB数据库——深入了解AntDB-M元数据锁的相关概念

AntDB-M在架构上分为两层&#xff0c;服务层和存储引擎层。元数据的并发管理集中在服务层&#xff0c;数据的存储访问在存储引擎层。为了保证DDL操作与DML操作之间的一致性&#xff0c;引入了元数据锁&#xff08;MDL&#xff09;。 AntDB-M提供了丰富的元数据锁功能&#xff…

leetcode 236. 二叉树的最近公共祖先

leetcode 236. 二叉树的最近公共祖先 题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个节点 p、q&#xff0c;最近公共祖先表示为一个节点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽…

4G无线工业级路由器在智能制造设备互联互通中的角色

随着工业技术的不断发展和进步&#xff0c;智能制造已经成为了现代制造业的重要趋势和发展方向。而在智能制造过程中&#xff0c;设备之间的互联互通是至关重要的一环。在这个过程中&#xff0c;4G无线工业级路由器扮演着重要的角色&#xff0c;它提供了稳定可靠的网络连接&…

Vue3项目中集成mars3D简单三部曲

Vue3项目中集成mars3D简单三部曲 这里是参考网址&#xff0c;大佬可以点击一件跳转 1.安装依赖 npm install vite-plugin-mars3d --save-dev2.修改 vite.config.ts 配置文件 import { defineConfig } from vite; import { mars3dPlugin } from vite-plugin-mars3d;export d…

Go开发运维:Go服务发布到K8S集群

目录 一、实验 1.Go服务发布到k8s集群 二、问题 1.如何从Harbor拉取镜像 一、实验 1.Go服务发布到k8s集群 &#xff08;1&#xff09;linux机器安装go(基于CentOS 7系统) yum install go -y &#xff08;2&#xff09;查看版本 go version &#xff08;3&#xff09;创…

vue3 setup语法糖写法基本教程

前言 官网地址&#xff1a;Vue.js - 渐进式 JavaScript 框架 | Vue.js (vuejs.org)下面只讲Vue3与Vue2有差异的地方&#xff0c;一些相同的地方我会忽略或者一笔带过与Vue3一同出来的还有Vite&#xff0c;但是现在不使用它&#xff0c;等以后会有单独的教程使用。目前仍旧使用v…

GZ015 机器人系统集成应用技术样题3-学生赛

2023年全国职业院校技能大赛 高职组“机器人系统集成应用技术”赛项 竞赛任务书&#xff08;学生赛&#xff09; 样题3 选手须知&#xff1a; 本任务书共 26页&#xff0c;如出现任务书缺页、字迹不清等问题&#xff0c;请及时向裁判示意&#xff0c;并进行任务书的更换。参赛队…

自定义日志打印功能--C++

一、介绍 日志是计算机程序中用于记录运行时事件和状态的重要工具。通过记录关键信息和错误情况&#xff0c;日志可以帮助程序开发人员和维护人员追踪程序的执行过程&#xff0c;排查问题和改进性能。 在软件开发中&#xff0c;日志通常记录如下类型的信息&#xff1a; 事件信…

Go delve调试工具的简单应用

Delve是个啥 Delve is a debugger for the Go programming language. The goal of the project is to provide a simple, full featured debugging tool for Go. Delve should be easy to invoke and easy to use. Chances are if you’re using a debugger, things aren’t go…