pandas
pandas:就是一个可以处理数据的 python 库
核心功能:
- 数据的清洗:处理丢失值,重复值
- 数据分析:计算和统计信息,或分组汇总
- 数据可视化:结合 图标库(Matplotlib)完成数据可视化
pandas的应用领域:
数据科学与机器学习:处理数据集
金融分析:时间序列数据,股票的价格走势分析
商业智能:销售数量分析,客户行为分析
科研领域:分析实验数据,生成报告
…
如何使用pandas:
需要安装:
python 中安装 库或模块需要使用一个内置的命令 pip install 模块或库名
pip 可以同时安装多个模块:
- pip install 模块1 模块2 …
pip install pandas 只安装 pandas
pip install pandas(数据处理) numpy(数据处理) matplotlib(数据可视化)
安装的过程需要网络
如何验证 pandas 是否安装成功
在python 文件中 引入pandas
在python中 引入模块需要使用 import as 别名
- 下载pandas
- 在vs code里的 终端下打入代码下载
- 验证是否下载成功
# 验证pandas是否下载成功# 引入 pandas
import pandas as pd
# 查看pandas版本 __version__
print("pandas的版本为:",pd.__version__)pandas的版本为: 2.2.3