Python 数据分析重点知识点
本系列不同其他的知识点讲解,力求通过例子让新同学学习用法,帮助老同学快速回忆知识点
可视化系列:
- Python基础
- 数据分析工具
- 数据处理与分析
- 数据可视化
- 机器学习基础
四、数据可视化
图表类型与选择
- 根据数据特点和分析目的选合适图表类型。
图形大全解析 非常全面
可视化技巧
- ①设置中文字体
# 设置中文字体
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
- ②通过subplots函数创建多个子图,并调整布局
# subplots详解
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
# 设置中文字体
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
# 创建数据
# 生成从0到10的等间距数组,共100个数值
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)
y3 = np.tan(x)
y4 = np.exp(x / 10)# 创建2x2的子图网格
fig, axs = plt.subplots(2, 2, figsize=(10, 8))# 在第一个子图中绘制正弦曲线
axs[0, 0].plot(x, y1, label='sin(x)')
axs[0, 0].set_title('正弦曲线')
axs[0, 0].legend() #用于生成图例# 在第二个子图中绘制余弦曲线
axs[0, 1].plot(x, y2, label='cos(x)', color='r')
axs[0, 1].set_title('余弦曲线')
axs[0, 1].legend()# 在第三个子图中绘制正切曲线
axs[1, 0].plot(x, y3, label='tan(x)', color='g')
axs[1, 0].set_title('正切曲线')
axs[1, 0].legend()# 在第四个子图中绘制指数曲线
axs[1, 1].plot(x, y4, label='exp(x/10)', color='m')
axs[1, 1].set_title('指数曲线')
axs[1, 1].legend()# 自动调整布局
plt.tight_layout()# 显示图表
plt.show()
fig, axs = plt.subplots(2, 2, figsize=(10, 8)) 是 Matplotlib
库中的一个函数调用,用于创建一个包含多个子图(subplot)的图形对象。这个函数返回两个对象:
fig:这是一个 Figure 对象,表示整个图形或画布。你可以使用它来设置图形的整体属性,比如标题、大小等。
axs:这是一个包含多个 Axes 对象的数组。每个 Axes 对象代表一个子图。在这个例子中,axs 是一个 2x2的数组,因此共有四个子图。
- ③使用Echarts结合Python
-
使用Python进行数据处理:可以使用Pandas、NumPy等库来处理和分析数据。
-
将处理后的数据转换为JSON格式:ECharts支持JSON格式的数据输入,因此需要将Python中的数据转换为JSON格式。
-
使用ECharts生成图表:在HTML文件中引入ECharts库,并使用JavaScript代码来加载和显示图表。
-
将Python和ECharts集成:可以通过Web框架(如Flask或Django)来集成Python和ECharts,或者使用Jupyter Notebook中的IPython显示模块来直接在Notebook中显示ECharts图表。