我有个需求是需要画图,让GPT帮我生成了一下学习计划。
学习路线依照GPT的来的,使用的Prompt工具是https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor。
文章目录
- Prerequisite
- Main Curriculum
- 1.1 Seaborn介绍
- Seaborn基础
- 保存图形为文件
- 练习
- 1.2 单变量数据可视化
- 直方图
- 折线图(Line Plots)
- 散点图(Scatter Plots)
- 练习
- 1.3 多变量数据可视化
- 使用Seaborn创建散点图
- 练习
- 1.4 阴影折线图
Prerequisite
由于您已经拥有足够的Python基础和数学知识,我们将直接进入Seaborn的学习计划:
我已经根据您的需求调整了学习计划,考虑到您在没有图形用户界面的服务器上学习。🦌
在开始之前,我们将关注在非图形界面环境下的准备:
0.1 数据可视化的重要性:探讨数据可视化的意义及其在数据科学中的作用,特别是在非图形界面环境下的应用。
0.2 Python数据可视化库概览:介绍Python中常用的数据可视化库,并特别强调在没有图形界面时如何利用这些库。
0.3 Seaborn库的安装和设置:指导如何在不同环境中安装Seaborn库及其依赖,特别是在没有图形界面的服务器上。
Main Curriculum
现在,我们将专注于在无GUI环境中使用Seaborn:
1.1 Seaborn介绍:介绍Seaborn库及其在非图形界面环境下的应用。
1.2 Seaborn的基础:学习如何使用Seaborn进行数据集加载和可视化基础,并将结果保存为文件。
1.3 单变量数据可视化:使用Seaborn绘制单变量分布的图表,并学习如何将这些图表保存为文件。
1.4 多变量数据可视化:探索使用Seaborn展示多变量关系的图表,并将这些图表保存为文件。
1.5 使用Seaborn进行分类数据可视化:了解如何使用Seaborn绘制分类数据图表,并将图表保存为文件。
1.6 Seaborn中的图表美化和风格设置:学习如何自定义Seaborn图表的外观,并将这些自定义的图表保存为文件。
1.7 Seaborn中的高级绘图:探讨Seaborn中的高级绘图类型和技术,并学习如何将这些图表保存为文件。
1.8 使用Seaborn处理大规模数据:介绍如何使用Seaborn有效处理和可视化大型数据集,并将结果保存为文件。
1.9 实战项目:完成一个涉及数据清理、分析和使用Seaborn进行可视化的实战项目,并将所有图表保存为文件。
1.10 Seaborn社区和资源:介绍如何获取更多Seaborn资源和如何参与Seaborn社区,特别是在处理非GUI环境中的可视化。
1.1 Seaborn介绍
现在我们将开始专门为服务器环境(无图形用户界面)定制的Seaborn学习计划。🦌
主题: 在服务器环境下使用Seaborn
由于您在没有图形界面的服务器上工作,我们将侧重于如何将Seaborn的可视化结果保存为文件,以便您可以查看这些图像而无需图形界面。
Seaborn基础
首先,我们将确保Seaborn库已正确安装在您的服务器上。请在服务器的命令行中执行以下命令来安装Seaborn(如果尚未安装):
pip install seaborn
保存图形为文件
在服务器环境下使用Seaborn时,您可以将图形直接保存到文件中,而不是在屏幕上显示。这可以通过使用Matplotlib的savefig
方法来实现。以下是一个示例,展示如何创建一个简单的Seaborn图形并将其保存为PNG文件:
import seaborn as sns
import matplotlib.pyplot as plt# 创建数据
tips = sns.load_dataset("tips")# 创建一个图形
sns.set(style="whitegrid")
ax = sns.boxplot(x=tips["total_bill"])# 将图形保存到文件
plt.savefig('boxplot.png')
在这个例子中,我们首先导入Seaborn和Matplotlib,然后加载一个示例数据集。我们使用Seaborn创建了一个箱形图,然后使用Matplotlib的savefig
方法将图形保存为名为boxplot.png
的文件。
注:初次使用会有点慢。
练习
请尝试自己创建一个Seaborn图形,并将其保存为文件。您可以选择不同的数据集和图形类型,如散点图、直方图或线图。
接下来,我们将学习如何使用Seaborn进行单变量数据可视化,并将结果保存为文件。请准备您的数据和脚本,我们将在下一节课中深入探讨。如果您有任何问题,或者需要进一步的解释,请随时提问。当您准备好继续下一课时,请说 “/continue”。
现在,我们将继续我们的课程,专注于在服务器环境下使用Seaborn进行单变量数据可视化并将结果保存为文件。🦌
主题: 单变量数据可视化与文件保存
1.2 单变量数据可视化
单变量数据可视化是数据分析的基础,它帮助我们理解数据集中单个变量的分布情况。在没有图形用户界面的服务器环境下,我们依然可以使用Seaborn生成有用的可视化,并将这些可视化保存为文件进行查看。
单变量数据可视化可以通过多种方式进行,包括但不限于直方图、密度图和计数图。
直方图
以下是如何使用Seaborn创建直方图并将其保存为文件的示例:
import seaborn as sns
import matplotlib.pyplot as plt# 加载数据
data = sns.load_dataset('tips')# 创建直方图
sns.histplot(data['total_bill'], kde=True)# 定义标题
plt.title('Total Bill Histogram')# 保存图形到文件
plt.savefig('total_bill_histogram.png')
在这个例子中,我们绘制了tips
数据集中total_bill
列的直方图,并使用了内核密度估计(KDE)来平滑分布。然后,我们为图形设置了标题,并将其保存为名为total_bill_histogram.png
的文件。
结果:
接下来,我们将介绍如何使用Seaborn绘制折线图和散点图,并将它们保存为文件,以便在没有图形用户界面的服务器环境下查看。
折线图(Line Plots)
折线图非常适合展示数据随时间或有序类别变化的趋势。以下是使用Seaborn创建折线图并将其保存为文件的示例:
import seaborn as sns
import matplotlib.pyplot as plt# 加载数据
data = sns.load_dataset('flights')# 转换数据为适合折线图的格式
pivot_data = data.pivot(index="month", columns="year", values="passengers")# 创建折线图
sns.lineplot(data=pivot_data)# 定义标题
plt.title('Flights Passengers by Month')# 保存图形到文件
plt.savefig('flights_passengers_lineplot.png')
在这个例子中,我们使用了flights
数据集,该数据集记录了不同年份、不同月份的航班乘客数量。我们首先将数据转换为适合折线图的格式,然后使用Seaborn的lineplot
方法绘制了折线图,并将其保存为flights_passengers_lineplot.png
文件。
散点图(Scatter Plots)
散点图用于展示两个连续变量之间的关系。以下是使用Seaborn创建散点图并将其保存为文件的示例:
import seaborn as sns
import matplotlib.pyplot as plt# 加载数据
tips = sns.load_dataset('tips')# 创建散点图
sns.scatterplot(x='total_bill', y='tip', data=tips)# 定义标题
plt.title('Tip vs Total Bill')# 保存图形到文件
plt.savefig('tip_vs_total_bill_scatterplot.png')
在这个例子中,我们使用了tips
数据集来展示小费金额与账单总额之间的关系。我们使用Seaborn的scatterplot
方法来创建散点图,并将其保存为tip_vs_total_bill_scatterplot.png
文件。
练习
请尝试针对您感兴趣的数据集创建不同类型的单变量图形,并将它们保存为文件。尝试不同的图形类型和参数设置,以更好地理解您的数据。
接下来,我们将探讨如何使用Seaborn进行多变量数据可视化,并确保在无图形用户界面的环境中仍然能够查看和分析这些可视化结果。请准备您的数据和代码,我们很快就会开始这一部分。如果您有任何问题或需要进一步的解释,请随时提问。当您准备好继续下一课时,请说 “/continue”。
现在我们将继续我们的课程,探讨多变量数据可视化以及如何将生成的图形保存为文件。🦌
1.3 多变量数据可视化
多变量数据可视化是指同时观察两个或更多变量的分布情况。这可以帮助我们理解变量之间的关系,例如相关性、模式和趋势。Seaborn提供了多种函数来创建多变量数据图形,例如散点图、线图、热图等。
使用Seaborn创建散点图
散点图是展示两个连续变量之间关系的经典方法。以下是如何使用Seaborn创建散点图并将其保存为文件的示例:
import seaborn as sns
import matplotlib.pyplot as plt# 加载数据集
data = sns.load_dataset("tips")# 创建散点图
sns.set(style="whitegrid")
ax = sns.scatterplot(x='total_bill', y='tip', data=data)# 添加标题和标签
ax.set(title='Total Bill vs Tip', xlabel='Total Bill', ylabel='Tip')# 保存图形到文件
plt.savefig('scatterplot.png')
在这个示例中,我们使用scatterplot
函数来创建一个散点图,展示了总账单和小费之间的关系。
练习
请尝试为您感兴趣的两个变量创建一个散点图,并将其保存为文件。探索不同的变量组合,尝试理解它们之间的关系。
接下来,我们将介绍如何使用Seaborn进行分类数据可视化。请准备您的数据和代码,我们将在下一节课中继续深入讨论。如果您在实践中遇到任何问题,或者需要进一步的解释,请随时提问。当您准备好继续下一节课时,请说 “/continue”。
1.4 阴影折线图
GPT这些内容给了之后其他的对我不重要了,我不需要它再生成了。
我的需求是做阴影折线图,然后搜了一下找到了知乎代码,我把结尾改成保存了然后完整代码是:
import random
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as snssns.set_style("darkgrid")
plt.title("Reward Log")
data = pd.DataFrame.from_dict({"step": [random.randint(1, 100) for _ in range(5000)], # 随机生成 5000 个 step 索引"reward": [random.random() for _ in range(5000)], # 为每一个 step 随机生成对应的reward}
)
sns.lineplot(data=data, x="step", y="reward", color="orange") # 传入 DataFrame 绘制# 保存图形到文件
plt.savefig('shadowlineplot.png')
参考;这种带阴影的折线图是怎么做出来的啊? - 何枝的回答 - 知乎