创建虚拟环境
python控制台,jupyter notebook,python文件运行的差异,后续结合使用三者。
jupter主要可以对代码进行分割单独运行,主要做一些探索性工作。
数据集的常见存储模式
1、以标签命名图像。
2、单独存储图像的地址。
加载数据集:
dataset 和dataloader类,dataset
dataset获取每一个数据及其label,以及数据的个数。
你可以把 Dataset 想象成一个超级收纳箱,里面存放着机器学习模型要学习的所有数据。这些数据可以是各种各样的,比如图片、文字、数字等。它把这些数据按照一定的规则整理好,方便模型随时取用。
在命令行获取单个图像的数据集:
首先获取图像地址(相对地址较好)。
获取所有图像地址,导入os,创建所有图片的列表。
看到每个变量对应的属性(控制台的优点)
得到图像集列表的逻辑如下,将根目录与本图形数据分开:
root_dir=""lable_dir=""path=os.path.join(root_dir,lable_dir)img_path=os.listdir(path)
TensorBoard是个“魔法工具”:
模型可视化
- 展示计算图:能把模型内部结构清晰呈现,看清各层连接与数据流向,助你明白模型构造。
- 查看模型参数:以图展示参数变化,让你知晓模型学习时参数的调整情况。
训练过程监控
- 损失函数可视化:将损失函数绘成曲线,依曲线走势判断模型训练好坏,便于调整方法。
- 评估指标展示:展示准确率等指标变化,方便对比选最优模型。
数据可视化
- 输入数据可视化:可展示输入数据样子,助你了解模型学习的数据情况。
- 特征可视化:呈现模型学习时关注的数据特点,利于理解其学习和决策依据。
打开端口