dl学习笔记（8）：fashion-mnist

过完年懒羊羊也要复工了，这一节的内容不多，我们接着上次的fashion-mnist数据集。

首先第一步就是导入数据集，由于这个数据集很有名，是深度学习的常见入门数据集，所以可以在库里面导入。由于是图像数据集所以，被存放在视觉模块里面。

import torchvision
import torchvision.transforms as transforms
mnist = torchvision.datasets.FashionMNIST(root=r'E:\桌面\深度学习课件\lesson 11\MINST-FASHION', train=True, download=False, transform=transforms.ToTensor())

下面我们来解释一下这几个参数：

1）root指定数据集存储的本地路径，如果路径不存在，且 download=True，PyTorch会自动创建该路径并下载数据。如果路径已存在且包含数据集文件，则直接加载本地数据。

2）train决定加载的是训练集还是测试集。

train=True：加载训练集（60,000张图片）
train=False：加载测试集（10,000张图片）

3）download：控制是否从网络下载数据集。

download=True：如果本地路径 root 中不存在数据集，则自动下载。
download=False：不下载，直接加载本地数据（需确保本地路径已存在数据集）。

4）transform：定义数据预处理操作。

ToTensor() 将PIL图像或NumPy数组转换为PyTorch张量（Tensor），并自动进行以下操作：
将图像数据范围从 [0, 255] 缩放到 [0, 1]。调整张量维度为 [C, H, W]（通道、高度、宽度），例如FashionMNIST是灰度图，因此 C=1。
如果需要对数据做进一步处理（如归一化），可以组合多个变换

运行结果如上，下一步可以查看属性信息。

这里的size含义就是有六万张图片，每张都是28*28的像素，需要注意的是这里省略了颜色通道，由于该数据集是灰度图片所以这里默认是1。

我们可以通过targets来查看标签，再通过unique来获得标签的唯一值，可以看到是一个多分类任务，总共十个类别。我们还可以通过classes来查看每个数字对应的具体衣服的类别是什么。

下一步我们通过索引来具体看看里面存储的是什么：

图片有点长，如果我们仔细看的话，前面全是图片像素点的张量，最后有一个不起眼的9就是这张图片的标签，所以我们可以通过[0][0]来索引张量，下面我们来展示出来这张图片。

我们将像素部分的张量传入，由于这里是tensor结构，所以我们需要最后转化成numpy才行。

再展示一张：

由于前面已经看过标签和样本已经打包在一起了，所以这里我们不需要使用之前学的dataset的打包功能了，只需要dataloader的分批次。

最后我们开始完整的建模之前我们先复习一下上次说过的完整流程：
1）设置步长，动量值，迭代次数，batch_size等信息，（如果需要）设置初始权重
2）导入数据，将数据切分成batches
3）定义神经网络架构
4）定义损失函数，如果需要的话，将损失函数调整成凸函数，以便求解最小值
5）定义所使用的优化算法
6）开始在epoches和batch上循环，执行优化算法：
6.1）调整数据结构，确定数据能够在神经网络、损失函数和优化算法中顺利运行
6.2）完成向前传播，计算初始损失
6.3）利用反向传播，在损失函数上求偏导数
6.4）迭代当前权重
6.5）清空本轮梯度
6.6）完成模型进度与效果监控
7）输出结果

按照惯例首先还是先导入库，下面是所有用到的库

import torch
from torch import nn
from torch import optim
from torch.nn import functional as F
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
import torchvision
import torchvision.transforms as transforms

1）确定超参数

lr = 0.1
gamma = 0.7
epochs = 5
bs = 128

2）导入数据，将数据切分成batches

batcheddata = DataLoader(mnist,batch_size = bs,shuffle = True)

我们可以通过查看shape属性来看结果是否符合要求：

3）定义神经网络架构

先定义输入输出神经元个数：

input_ = mnist.data[0].numel()
output_ = len(mnist.targets.unique())

定义架构：

def fit(net, batchdata, lr=0.01, epochs=5, gamma=0):criterion = nn.NLLLoss()  # 定义损失函数opt = optim.SGD(net.parameters(), lr=lr, momentum=gamma)  # 定义优化算法for epoch in range(epochs):net.train()  # 设置模型为训练模式running_loss = 0.0correct = 0total = 0for batch_idx, (x, y) in enumerate(batchdata):y = y.view(x.shape[0])  # 确保y是一个一维的张量opt.zero_grad()  # 清除之前的梯度sigma = net(x)  # 前向传播loss = criterion(sigma, y)  # 计算损失loss.backward()  # 反向传播opt.step()  # 更新参数# 计算损失running_loss += loss.item()# 计算准确率_, predicted = torch.max(sigma, 1)  # 获取模型的预测total += y.size(0)correct += (predicted == y).sum().item()# 输出每个epoch的平均损失和准确率avg_loss = running_loss / len(batchdata)accuracy = 100 * correct / totalprint(f'Epoch {epoch+1}/{epochs}, Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%')

4）实例化

torch.manual_seed(250)
net = model(in_features=input_, out_features=output_)
fit(net,batcheddata,lr=lr,epochs=epochs,gamma=gamma)

由于上面的代码都是前面的章节中已经提及过的，这里就不再重复了。

完整代码：

#完整代码
import torch
from torch import nn
from torch import optim
from torch.nn import functional as F
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
import torchvision
import torchvision.transforms as transformslr = 0.1
gamma = 0.7
epochs = 5
bs = 128mnist = torchvision.datasets.FashionMNIST(root=r'E:\桌面\深度学习课件\lesson 11\MINST-FASHION', train=True, download=False, transform=transforms.ToTensor())
batcheddata = DataLoader(mnist,batch_size = bs,shuffle = True)
input_ = mnist.data[0].numel()
output_ = len(mnist.targets.unique())
class model(nn.Module):def __init__(self,in_features=1,out_features=2):super().__init__()self.linear1 = nn.Linear(in_features,128,bias=False)self.output = nn.Linear(128,out_features,bias=False)def forward(self,x):x = x.view(-1,28*28)sigma1 = torch.relu(self.linear1(x))z2 = self.output(sigma1)sigma2 = F.log_softmax(z2,dim=1)return sigma2def fit(net, batchdata, lr=0.01, epochs=5, gamma=0):criterion = nn.NLLLoss()  # 定义损失函数opt = optim.SGD(net.parameters(), lr=lr, momentum=gamma)  # 定义优化算法for epoch in range(epochs):net.train()  # 设置模型为训练模式running_loss = 0.0correct = 0total = 0for batch_idx, (x, y) in enumerate(batchdata):y = y.view(x.shape[0])  # 确保y是一个一维的张量opt.zero_grad()  # 清除之前的梯度sigma = net(x)  # 前向传播loss = criterion(sigma, y)  # 计算损失loss.backward()  # 反向传播opt.step()  # 更新参数# 计算损失running_loss += loss.item()# 计算准确率_, predicted = torch.max(sigma, 1)  # 获取模型的预测total += y.size(0)correct += (predicted == y).sum().item()# 输出每个epoch的平均损失和准确率avg_loss = running_loss / len(batchdata)accuracy = 100 * correct / totalprint(f'Epoch {epoch+1}/{epochs}, Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%')
torch.manual_seed(250)
net = model(in_features=input_, out_features=output_)
fit(net,batcheddata,lr=lr,epochs=epochs,gamma=gamma)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/13141.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！