【李沐】3.5、softmax回归的从0开始实现

注意:
把每个像素位置看作⼀个特征

# 导入PyTorch库
import torch
# 从IPython库中导入display模块,用于在交互式环境中显示内容
from IPython import display
# 从d2l.torch模块中导入torch作为d2l的别名,方便后续使用d2l库中的功能
from d2l import torch as d2l
# 定义批次大小
batch_size = 256
# 使用d2l库中的load_data_fashion_mnist函数加载Fashion-MNIST数据集
# 并将返回的训练数据迭代器和测试数据迭代器分别赋值给train_iter和test_iter
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

1、初始化模型参数
分析:前面弄成只有两层,第一层是特征,第二程是输出的类别,前面移动有10类,所以输出层弄成了10,按照这样的道理请问现在对于该任务的网络层数该如何设置呢?
答:现在图像是28*28,每一个像素看做一个特征,那么第一层就是28乘以28,第二层是10个种类,所以为10

# 定义输入特征的维度
num_inputs = 784
# 定义输出类别的数量
num_outputs = 10# 使用torch.normal函数创建一个大小为(num_inputs, num_outputs)的张量W
# 张量的值从均值为0,标准差为0.01的正态分布中随机采样,并且需要计算梯度
W = torch.normal(0, 0.01, size=(num_inputs, num_outputs), requires_grad=True)# 使用torch.zeros函数创建一个大小为num_outputs的张量b
# 张量的值全部初始化为0,并且需要计算梯度
b = torch.zeros(num_outputs, requires_grad=True)
def softmax(X):"""执行softmax操作,将输入张量X的每个元素进行指数运算并进行归一化参数:X: 输入张量返回:归一化后的张量,与输入X的形状相同"""# 使用torch.exp函数计算输入张量X的每个元素的指数值X_exp = torch.exp(X)# 使用.sum函数计算每行元素的和,并保持维度partition = X_exp.sum(1, keepdim=True)# 将每个元素的指数值除以对应行的和,实现归一化操作# 通过广播机制,使得每一行的元素都除以对应行的和return X_exp / partition

2、定义softmax—没看懂

def softmax(X):"""执行softmax操作,将输入张量X的每个元素进行指数运算并进行归一化参数:X: 输入张量返回:归一化后的张量,与输入X的形状相同"""# 使用torch.exp函数计算输入张量X的每个元素的指数值X_exp = torch.exp(X)# 使用.sum函数计算每行元素的和,并保持维度partition = X_exp.sum(1, keepdim=True)# 将每个元素的指数值除以对应行的和,实现归一化操作# 通过广播机制,使得每一行的元素都除以对应行的和return X_exp / partition
# 使用torch.normal函数创建一个大小为(2, 5)的张量X
# 张量的值从均值为0,标准差为1的正态分布中随机采样
X = torch.normal(0, 1, (2, 5))# 使用定义的softmax函数对张量X进行softmax操作
X_prob = softmax(X)# 输出经过softmax操作后的张量X_prob,以及每行元素的和(归一化后的概率之和)
X_prob, X_prob.sum(1)

3、定义模型

**def net(X):"""定义一个简单的神经网络模型,接受输入X并输出预测结果参数:X: 输入特征张量返回:经过模型处理后的预测结果"""# 将输入特征X进行形状变换,展平并与权重矩阵W相乘,然后加上偏置向量blinear_output = torch.matmul(X.reshape((-1, W.shape[0])), W) + b# 使用之前定义的softmax函数对线性输出进行softmax操作,得到最终的预测结果return softmax(linear_output)
**

4、定义损失函数
交叉熵损失函数

# 创建一个张量y,包含真实标签
y = torch.tensor([0, 2])# 创建一个张量y_hat,表示模型的预测概率分布
y_hat = torch.tensor([[0.1, 0.3, 0.6], [0.3, 0.2, 0.5]])# 使用切片操作选择y_hat中对应真实标签的预测概率
selected_probs = y_hat[[0, 1], y]# 定义交叉熵损失函数,接受预测概率分布y_hat和真实标签y作为输入
def cross_entropy(y_hat, y):"""计算交叉熵损失参数:y_hat: 模型的预测概率分布张量y: 真实标签张量返回:计算得到的交叉熵损失张量"""# 使用索引操作从y_hat中选择对应真实标签的预测概率selected_probs = y_hat[range(len(y_hat)), y]# 使用torch.log计算对数,然后使用负号得到交叉熵损失return -torch.log(selected_probs)# 使用定义的交叉熵损失函数计算损失
loss = cross_entropy(y_hat, y)

6、分类精度

def accuracy(y_hat, y): #@save"""计算预测正确的数量参数:y_hat: 模型的预测概率分布张量y: 真实标签张量返回:预测正确的样本数量"""# 检查预测概率分布张量的形状,如果有多个预测类别,则选择预测概率最高的类别if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:y_hat = y_hat.argmax(axis=1)# 将预测类别与真实标签进行比较,得到一个布尔张量cmpcmp = y_hat.type(y.dtype) == y# 使用sum函数统计布尔张量cmp中值为True的数量,即预测正确的样本数量# 最后将结果转换为浮点数并返回return float(cmp.type(y.dtype).sum())

下面这张图是分类精度
在这里插入图片描述

上面是测试单个数据,这个是测试数据集,也就是多个数据

def evaluate_accuracy(net, data_iter): #@save"""计算在指定数据集上模型的精度参数:net: 需要评估的模型data_iter: 数据迭代器,包含输入特征和真实标签返回:计算得到的模型精度"""# 如果net是torch.nn.Module的实例,将其设置为评估模式if isinstance(net, torch.nn.Module):net.eval()# 创建累加器metric,用于记录正确预测数和总样本数metric = Accumulator(2)# 使用torch.no_grad()上下文管理器,关闭梯度计算with torch.no_grad():# 遍历数据迭代器中的每个批次for X, y in data_iter:# 对模型net进行预测,计算预测精度并累加到metric中metric.add(accuracy(net(X), y), y.numel())# 计算模型在数据集上的精度,即正确预测数除以总样本数return metric[0] / metric[1]

这个代码是别⽤于存储正确预测的数量和预测的总数量。

class Accumulator: #@save"""在n个变量上进行累加的累加器类"""def __init__(self, n):"""初始化累加器,创建n个初始值为0.0的变量参数:n: 需要累加的变量个数"""self.data = [0.0] * ndef add(self, *args):"""将传入的参数与已有变量逐元素相加参数:*args: 可变数量的参数,需要与已有变量个数相匹配"""self.data = [a + float(b) for a, b in zip(self.data, args)]def reset(self):"""重置累加器,将所有变量的值重置为0.0"""self.data = [0.0] * len(self.data)def __getitem__(self, idx):"""获取指定索引处的变量值参数:idx: 索引返回:指定索引处的变量值"""return self.data[idx]

3.6.6、训练

def train_epoch_ch3(net, train_iter, loss, updater): #@save"""训练模型一个迭代周期参数:net: 需要训练的模型train_iter: 训练数据迭代器,包含输入特征和真实标签loss: 损失函数,用于计算模型预测与真实标签之间的损失updater: 更新参数的方法,可以是PyTorch内置的优化器或定制的优化器返回:训练损失和训练精度的平均值"""# 如果net是torch.nn.Module的实例,将其设置为训练模式if isinstance(net, torch.nn.Module):net.train()# 创建累加器metric,用于记录训练损失总和、训练准确度总和、样本数metric = Accumulator(3)# 遍历训练数据迭代器中的每个批次for X, y in train_iter:# 使用模型net对输入特征X进行预测,得到预测结果y_haty_hat = net(X)# 使用损失函数loss计算预测结果y_hat与真实标签y之间的损失l = loss(y_hat, y)# 根据updater的类型选择不同的优化策略if isinstance(updater, torch.optim.Optimizer):# 如果updater是PyTorch内置的优化器updater.zero_grad() # 清除梯度l.mean().backward() # 计算损失的均值并计算梯度updater.step() # 更新参数else:# 如果updater是定制的优化器l.sum().backward() # 计算损失的总和并计算梯度updater(X.shape[0]) # 更新参数# 将当前批次的损失值、预测精度和样本数累加到metric中metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())# 计算训练损失和训练精度的平均值,并返回return metric[0] / metric[2], metric[1] / metric[2]

画图的代码,每个批次都更新图片,训练图片

class Animator: #@save"""在动画中绘制数据的动画类"""def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,ylim=None, xscale='linear', yscale='linear',fmts=('-', 'm--', 'g-.', 'r:'), nrows=1, ncols=1,figsize=(3.5, 2.5)):"""初始化动画对象,配置绘图参数参数:xlabel: x轴标签ylabel: y轴标签legend: 图例标签xlim: x轴范围ylim: y轴范围xscale: x轴的刻度类型yscale: y轴的刻度类型fmts: 绘制线条的格式nrows: 子图的行数ncols: 子图的列数figsize: 图像的大小"""if legend is None:legend = []  # 如果没有图例标签,默认为空列表d2l.use_svg_display()  # 设置使用SVG格式显示图像# 创建图像和子图对象,配置绘图参数self.fig, self.axes = d2l.plt.subplots(nrows, ncols, figsize=figsize)if nrows * ncols == 1:self.axes = [self.axes, ]  # 如果只有一个子图,将子图对象放入列表# 使用lambda函数捕获参数,用于设置子图的各种属性self.config_axes = lambda: d2l.set_axes(self.axes[0], xlabel, ylabel, xlim, ylim, xscale, yscale, legend)self.X, self.Y, self.fmts = None, None, fmts  # 初始化存储数据的变量def add(self, x, y):"""向动画中添加数据点"""# 如果y不是可迭代对象,将其转换为单元素的可迭代列表if not hasattr(y, "__len__"):y = [y]n = len(y)  # 获取y的长度# 如果x不是可迭代对象,将其复制为与y长度相同的可迭代列表if not hasattr(x, "__len__"):x = [x] * n# 如果self.X为空,创建一个空列表,用于存储x轴坐标if not self.X:self.X = [[] for _ in range(n)]# 如果self.Y为空,创建一个空列表,用于存储y轴坐标if not self.Y:self.Y = [[] for _ in range(n)]# 遍历x轴坐标和y轴坐标,将数据点添加到相应的列表中for i, (a, b) in enumerate(zip(x, y)):if a is not None and b is not None:self.X[i].append(a)self.Y[i].append(b)self.axes[0].cla()  # 清空子图内容,以便绘制新的数据# 使用fmts列表中的格式绘制各个数据序列的线条for x, y, fmt in zip(self.X, self.Y, self.fmts):self.axes[0].plot(x, y, fmt)self.config_axes()  # 配置子图的属性display.display(self.fig)  # 在输出区域显示图像display.clear_output(wait=True)  # 清空输出区域,以便更新图像
def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater): #@save"""训练模型(定义⻅第3章)参数:net: 需要训练的模型train_iter: 训练数据迭代器test_iter: 测试数据迭代器loss: 损失函数num_epochs: 训练的迭代周期数updater: 更新参数的方法"""# 创建动画对象,用于绘制训练过程中的变化animator = Animator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0.3, 0.9],legend=['train loss', 'train acc', 'test acc'])# 遍历迭代周期for epoch in range(num_epochs):# 调用train_epoch_ch3函数训练一个迭代周期,获取训练损失和训练精度train_metrics = train_epoch_ch3(net, train_iter, loss, updater)# 在测试数据上计算模型精度test_acc = evaluate_accuracy(net, test_iter)# 将训练损失、训练精度和测试精度添加到动画对象中,以更新绘制的图像animator.add(epoch + 1, train_metrics + (test_acc,))# 检查训练损失、训练精度和测试精度是否在合理范围内train_loss, train_acc = train_metricsassert train_loss < 0.5, train_lossassert train_acc <= 1 and train_acc > 0.7, train_accassert test_acc <= 1 and test_acc > 0.7, test_acc

7、预测

def predict_ch3(net, test_iter, n=6): #@save"""预测标签(定义⻅第3章)参数:net: 训练好的模型test_iter: 测试数据迭代器n: 需要展示的图像数量(默认为6)"""for X, y in test_iter:break  # 获取一个批次的测试数据trues = d2l.get_fashion_mnist_labels(y)  # 获取真实标签preds = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1))  # 使用模型预测标签titles = [true + '\n' + pred for true, pred in zip(trues, preds)]  # 将真实标签和预测标签合并d2l.show_images(X[0:n].reshape((n, 28, 28)), 1, n, titles=titles[0:n])  # 展示图像和对应的标签

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/98800.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rabbitMq安装后无法启动可视化页面http://localhost:15672处理

本次安装环境信息&#xff1a; 系统&#xff1a;win10 64位专业版 erlang&#xff1a;otp_win64_23.0 rabbitMQ&#xff1a;rabbitmq-server-3.8.5 安装rabbitMQ需要依赖erlang语言环境&#xff0c;所以需要我们下载erlang的环境安装程序。 一、下载安装程序 rabbitMQ安装…

UGUI可视化组件Image, RawImage

一.组件Image 1.1 Image的属性 创建的Image对象自带Image组件&#xff0c;用来显示图片&#xff0c;其属性说明如下 属性&#xff1a;功能&#xff1a;Source Image表示要显示的图像的纹理&#xff08;必须作为精灵导入&#xff09;。Color要应用于图像的颜色&#xff0c;会和…

Matlab论文插图绘制模板第108期—特征渲染的标签散点图

在之前的文章中&#xff0c;分享了Matlab标签散点图的绘制模板&#xff1a; 进一步&#xff0c;再来分享一下特征渲染的标签散点图的绘制模板&#xff0c;以便再添加一个维度的信息。 先来看一下成品效果&#xff1a; 特别提示&#xff1a;本期内容『数据代码』已上传资源群中…

Vue-13.创建完整的Vue项目(vue+vue-cli+js)-1

前言 之前写了命令创建Vue项目&#xff0c;但是事实上我们可以直接用编译器直接创建项目&#xff0c;这里我使用webstorm&#xff08;因为我是前后端兼修的所以我习惯使用Idea家族的编译器&#xff09; 只写前端的推荐用VsCode前后端都写的推荐用webstorm 新建项目 项目初始…

框架分析(1)-IT人必须会

框架分析&#xff08;1&#xff09;-IT人必须会 专栏介绍当今主流框架前端框架后端框架移动应用框架数据库框架测试框架 Angular关键特点和功能&#xff1a;组件化架构双向数据绑定依赖注入路由功能强大的模板语法测试友好 优缺点分析优点缺点 总结 专栏介绍 link 主要对目前市…

爱荷华州的一个学区正在使用ChatGPT来决定禁止哪些书籍

为了响应爱荷华州最近颁布的立法&#xff0c;管理员们正在从梅森市学校图书馆移除禁书&#xff0c;官员们正在使用ChatGPT帮助他们挑选书籍&#xff0c;根据公报和大众科学. 由州长金雷诺兹签署的禁令背后的新法律是教育改革浪潮的一部分&#xff0c;共和党立法者认为这是保护…

JVM性能分析-jstat工具观察gc频率

jstat jstat是java自带的工具&#xff0c;在bin目录下 用法 语法&#xff1a;jstat -<option> [-t] [-h<lines>] <vmid> [<interval> [<count>]] [kqkyyj-2 bin]$ jstat -help Usage: jstat -help|-optionsjstat -<option> [-t] [-h&l…

Servlet+Jsp+JDBC实现房屋租赁管理系统(源码+数据库+论文+系统详细配置指导+ppt)

一、项目简介 本项目是一套基于ServletJsp房屋租赁管理系统&#xff0c;主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;…

redis-数据类型及样例

一.string 类型数据的基本操作 1.添加/修改数据 set key value2.获取数据 get key3.删除数据 del key4.添加/修改多个数据 mset key1 value1 key2 value25.获取多个数据 mget key1 key2二.list类型的基本操作 数据存储需求&#xff1a;存储多个数据&#xff0c;并对数据…

MySQL8.0.26-Linux版安装

MySQL8.0.26-Linux版安装 1. 准备一台Linux服务器 云服务器或者虚拟机都可以; Linux的版本为 CentOS7; 2. 下载Linux版MySQL安装包 MySQL :: Download MySQL Community Server (Archived Versions) 3. 上传MySQL安装包 4. 创建目录,并解压 mkdir mysql ​ tar -xvf mysql-8…

Django框架简单搭建增删改查页面 Django请求生命周期流程图

在数据库中准备好数据 三、将MySQL的数据展示到页面&#xff08;简单认识HTML模板语法 for循环&#xff09; 在Django项目views.py文件中利用ORM模型语法查找所有的数据 def user_list(request):# 1.获取user表中所有的数据展示到html页面上user_data models.UserInfo.object…

SpringBoot + MyBatis-Plus构建树形结构的几种方式

1. 树形结构 树形结构&#xff0c;是指&#xff1a;数据元素之间的关系像一颗树的数据结构。由树根延伸出多个树杈 它具有以下特点&#xff1a; 每个节点都只有有限个子节点或无子节点&#xff1b;没有父节点的节点称为根节点&#xff1b;每一个非根节点有且只有一个父节点&a…

6个主流的工业3D管道设计软件

3D 管道设计软件是大多数行业工程工作的主要部分&#xff0c;例如&#xff1a; 电力、石油和天然气、石化、炼油厂、纸浆和造纸、化学品和加工业。 全球各工程公司使用了近 50 种工厂或管道设计软件。 每个软件都有优点和缺点&#xff0c;包括价格点。 EPC 和业主部门当前的趋势…

【正点原子STM32连载】第十五章 窗口看门狗实验 摘自【正点原子】APM32F407最小系统板使用指南

1&#xff09;实验平台&#xff1a;正点原子stm32f103战舰开发板V4 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id609294757420 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/thread-340252-1-1.html# 第十…

使用 Apache Kafka 和 Go 将数据引入 OpenSearch

需要编写自定义集成层来满足数据管道中的特定要求&#xff1f;了解如何使用 Go 通过 Kafka 和 OpenSearch 实现此目的。 可扩展的数据摄取是OpenSearch等大规模分布式搜索和分析引擎的一个关键方面。构建实时数据摄取管道的方法之一是使用Apache Kafka。它是一个开源事件流平台…

无涯教程-Perl - unshift函数

描述 此函数按顺序将LIST中的元素放在ARRAY的开头。这与shift()相反。 语法 以下是此函数的简单语法- unshift ARRAY, LIST返回值 此函数返回ARRAY中新元素的数量。 例 以下是显示其基本用法的示例代码- #!/usr/bin/perl -warray ( 1, 2, 3, 4);print "Value of a…

30.Netty源码服务端启动主要流程

highlight: arduino-light 服务端启动主要流程 •创建 selector •创建 server socket channel •初始化 server socket channel •给 server socket channel 从 boss group 中选择一个 NioEventLoop •将 server socket channel 注册到选择的 NioEventLoop 的 selector •…

SSH远程直连--------------Docker容器

文章目录 1. 下载docker镜像2. 安装ssh服务3. 本地局域网测试4. 安装cpolar5. 配置公网访问地址6. SSH公网远程连接测试7.固定连接公网地址8. SSH固定地址连接测试 在某些特殊需求下,我们想ssh直接远程连接docker 容器,下面我们介绍结合cpolar工具实现ssh远程直接连接docker容器…

SpringBoot复习:(56)使用@Transactional注解标记的方法的执行流程

首先&#xff0c;如果在某个类或某个方法被标记为Transactional时&#xff0c;Spring boot底层会在创建这个bean时生成代理对象&#xff08;默认使用cglib) 示例&#xff1a; 当调用studentService的addStudent方法时&#xff0c;会直接跳到CglibAopProxy类去执行intercept方…

AWS WAF实战、优势对比和缺陷解决

文章目录 挑战和目标AWS WAF的优势AWS WAF的不足我是怎么做的?什么是比较好的AWS WAF设计? 笔者为了解决公司Web站点防御性问题&#xff0c;较为深入的研究AWS WAF的相关规则。面对上千万的冲突&#xff0c;笔者不得设计出一种能漂亮处理冲突数据WAF规则。 AWS WAF开发人员在…