PyTorch深度学习(七)【循环神经网络-提高】

数据集文末分享。

模型:

做完padding之后,就可以转换为张量了。

bidirectional是是否使用双向RNN:

输出隐层两个:

代码:

import csvimport timeimport matplotlib.pyplot as pltimport numpy as npimport mathimport gzip  # 用于读取压缩文件import torchimport torch.optim as optimfrom torch.utils.data import Dataset, DataLoaderfrom torch.nn.utils.rnn import pack_padded_sequence# 一些超参数HIDDEN_SIZE = 100BATCH_SIZE = 256  # 一次训练的样本数,为256个名字N_LAYER = 2  # RNN的层数N_EPOCHS = 100N_CHARS = 128  # ASCII码一共有128个字符USE_GPU = True# 构造数据集class NameDataset(Dataset):def __init__(self, is_train_set=True):        filename = 'D:\\code1\\vue1\\yolov5\\dataset\\names_train.csv.gz' if is_train_set else 'D:\\code1\\vue1\\yolov5\\dataset\\names_test.csv.gz'        with gzip.open(filename, 'rt') as f:  # rt表示以只读模式打开文件,并将文件内容解析为文本形式            reader = csv.reader(f)       #读数据            rows = list(reader)  # rows是一个列表,每个元素是一个名字和国家名组成的列表。把csv中所有的行读进来self.names = [row[0] for row in rows]  # 一个很长的列表,每个元素是一个名字,字符串,长度不一,需要转化为数字(name,language)self.len = len(self.names)  # 训练集:13374  测试集:6700.记录样本数量self.countries = [row[1] for row in rows]  # 一个很长的列表,每个元素是一个国家名,字符串,需要编码成数字# 下面两行的作用其实就是把国家名编码成数字,因为后面要用到交叉熵损失函数self.country_list = list(sorted(set(self.countries)))  # 列表,按字母表顺序排序,去重后有18个国家名。set变为集合,去重self.country_dict = self.getCountryDict()  # 字典,key是国家名,value是country_list的国家名对应的索引(0-17)self.country_num = len(self.country_list)  # 18# 根据样本的索引返回姓名和国家名对应的索引,可以理解为(特征,标签),但这里的特征是姓名,后面还需要转化为数字,标签是国家名对应的索引def __getitem__(self, index):return self.names[index], self.country_dict[self.countries[index]]# 返回样本数量def __len__(self):return self.len# 返回一个key为国家名和value为索引的字典def getCountryDict(self):        country_dict = dict()  # 空字典for idx, country_name in enumerate(self.country_list):#遍历            country_dict[country_name] = idx  #构建键值对return country_dict# 根据索引(标签值)返回对应的国家名def idx2country(self, index):return self.country_list[index]# 返回国家名(标签类别)的个数,18def getCountriesNum(self):return self.country_num# 实例化数据集trainset = NameDataset(is_train_set=True)trainloader = DataLoader(trainset, batch_size=BATCH_SIZE, shuffle=True)   #构造加载器。batch_size=256testset = NameDataset(is_train_set=False)testloader = DataLoader(testset, batch_size=BATCH_SIZE, shuffle=False)N_COUNTRY = trainset.getCountriesNum()  # 18个国家名,即18个类别。决定最终输出维度# 设计神经网络模型class RNNClassifier(torch.nn.Module):    #模型设计def __init__(self, input_size, hidden_size, output_size, n_layers=1, bidirectional=True):#“bidirectional”super(RNNClassifier, self).__init__()self.hidden_size = hidden_size  # 隐含层的大小,100self.n_layers = n_layers  # RNN的层数,2self.n_directions = 2 if bidirectional else 1  # 是否使用双向RNN# 词嵌入层:input_size是输入的特征数(即不同词语的个数),即128;embedding_size是词嵌入的维度(即将词语映射到的向量的维度),这里让它等于了隐含层的大小,即100self.embedding = torch.nn.Embedding(input_size, hidden_size)# GRU层:input_size是输入的特征数(这里是embedding_size,其大小等于hidden_size),即100;hidden_size是隐含层的大小,即100;n_layers是RNN的层数,2;bidirectional是是否使用双向RNNself.gru = torch.nn.GRU(hidden_size, hidden_size, n_layers, bidirectional=bidirectional)#bidirectional是是否使用双向RNN# 全连接层:hidden_size是隐含层的大小,即100;output_size是输出的特征数(即不同类别的个数),即18self.fc = torch.nn.Linear(hidden_size * self.n_directions, output_size)def _init_hidden(self, batch_size):# 初始化隐含层,形状为(n_layers * num_directions, batch_size, hidden_size)        hidden = torch.zeros(self.n_layers * self.n_directions, batch_size, self.hidden_size)  #全0张量return create_tensor(hidden)def forward(self, input, seq_lengths):# input shape:B X S -> S X B        input = input.t()  # 转置,变成(seq_len,batch_size)        batch_size = input.size(1)  # 256,一次训练的样本数,为256个名字,即batch_size        hidden = self._init_hidden(batch_size)# 1、嵌入层处理,input:(seq_len,batch_size) -> embedding:(seq_len,batch_size,embedding_size)        embedding = self.embedding(input)   #扔到嵌入层里面# pack them up        gru_input = pack_padded_sequence(embedding, seq_lengths)# output:(*, hidden_size * num_directions),*表示输入的形状(seq_len,batch_size)# hidden:(num_layers * num_directions, batch, hidden_size)        output, hidden = self.gru(gru_input, hidden)if self.n_directions == 2:            hidden_cat = torch.cat([hidden[-1], hidden[-2]],                                   dim=1)  # hidden[-1]的形状是(1,256,100),hidden[-2]的形状是(1,256,100),拼接后的形状是(1,256,200)else:            hidden_cat = hidden[-1]  # (1,256,100)        fc_output = self.fc(hidden_cat)  # 返回的是(1,256,18)return fc_output# 下面该函数属于数据准备阶段的延续部分,因为神经网络只能处理数字,不能处理字符串,所以还需要把姓名转换成数字def make_tensors(names, countries):# 传入的names是一个列表,每个元素是一个姓名字符串,countries也是一个列表,每个元素是一个整数    sequences_and_lengths = [name2list(name) for name in # name2list:把每一个名字变成ascll列表                             names]  # 返回的是一个列表,每个元素是一个元组,元组的第一个元素是姓名字符串转换成的数字列表,第二个元素是姓名字符串的长度    name_sequences = [sl[0] for sl in sequences_and_lengths]  # 返回的是一个列表,每个元素是姓名字符串转换成的数字列表    seq_lengths = torch.LongTensor([sl[1] for sl in sequences_and_lengths])  # 返回的是一个列表,每个元素是姓名字符串的长度    countries = countries.long()  # PyTorch 中,张量的默认数据类型是浮点型 (float),这里转换成整型,可以避免浮点数比较时的精度误差,从而提高模型的训练效果# make tensor of name, (Batch_size,Seq_len) 实现填充0的功能    seq_tensor = torch.zeros(len(name_sequences), seq_lengths.max()).long()for idx, (seq, seq_len) in enumerate(zip(name_sequences, seq_lengths)):        seq_tensor[idx, :seq_len] = torch.LongTensor(seq)# sort by length to use pack_padded_sequence。按照序列长度排序# perm_idx是排序后的数据在原数据中的索引,seq_tensor是排序后的数据,seq_lengths是排序后的数据的长度,countries是排序后的国家    seq_lengths, perm_idx = seq_lengths.sort(dim=0, descending=True)    seq_tensor = seq_tensor[perm_idx]    countries = countries[perm_idx]return create_tensor(seq_tensor), create_tensor(seq_lengths), create_tensor(countries)# 把名字转换成ASCII码,返回ASCII码值列表和名字的长度def name2list(name):    arr = [ord(c) for c in name]return arr, len(arr)# 是否把数据放到GPU上def create_tensor(tensor):if USE_GPU:        device = torch.device('cuda:0')        tensor = tensor.to(device)return tensor# 训练模型def trainModel():    total_loss = 0for i, (names, countries) in enumerate(trainloader, 1):        inputs, seq_lengths, target = make_tensors(names, countries)  #make_tensors每次拿到3个量        output = classifier(inputs, seq_lengths.cpu())        loss = criterion(output, target)        optimizer.zero_grad()        loss.backward()        optimizer.step()        total_loss += loss.item()if i % 10 == 0:            print(f'[{timeSince(start)}] Epoch {epoch} ', end='')  # end=''表示不换行            print(f'[{i * len(inputs)}/{len(trainset)}] ', end='')            print(f'loss={total_loss / (i * len(inputs))}')  # 打印每个样本的平均损失return total_loss  # 返回的是所有样本的损失,我们并没有用上它# 测试模型def testModel():    correct = 0    total = len(testset)    print('evaluating trained model ...')    with torch.no_grad():for i, (names, countries) in enumerate(testloader, 1):            inputs, seq_lengths, target = make_tensors(names, countries)            output = classifier(inputs, seq_lengths.cpu())            pred = output.max(dim=1, keepdim=True)[1]  # 返回每一行中最大值的那个元素的索引,且keepdim=True,表示保持输出的二维特性            correct += pred.eq(target.view_as(pred)).sum().item()  # 计算正确的个数        percent = '%.2f' % (100 * correct / total)        print(f'Test set: Accuracy {correct}/{total} {percent}%')return correct / total  # 返回的是准确率,0.几几的格式,用来画图def timeSince(since):    now = time.time()    s = now - since    m = math.floor(s / 60)  # math.floor()向下取整,除以60变成分钟    s -= m * 60return '%dmin %ds' % (m, s)  # 多少分钟多少秒if __name__ == '__main__':    classifier = RNNClassifier(N_CHARS, HIDDEN_SIZE, N_COUNTRY, N_LAYER)   #RNN循环网络分类器,“N_CHARS”字符数量,“HIDDEN_SIZE”:GRU输出的隐层层数,“N_LAYER”:用几层的GRUif USE_GPU:        device = torch.device('cuda:0')        classifier.to(device)# 定义损失函数和优化器    criterion = torch.nn.CrossEntropyLoss()    optimizer = optim.Adam(classifier.parameters(), lr=0.001)    start = time.time()     #打印训练时间,距离开始时间过去了多少时间    print('Training for %d epochs...' % N_EPOCHS)    acc_list = []    #把测试结果记录到列表里面# 在每个epoch中,训练完一次就测试一次for epoch in range(1, N_EPOCHS + 1):# Train cycle        trainModel()        acc = testModel()        acc_list.append(acc)# 绘制在测试集上的准确率    epoch = np.arange(1, len(acc_list) + 1)    acc_list = np.array(acc_list)    plt.plot(epoch, acc_list)    plt.xlabel('Epoch')    plt.ylabel('Accuracy')    plt.grid()    plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/138373.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

29.CSS边框动画特效

效果 源码 index.html <!DOCTYPE html> <html> <head> <title>Quick CSS Border Trick</title> <link rel="stylesheet" type="text/css" href="style.css"> </head> <body><div class=&q…

three.js——辅助器AxesHelper和轨道控制器OrbitControls的使用

辅助器AxesHelper和轨道控制器OrbitControls的使用 前言效果图1、辅助器AxesHelper:是物体出现辅助的x/y/z轴2、轨道控制器OrbitControls2.1导入OrbitControls文件2.2 使用2.3 如果OrbitControls改变了相机参数&#xff0c;重新调用渲染器渲染三维场景 前言 1、AxesHelper 官网…

网站整站优化-网站整站优化工具

您是否曾为您的网站在搜索引擎中的排名而感到焦虑&#xff1f;是否苦苦思考如何提高流量、吸引更多用户&#xff1f; 什么是整站优化。简而言之&#xff0c;它是一项用于提升网站在搜索引擎中排名的策略和技巧。通过对网站的内容、结构、速度等方面进行优化&#xff0c;可以使…

WPF 类库 使用handycontrol 配置

在学习wpf发现了一个非常好用的UI库 handycontrol 但是很多地方讲的都是WPF应用程序怎么用&#xff0c;很少有讲类库那么引用的问题&#xff0c;所以在这里自己总结一下&#xff0c;希望能帮助到大家&#xff1a; 1.添加 handycontrol 的引用&#xff1b;安装&#xff0c;我已…

[python 刷题] 167 Two Sum II - Input Array Is Sorted 15 3Sum

[python 刷题] 167 Two Sum II - Input Array Is Sorted & 15 3Sum 虽然 3 sum 出来的比较早&#xff0c;不过按照解法来说&#xff0c;2 sum II 算是 3 sum 的前置解法 167 Two Sum II - Input Array Is Sorted 题目&#xff1a; Given a 1-indexed array of integers …

Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化...

原文链接&#xff1a;http://tecdat.cn/?p23689 本文探索Python中的长短期记忆&#xff08;LSTM&#xff09;网络&#xff0c;以及如何使用它们来进行股市预测&#xff08;点击文末“阅读原文”获取完整代码数据&#xff09;。 相关视频 在本文中&#xff0c;你将看到如何使用…

使用 FHE 实现加密大语言模型

近来&#xff0c;大语言模型 (LLM) 已被证明是提高编程、内容生成、文本分析、网络搜索及远程学习等诸多领域生产力的可靠工具。 大语言模型对用户隐私的影响 尽管 LLM 很有吸引力&#xff0c;但如何保护好 输入给这些模型的用户查询中的隐私 这一问题仍然存在。一方面&#xf…

【计算机网络】图解路由器(一)

图解路由器&#xff08;一&#xff09; 1、什么是路由器&#xff1f;2、什么是路由选择&#xff1f;3、什么是转发&#xff1f;4、路由器设备有哪些类型&#xff1f;5、根据性能分类&#xff0c;路由器有哪些类型&#xff1f;5.1 高端路由器5.2 中端路由器5.3 低端路由器 6、什…

Linux 安装 git

一 . 安装git 方式1&#xff1a;通过yum 安装 yum -y install git查看是否安装成功 git --version安装目录在&#xff1a;/usr/libexec/git-core yum 安装有一些缺点 &#xff1a;不能自己指定安装目录、安装版本 方式 2 下载tar.gz 包 配置 查看git 版本&#xff1a;Index…

电子器件系列57:肖特基二极管(BAS7005)

什么是肖特基二极管&#xff1f;肖特基二极管工作原理详解&#xff0c;几分钟带你搞定 - 知乎 这几个参数都是二极管很常见的参数&#xff1a;基本上就是正向导通时的极限电流电压&#xff0c;反向截止时的极限电流电压。功耗、温度、结电容&#xff0c;差不多就这些&#xff0…

WebGL HUD(平视显示器)

目录 HUD&#xff08;平视显示器&#xff09; 如何实现HUD 示例程序&#xff08;HUD.html&#xff09; 示例程序&#xff08;HUD.js&#xff09; 代码详解 在网页文字上方显示三维物体 代码详解 HUD&#xff08;平视显示器&#xff09; 平视显示器&#xff08;head…

Postman 的使用教程(详细)

Postman 使用教程 1. 是什么 Postman 是一个接口测试工具软件&#xff0c;可以帮助开发人员管理测试接口。 官网&#xff1a;https://www.getpostman.com/ 2. 安装 建议通过官网下载安装&#xff0c;不要去那些乱七八糟的下载平台&#xff0c;或者留言获取 官网下载地址&am…

package中添加一条命令,用来自动选择包管理器进行依赖安装

package中添加一条命令,用来自动选择包管理器进行依赖安装 前提: 当前项目为vite项目,所以直接使用import导入模块 package.json中的scripts添加 "scripts": {"start": "node scripts/init.js"...},文件目录为 init.js的文件为 import { e…

antd-design-vue Table组件全局配置(分页器...)

描述&#xff1a;该框架许多默认配置好像还不支持&#xff0c;一般都是挨个使用挨个配置。我的项目中也遇到了类似的情况&#xff0c;但是当需求发生变化时&#xff0c;代码所有的组件使用则都需要修改&#xff0c;这种方式真的很不礼貌。 《我为了一口醋包了顿饺子》 需求是将…

Canal 实现MySQL与Elasticsearch7数据同步

1 工作原理 canal 模拟 MySQL slave 的交互协议&#xff0c;伪装自己为 MySQL slave &#xff0c;向 MySQL master 发送 dump协议 MySQL master 收到 dump 请求&#xff0c;开始推送 binary log 给 slave (即 canal ) canal 解析 binary log 对象(原始为 byte 流) 优点&…

tensorflow基础

windows安装tensorflow anaconda或者pip安装tensorflow&#xff0c;tensorflow只支持win7 64系统&#xff0c;本人使用tensorflow1.5版本&#xff08;pip install tensorflow1.5&#xff09; tensorboard tensorboard只支持chrome浏览器&#xff0c;而且加载过程中可能有一段…

计算机竞赛 深度学习+opencv+python实现车道线检测 - 自动驾驶

文章目录 0 前言1 课题背景2 实现效果3 卷积神经网络3.1卷积层3.2 池化层3.3 激活函数&#xff1a;3.4 全连接层3.5 使用tensorflow中keras模块实现卷积神经网络 4 YOLOV56 数据集处理7 模型训练8 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &am…

jmeter学习文档

JMeter学习&#xff08;一&#xff09;工具简单介绍 一、JMeter 介绍 Apache JMeter是100%纯JAVA桌面应用程序&#xff0c;被设计为用于测试客户端/服务端结构的软件(例如web应用程序)。它可以用来测试静态和动态资源的性能&#xff0c;例如&#xff1a;静态文件&#xff0c;J…

BaseMapper 中的方法

BaseMapper 中的方法&#xff1a; 插入 int insert(T entity) - 插入一条记录。 删除 int deleteById(Serializable id) - 根据主键ID删除记录。 int deleteById(T entity) - 根据实体对象&#xff08;ID&#xff09;删除记录。 int deleteByMap(Map<String, Object> …

Easyui里的datagrid嵌入select下拉框

问题&#xff1a; 想使用datagird里嵌入select下拉框&#xff0c;并在提交form表单时获取datagrid选中的每行数据里的每个下拉框选中的值。 解决方案&#xff1a; 其中economicIssuesSelect使用下拉框&#xff0c;重点关注 initEconomicIssues(row)方法。这里的方法需要传递ro…