【Pytorch】学习记录分享8——PyTorch自然语言处理基础-词向量模型Word2Vec

【Pytorch】学习记录分享8——PyTorch自然语言处理基础-词向量模型Word2Vec

news/2024/12/27 12:06:07/文章来源:https://blog.csdn.net/Darlingqiang/article/details/135236919

【Pytorch】学习记录分享7——PyTorch自然语言处理基础-词向量模型Word2Vec

- - 1. 词向量模型Word2Vec)
  - - 1. 如何度量这个单词的？
    - 2.词向量是什么样子？
    - 3.词向量对应的热力图：
    - 4.词向量模型的输入与输出![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/5ab5dc810a724ae883574a8bc58aeff8.png)
  - 2.如何构建训练数据
  - - 2.1 构建训练数据
    - 2.2 不同模型对比(传入中间词预测上下文，传入上下文，预测中间词汇)
  - 3.如何训练
  - - 3.1 如何设计驯联网络
    - 3.2 改进方案：加入一些负样本（负采样模型）
    - 3.3 词向量训练过程

1. 词向量模型Word2Vec)

1. 如何度量这个单词的？

在这里插入图片描述

2.词向量是什么样子？

在这里插入图片描述

3.词向量对应的热力图：

在这里插入图片描述

4.词向量模型的输入与输出

在这里插入图片描述

2.如何构建训练数据

2.1 构建训练数据

类似wiki与合乎说话逻辑的文本均可以作为训练数据
在这里插入图片描述

2.2 不同模型对比(传入中间词预测上下文，传入上下文，预测中间词汇)

CBOW:

在这里插入图片描述

Skip-gram模型所需训练数据集 :

3.如何训练

3.1 如何设计驯联网络

如果一个语料库稍微大一些，可能的结果简直太多了，最后一层相当于softmax，计算起来十分耗时，有什么办法来解决嘛？
在这里插入图片描述
初始方案：输入两个单词，看他们是不是前后对应的输入和输出，也就相当于一个二分类任务，但是这样做之后

在这里插入图片描述

出发点非常好，但是此时训练集构建出来的标签全为1，无法进行较好的训练

3.2 改进方案：加入一些负样本（负采样模型）

在这里插入图片描述

3.3 词向量训练过程

1.初始化词向量矩阵
在这里插入图片描述

2.通过神经网络返向传播来计算更新，此时不光更新权重参数矩阵W，也会更新输入数据

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/227987.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Volume Control 2

Volume Control 2

为游戏添加音乐和音效总是需要一些编码来设置一个系统来控制、显示和保存应用程序的音量设置。音量控制的设计是为了立即为您设置这些内容，让您有更多时间专注于最重要的事情——制作出色的游戏！在版本2中，我们对系统进行了重新设计，使其更加模块化、灵活，甚至更易于使用…

阅读更多...

RHCE9学习指南第13章硬盘管理

RHCE9学习指南第13章硬盘管理

新的硬盘首先需要对硬盘进行分区和格式化，首先了解一下硬盘的结构，如图13-1所示。图13-1 磁盘上的磁道和扇区硬盘的磁盘上有一个个的圈，每两个圈组成一个磁道。从中间往外发射线，把每个磁道分成一个个的扇区，每个扇…

阅读更多...

Qt基础之四十五：Qt国际化（I18N）

Qt基础之四十五：Qt国际化（I18N）

国际化的英文表述为Internationalization，通常简写为I18N（首尾字母加中间的字符数），这种奇葩的缩写方式，让我想起了NBA球星“字母哥”。下面看下Qt实现的动态语言切换效果。一.效果二.源码 QHSettingDialog.h #ifndef QHSETTINGDIALOG_H #define QHSETTINGDIALOG_H#…

阅读更多...

Grafana监控数据可视化

Grafana监控数据可视化

Grafana 是一个可视化面板，有着非常漂亮的图表和布局展示，功能齐全的度量仪表盘和图形编辑器，支持 Graphite、zabbix、InfluxDB、Prometheus、OpenTSDB、Elasticsearch 等作为数据源，比 Prometheus 自带的图表展示功能强大太多&am…

阅读更多...

【MySQL】主从异步复制配置

【MySQL】主从异步复制配置

您好，我是码农飞哥（wei158556），感谢您阅读本文，欢迎一键三连哦。 💪🏻 1. Python基础专栏，基础知识一网打尽，9.9元买不了吃亏，买不了上当。 Python从入门到精…

阅读更多...

删除数据后， redis 内存占用还是很高怎么办？

删除数据后， redis 内存占用还是很高怎么办？

现象： reids 做了数据删除，数据量不大，使用 top 命令看，发现还是占用大量内存原因： 1.redis 底层内存根据内存分配器分配，不会立刻释放 2.redis 释放的内存空间不是连续的，存在碎片内存碎…

阅读更多...

软件开发新手用哪个IDE比较好？软件开发最好的IDE都在这！

软件开发新手用哪个IDE比较好？软件开发最好的IDE都在这！

目录 IDES 的优点最佳编程 IDE 列表 Java 开发的流行集成开发环境 JetBrains 的 IntelliJ IDEA NetBeans 适用于 C/ C、C# 编程语言的最佳 IDE Visual Studio 和 Visual Studio 代码 Eclipse PHP 开发的最佳 IDE PHPStorm Sublime Text Atom JavaScript 的顶级 I…

阅读更多...

多线程编程设计模式(单例,阻塞队列,定时器,线程池)

多线程编程设计模式(单例,阻塞队列,定时器,线程池)

💕"只有首先看到事情的可能性，才会有发生的机会。"💕 作者：Mylvzi 文章主要内容：多线程编程设计模式(单例,阻塞队列,定时器,线程池) 本文主要讲解多线程编程中常用到的设计模式,包括单例模式,阻塞队列,定时…

阅读更多...

Go语言中的HTTP重定向

Go语言中的HTTP重定向

大家好，我是你们可爱的编程小助手，今天我们要一起探讨如何使用Go语言实现HTTP重定向，让我们开始吧！ 大家都知道，网站开发中有时候需要将用户的请求从一个URL导向到另一个URL。比如说，你可能想将旧的URL结构…

阅读更多...

宏集方案 | 物联网HMI的关键驱动力—SCADA级功能库和控件库

宏集方案 | 物联网HMI的关键驱动力—SCADA级功能库和控件库

来源：宏集科技工业物联网宏集方案 | 物联网HMI的关键驱动力—SCADA级功能库和控件库原文链接：https://mp.weixin.qq.com/s/UEPtpTehdbFrw3MUCnuR2A 欢迎关注虹科，为您提供最新资讯！ 01 前言在这个数字化时代，物…

阅读更多...

iptables防火墙（二）

iptables防火墙（二）

目录 1、SNAT策略及应用 1.1、SNAT 策略概述 1.2、SNAT 策略的应用 2、DNAT 策略及应用 2.1、DNAT 策略概述 2.2、DNAT 策略的应用 3、规则的导出、导入 3.1、规则的备份及还原 3.2、使用 iptables 服务 4、使用防火墙脚本 4.1、防火墙脚本的构成 &#xf…

阅读更多...

Qt 5.9.4 转 Qt 6.6.1 遇到的问题总结（一）

Qt 5.9.4 转 Qt 6.6.1 遇到的问题总结（一）

最近公司对大家的开发的硬件环境进行了升级，电脑主机的配置、显示器（两台大屏显示器）变得的逼格高多了。既然电脑上的开发环境都需要重装，就打算把开发环境也升级到最新版本，要用就用最新版本。下面对升级后的开发环境…

阅读更多...

ssm基于vue框架的点餐系统的设计与实现+vue论文

ssm基于vue框架的点餐系统的设计与实现+vue论文

基于vue框架的点餐系统的设计与实现摘要当下，正处于信息化的时代，许多行业顺应时代的变化，结合使用计算机技术向数字化、信息化建设迈进。传统的点餐信息管理模式，采用人工登记的方式保存相关数据，这种以人力为主的…

阅读更多...

Flink1.17实战教程（第六篇：容错机制）

Flink1.17实战教程（第六篇：容错机制）

系列文章目录 Flink1.17实战教程（第一篇：概念、部署、架构） Flink1.17实战教程（第二篇：DataStream API） Flink1.17实战教程（第三篇：时间和窗口） Flink1.17实战教程&…

阅读更多...

听GPT 讲Rust源代码--src/tools(37)

听GPT 讲Rust源代码--src/tools(37)

File: rust/src/tools/clippy/clippy_lints/src/explicit_write.rs 在Rust源代码中，explicit_write.rs这个文件是Clippy的一个lint插件，其作用是检查代码中的write!、writeln!宏使用时的不当或繁琐的情况，并给出相关的警告或建议。具体来说&…

阅读更多...

阿里后端实习二面

阿里后端实习二面

阿里后端实习二面记录面试题目，希望可以帮助到大家类加载的流程？ 类加载分为三个部分：加载、连接、初始化加载类的加载主要的职责为将.class文件的二进制字节流读入内存(JDK1.7及之前为JVM内存，JDK1.8及之后为本地内存)&…

阅读更多...

Xshell连接ubuntu，从github克隆项目，用Xshell克隆项目

Xshell连接ubuntu，从github克隆项目，用Xshell克隆项目

访问不了github：https://blog.csdn.net/liu834189447/article/details/135246914 短暂解决访问问题。 ping不通虚拟机/无法连接虚拟机：https://blog.csdn.net/liu834189447/article/details/135240276 ps: Xshell、ubuntu的粘贴快捷键为 Shift Insert …

阅读更多...

单片机外设矩阵键盘之行列扫描识别原理与示例

单片机外设矩阵键盘之行列扫描识别原理与示例

单片机外设矩阵键盘之行列扫描识别原理与示例 1.概述这篇文章介绍单片机通过行列扫描的方式识别矩阵键盘的按键，通过程序执行相应的操作。 2.行列扫描识别原理 2.1.独立按键识别原理为什么需要矩阵按键独立按键操作简单，当数量较多时候会占用单片机…

阅读更多...

“C语言与人生：手把手教你玩转C语言数组，从此编程无难题“

“C语言与人生：手把手教你玩转C语言数组，从此编程无难题“

各位少年，我是博主那一脸阳光，由我来给大家介绍C语言的数组的详解。在C语言中，数组是一种极其重要的数据结构，它允许我们存储和管理相同类型的一系列相关数据。通过理解并熟练掌握数组的使用，开发者能够高效地处理大量…

阅读更多...

Java(算术,自增自减,赋值,关系,逻辑,三元)运算符，运算符的优先级，隐式转换，强制转换，字符串的+。

Java(算术,自增自减,赋值,关系,逻辑,三元)运算符，运算符的优先级，隐式转换，强制转换，字符串的+。

文章目录 1.运算符和表达式运算符：表达式： 2.算术运算符练习：数值拆分 3.隐式转换概念：简单记忆：两种提升规则：取值范围从小到大的关系： 4.隐式转换的练习案例一：案例二：…

阅读更多...

最新文章

推荐文章