GPT每预测一个token就要调用一次模型

GPT每预测一个token就要调用一次模型

news/2024/12/24 1:16:57/文章来源:https://blog.csdn.net/ningyanggege/article/details/135187872

问题：下图调用了多少次模型？

在这里插入图片描述
不久以前我以为是调用一次

通过看代码是输出多少个token就调用多少次，如图所示：

在这里插入图片描述

我理解为分类模型

预测下一个token可以理解为分类模型，类别是vocab的所有token，每一次调用都是在分类

为什么不能一次输出呢

从数学维度来讲，本质是条件概率，每次预测token都要基于前面的token为条件;
比如说预测了某个token，设为t1，然后要预测t2，这个时候t1要成为t2的条件了，那么t1也要转换成特征向量，那有两种选择，一种是直接使用t0的最后一层向量当作t1，还有一种是调用一次模型生成t1的特征向量；对比两种选择，显然再调用一次模型更合理，才能利用transformer的优势，能得到更好的结果。

详情请看：https://www.zhihu.com/tardis/zm/art/623704947?source_id=1003

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/224738.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Spring】SpringBoot 配置文件

【Spring】SpringBoot 配置文件

文章目录什么是配置文件SpringBoot配置文件配置文件快速入手配置文件的格式properties 配置文件说明properties 基本语法读取配置文件信息properties 配置格式缺点 yml 配置文件说明yml 基本语法使用 yml 连接数据库 yml 使用进阶yml 配置不同数据类型配置对象配置集合配置Map…

阅读更多...

Jenkins的邮箱配置和插件下载

Jenkins的邮箱配置和插件下载

启动：java -jar jenkins.war 一定在jenkins.war的目录下进入cmd命令浏览器输入网址：http://localhost:8080/login?from%2F 账号：admin 密码：123456 安装插件： 插件更新后重启下配置邮箱账号： 3…

阅读更多...

swagger1.2 apiPost工具测试接口没有问题，换成swagger 接口调测时报错 Required request body is missing

swagger1.2 apiPost工具测试接口没有问题，换成swagger 接口调测时报错 Required request body is missing

把请求方法由get换成post GetMapping换成 PostMapping 原因apiPost自动把请求json参数封装到请求体里了， 但swagger没有封装，通过networker可以看到载荷里并没有任何东西

阅读更多...

【JavaScript】异步解决方案的发展历程

【JavaScript】异步解决方案的发展历程

✨ 专栏介绍在现代Web开发中，JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性，还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言，JavaScript具有广泛的应用场景&#x…

阅读更多...

C# 学习网站

C# 文档 - 入门、教程、参考。 | Microsoft Learnhttps://learn.microsoft.com/zh-cn/dotnet/csharp/ Browse code samples | Microsoft LearnGet started with Microsoft developer tools and technologies. Explore our samples and discover the things you can build. htt…

阅读更多...

2015年第四届数学建模国际赛小美赛C题科学能解决恐怖主义吗解题全过程文档及程序

2015年第四届数学建模国际赛小美赛C题科学能解决恐怖主义吗解题全过程文档及程序

2015年第四届数学建模国际赛小美赛 C题科学能解决恐怖主义吗原题再现： 为什么人们转向恐怖主义，特别是自杀性恐怖主义？主要原因是什么？这通常是大问题和小问题的结合，或者是一些人所说的“推拉”因素。更大的问题包…

阅读更多...

顺序表的实现(头插、尾插、头删、尾删、查找、删除、插入)

顺序表的实现(头插、尾插、头删、尾删、查找、删除、插入)

目录一. 数据结构相关概念二、线性表三、顺序表概念及结构 3.1顺序表一般可以分为： 3.2 接口实现： 四、基本操作实现 4.1顺序表初始化 4.2检查空间，如果满了，进行增容编辑 4.3顺序表打印 4.4顺序表销毁 4.5顺…

阅读更多...

Quartz持久化(springboot整合mybatis版本实现调度任务持久化)--提供源码下载

Quartz持久化(springboot整合mybatis版本实现调度任务持久化)--提供源码下载

1、Quartz持久化功能概述 1、实现使用quartz提供的默认11张持久化表存储quartz相关信息。 2、实现定时任务的编辑、启动、关闭、删除。 3、实现自定义持久化表存储quartz定时任务信息。 4、本案例使用springboot整合mybatis框架和MySQL数据库实现持久化 5、提供源码下载 …

阅读更多...

初识Stable Diffusion

初识Stable Diffusion

界面选项解读这是在趋动云上部署的Stable Diffusion txt2img prompt （1）分割符号：使用逗号 , 用于分割词缀，且有一定权重排序功能，逗号前权重高，逗号后权重低 （2）建议的通用范式…

阅读更多...

MyBatis见解4

MyBatis见解4

10.MyBatis的动态SQL 10.5.trim标签 trim标签可以代替where标签、set标签 mapper //修改public void updateByUser2(User user);<update id"updateByUser2" parameterType"User">update user<!-- 增加SET前缀，忽略，后缀…

阅读更多...

计算机网络复习-OSI TCP/IP 物理层

计算机网络复习-OSI TCP/IP 物理层

我膨胀了，挂我啊~ 作者简介： 每年都吐槽吉师网安奇怪的课程安排、全校正经学网络安全不超20人情景以及割韭菜企业合作的FW，今年是第一年。。 TCP/IP模型先做两道题： TCP/IP协议模型由高层到低层分为哪几层： 这题…

阅读更多...

VScode远程连接服务器，Pycharm专业版下载及远程连接（深度学习远程篇）

VScode远程连接服务器，Pycharm专业版下载及远程连接（深度学习远程篇）

Visual Code、PyCharm专业版，本地和远程交互。远程连接需要用到SSH协议的技术，常用的代码编辑器vscode 和 pycharm都有此类功能。社区版的pycharm是免费的，但是社区版不支持ssh连接服务器，只有专业版才可以，需要破解…

阅读更多...

C# 读取Word表格到DataSet

C# 读取Word表格到DataSet

目录功能需求 Office 数据源的一些映射关系范例运行环境配置Office DCOM 关键代码组件库引入核心代码杀掉进程总结功能需求在应用项目里，多数情况下我们会遇到导入 Excel 文件数据到数据库的功能需求，但某些情况下，也存…

阅读更多...

RasaGPT对话系统的工作原理

RasaGPT对话系统的工作原理

RasaGPT 结合了 Rasa 和 Langchain 这 2 个开源项目，当超出 Rasa 现有意图(out_of_scope)的时候，就会执行 ActionGPTFallback，本质上就是利用 Langchain 做了一个 RAG，调用 LLM API。RasaGPT 涉及的技术栈比较多而复杂&#xff0c…

阅读更多...

js显示前七天的日期，前几天依次类推

js显示前七天的日期，前几天依次类推

1.效果图 2.js代码 function beforetime1() {let now new Date();//想获取前七天日期就减七，前六天就减六，以此类推var date new Date(now.getTime() - 7 * 24 * 3600 * 1000);var y date.getFullYear();var m date.getMonth() 1;m m < 10 ? …

阅读更多...

【物联网】光影之谜：RGB-LED传感器引领科技变革之路

【物联网】光影之谜：RGB-LED传感器引领科技变革之路

🌈个人主页：Sarapines Programmer🔥 系列专栏：《物联网实战 | 数字奇迹记》⏰翰墨致赠：狂风挟雷霆舞苍穹，剑气横扫万里空。英雄豪情铸不朽，激荡壮志燃热风。目录 ⛳️1. 初识物联网 ⛳…

阅读更多...

TikTok与环保：短视频如何引领可持续生活方式？

TikTok与环保：短视频如何引领可持续生活方式？

在数字时代，社交媒体平台扮演着塑造文化和价值观的关键角色。而TikTok，作为一款全球短视频平台，不仅塑造着用户的娱乐方式，还在悄然地引领着可持续生活方式的潮流。本文将深入探讨TikTok与环保之间的关系，分析短视频如…

阅读更多...

【FPGA】分享一些FPGA高速信号处理相关的书籍

【FPGA】分享一些FPGA高速信号处理相关的书籍

在做FPGA工程师的这些年，买过好多书，也看过好多书，分享一下。后续会慢慢的补充书评。【FPGA】分享一些FPGA入门学习的书籍【FPGA】分享一些FPGA协同MATLAB开发的书籍【FPGA】分享一些FPGA视频图像处理相关的书籍【FPGA】分享一些FPGA高速…

阅读更多...

顺序表的基本操作（必学）

顺序表的基本操作（必学）

目录线性表： 顺序表： 概念和结构： 动态顺序表常用操作实现： 头文件（数组顺序表的声明）： 各种基本操作总的声明： 顺序表的初始化： 顺序表的销毁顺序表的打印 …

阅读更多...

【Vue2+3入门到实战】（4）Vue基础之指令修饰符、v-bind对样式增强的操作、v-model应用于其他表单元素详细示例

【Vue2+3入门到实战】（4）Vue基础之指令修饰符、v-bind对样式增强的操作、v-model应用于其他表单元素详细示例

目录一、今日学习目标1.指令补充二、指令修饰符1.什么是指令修饰符？2.按键修饰符3.v-model修饰符4.事件修饰符三、v-bind对样式控制的增强-操作class1.语法：2.对象语法3.数组语法4.代码练习四、京东秒杀-tab栏切换导航高亮1.需求：2.准备代…

阅读更多...

最新文章

推荐文章