能大致讲一下Chat GPT的原理吗?

AI视频生成:小说文案智能分镜+智能识别角色和场景+批量Ai绘图+自动配音添加音乐+一键合成视频+百万播放量icon-default.png?t=N7T8https://aitools.jurilu.com/ 话题群精选了三位网友的回答,从不同的角度阐释了Chat GPT的原理。

第一位网友的回答:

不给你扯长篇大论,不扯专业术语。做个一分钟小实验,让你get到GPT的核心原理。我现在给你出个找规律的题:已知1.WSHR2、2.WSHR3、3.WSHRM、4.HRSYHBD。提问:现在有一段话只有开头WS,那后面可能是什么?按照你观察到的规律,你可能会回答:我吧,我看WS后面都是接的HR,而且一、三出现了两次呢。你还有可能回答WSHR和WSHRM也有可能吧,毕竟都挨着WS。低概率你也可能会回答WS YHBD,没准跟W没关系,是跟S有关系呢。你看四里面S后面接的是TB,说不定它是对的呢。但无论如何,你几乎不会回答WSBH、WSMR等等这种毫不沾边的结果。

到现在你可能还都是云里雾里,那么我揭晓谜底:字母实际上是下面这段话内容的拼音缩写。已知一:我是好人,二:我是坏人,三:我是好人吗,四:好人是有好报的。提问:现在只有“我是”两个字,那么后面可能是什么?那么我们再来看回答:实际上是回答一:我是好人,因为已知里面“我是”后面接“好人”的次数多;回答二:我是坏人,我也是好人吗,也有可能,因为跟“我是”挨着;回答三:我是有好报的,说不定也是对的呢,没准跟“我”没关系,主要看“是”后面是啥呢。你几乎不会回答我是报好、我是骂人等等这种语句不通的结果。

虽然你完全不懂这个题目在说什么,但是通过观察意志内容,总结规律,还是能够回答出语句通顺且相对靠谱的答案。那么你这里大概率已经懂了“已知”的内容,实际上就是AI训练时要喂给它的语料;你观察到的规律,实际上就是训练后的模型。AI实际上也是完全不理解你在说什么,你给它看的东西对它来说毫无意义。但这样,当人们提出某些问题时,它就可以根据以前观察到的规律回复出大概率是正确的回答。这也就是现在生成式AI的神奇之处。

第二位网友的回答:

Chat GPT的通俗解释:Chat GPT其实在原理上不难理解,大体上它就是一个超级抠图王、超级电话接线员、超级审核的组合。超级抠图王,平时你抠图会抠一个人或者一个东西下来,对不对?在计算机看来,你就相当于画了一条封闭的曲线,然后把这条曲线里面的所有点都重命名为人或者一个东西了。而Chat GPT具有一个可以把每个像素都重命名为某种东西的功能。它会从粗到细,逐渐把画面分割成为不同的块,然后动用它搜索引擎里预存的已经被人为分好了的那些小块,搜到一个最可能的命名方案,直到这个过程进展到几个像素为止。这个图也就被它扣好了。这一步也叫做模式识别,在工程上来说是相对容易实现的。

不论是语音转写也好,摄像头自动拍人也好,都是这样的一个原理。但是如果我们把这个过程反过来,尝试用抠图的结果反过来求抠图之前的那张图长啥样呢?那就困难很多。比如说我用语音来生成文字稿,现在许多软件能做的相当准确,但是如果你反过来让电脑读文字稿的话,显然有很多当时的细节都无法准确还原了。又比如说,我抠完一张图,将图片的细节完全删掉,只留下这个像素曾经代表啥的信息,比如“车车车车车人车车车车车”这样的。既然你连当时这有什么人,又有什么车都不能确定,你又该怎么把画面细节重新补回去呢?而这就是Chat GPT它非常擅长的内容了。

超级电话接线员 Chat GPT 的科学家意识到一个问题:之所以这个还原很难做,比如说用几个字画张图吧,其实是因为我们没找着那个曾经成功将某张图拆成过你刚才输入那几个字的老师傅。一旦我们把这位老师傅找到了,他回家把当时拆过的那张图给你一找,那很有可能那张图就是你想要的了。

如果有一天你发现无论你说一串什么字,给一张什么图,他总是世界上某几个老师傅当年得出过的结论呢,那是不是只要那群老师傅在他们的结论后都附上他们的电话号码,我们只要给他们打一个电话,就能把图给找出来了呢?原理上还真就是这样的。只不过,在 Chat GPT 里这通电话你可能要联系成千上万个接线员才能接通,但无论如何还是能接通的。

于是将模式识别的逆运算尽可能闭合起来的方法,也就找到了,那就是疯狂做模式识别,然后把模式识别得到的经验存起来,变成找到原图像的电话号码。而这套给经验指派电话号码的方法,也就是大家所熟悉的神经网络了。它本质上就是一个由千万个电话接线员共同去记忆这个世界上的人们是如何打电话的结构,于是每个接线员就可以记忆相当少的内容,不需要特别博学强记,只需要能判断下一个接线员是谁就行了。

如此一来,无论当时的分析过程何等复杂,他的电话号码多么复杂难记,只要我安排足够多的接线员,总有一个相当大的概率能够最终将这通电话给接通。就是这个方法,令 Chat GPT 能够用维度非常小的信息生成出维度非常高的产物,用几个字就可以为你生成一个很复杂的图像——超级审核。

当然在这个过程当中,Chat GPT 还需要在联系到诸多老师傅的同时,将一些比较明显不符合人类需求的结论给剔除掉。显然,你给的信息越少,能联系到的老师傅也就越多,对吧?于是不符合你需求的信息也就越容易将你想要的那个给淹没掉,对吧?这个时候 Chat GPT 就需要人工客服的介入了。

实际上在你使用它之前,人工客服会被模型剔除掉好多好多不符合要求的结果。当然这个过程本身也是可被机器举一反三的,于是在相对而言不那么充裕的人工服务之下,Chat GPT 也可以剔除掉到天文数字一般的错误结论了。固然在这个过程当中错杀肯定不少,但是比起 Chat GPT 庞大的生成能力来说,这点不算什么。

于是在三者的共同努力之下,你就得到了一个能够回答你任何问题,但是偶尔会给你一个非常离谱答案的超级大模型了。实际上它并不是非常难以理解的东西,而且它和人类以及动物真正的智慧发生模式,还是有着相当大的区别的。然而这些和本题关系不是很大,就另作论述吧。

第三位网友的回答:

Chat GPT的基本原理:

1. Transformer架构:

这是一种深度学习模型架构,专门用于处理序列数据,如文本。它引入了注意力机制,允许模型在不同位置关注输入序列的不同部分,从而更好地捕捉长距离依赖关系。就像学生系统的专心的学习一本课程,以更好的理解教材中的内容,形成知识结构。

2. 预训练:

在上个阶段基础上,用大量的文本数据通过处理上下文信息生成自然语言响应。它能够理解先前的对话历史,并根据上下文生成连贯的回答。Chat GPT使用一种称为Being Search的技术,以选择最可能的序列,确保生成的响应既合理又连贯。就像学生通过大量的阅读和听力练习来提高语言能力,从中学习语言的结构和用法。

3. 无监督学习模型:

通过无监督学习从文本中学到的知识可以用于各种自然语言处理任务,包括对话大声称。就像小孩子通过尝试和错误的方式学习表达自己的想法。

4. 微调:

在预训练后,模型通常会在特定任务上进行微调,以适应更具体的应用场景。微调可以使用有标签的数据,以便模型更好地适应特定的任务要求。就像学生考试,老师根据答题质量来帮助学生提高成绩。

总结:

通过这三位网友的回答,我们可以对Chat GPT的原理有一个全面的了解。第一位网友通过一个简单的实验,让我们直观地理解了GPT如何通过观察数据中的规律来生成回答。第二位网友将Chat GPT比喻为超级抠图王、超级电话接线员和超级审核的组合,形象地解释了其工作原理。第三位网友则从技术角度详细介绍了Transformer架构、预训练、无监督学习和微调这四个关键步骤。这些解释共同为我们描绘了一个关于Chat GPT如何运作的全面图景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/413250.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

江协科技stm32————10-4 I2C通信协议

目录 I2C外设简介 I2C功能框图 基本结构图(一主多从) GPIO复用输入输出图 主机发送​编辑 START stop ​ EV5 (标志位) BTF 主机接收 ACK 软件/硬件波形对比 I2C外设简介 可变多主机模型11110作为10位地址模式的标志位…

disk manager操作教程 如何使用Disk Manager组件 Mac如何打开ntfs格式文件

macOS系统有一个特别明显的弱点,即不能对NTFS格式磁盘写入数据。想要适合Mac系统使用来回转换磁盘格式又十分麻烦,这该怎么办呢?Tuxera ntfs for mac作为一款Mac完全读写软件,大家在安装该软件后,能充分使用它的磁盘管…

MyBatis中的#{}和${}区别、ResultMap使用、MyBatis常用注解方式、MyBatis动态SQL

#{}和${}区别: #{}:是占位符,采用预编译的方式sql中传值,防止sql注入,如果我们往sql中列值传递一般使用 #{}。 ${}:采用字符串拼接的方式直接拼接到sql语句中,一般不用于sql列值传递&#xf…

macbook怎么换自定义壁纸?Mac怎么设置壁纸 macOS中如何轻松删除不需要的壁纸?

自定义壁纸,不仅是为了优化桌面外观,还能在很大程度上影响用户情绪。一张好看的壁纸,可以显著提升用户的使用体验。因此,掌握更换和删除壁纸的操作技巧,就显得十分重要。下面详细解读如何在Mac上设置壁纸,以…

SkyWalking部署(监控系统)

简介 SkyWalking 是一个开源的应用性能监控 (APM) 和可观测性平台,旨在帮助开发者、运维人员和架构师监控、诊断和优化微服务架构中的应用。SkyWalking 提供了一套完整的工具链,用于收集、分析和可视化应用的性能指标、追踪和日志数据。 SkyWalking 的…

排序算法(冒泡、插入、选择、快排、归并)原理动画及Python、Java实现

排序算法(冒泡、插入、选择、快排、归并)原理动画及Python、Java实现 1 冒泡排序1.1 原理1.2 Python、Java实现 2 插入排序2.1 原理2.2 Python、Java实现 3 选择排序3.1 原理3.2 Python、Java实现 4 快速排序4.1 原理4.2 Python 5 归并排序5.1 原理5.2 P…

AI绘图提示词/咒语/词缀/关键词使用指南(Stable Diffusion Prompt 最强提示词手册)

一、为什么学习AI绘画关键词 在人工智能技术飞速发展的今天,AI绘画已成为艺术领域的一大热点。学习AI绘画关键词,不仅有助于我们掌握这一新兴技术,还能拓宽我们的创作思路,实现艺术与技术的完美融合。以下是学习AI绘画关键词的几…

STM32外设SPI(串行通信),W25Q64(8Mb)

1 非易失存储器:E2PROM,FLASH(断电不丢失) 2 易失存储器:SRAM,DRAM 3 W25Q64 1 从00 00 00 到 7F FF FF 2 block(块),sector(扇区) ,page(页区) 写数据到FLASH(256字节) 读数据很快&#…

优化学习管理:Moodle和ONLYOFFICE文档编辑器的完美结合

目录 前言 一、什么是 Moodle 1、简单快速插入表单字段 3、免费表单模板库 4、开启无缝协作 三、在Moodle中集成ONLYOFFICE文档 四、在Moodle安装使用ONLYOFFICE 1、下载安装 2、配置服务器 3、在Moodle中使用ONLYOFFICE 文档活动 五、未来展望 写在最后 前言 在当今教育科技飞…

Apache Druid日志实时分析

业务分析 ​ 秒杀业务中,通常会有很多用户同时蜂拥而上去抢购热卖商品,经常会出现抢购人数远大于商品库存。其实在秒杀过程中,热卖商品并不多,几乎只占1%,而99%的流量都源自热卖商品,很有可能因为这1%的热…

C--四种排序方法的补充

上一篇文章因为时间原因只写了三种,这一篇来补充第四种,第四种的代码更多,所需要理解的也是更多的。 堆排序 想要学会堆排序,你必须了解二叉树的内容。堆排序的排序速度也是非常的快。 这里都已大堆为例 1.向上调整算法&#…

xampp安装federated插件,实现mysql数据同步

需求:a服务器上的mysql数据库data表插入新数据时,需要同步到b服务器上的data表中。 解决:a服务器上开启federated引擎插件,创建data1对应b服务器上的data表。 在a服务器上的data表创建触发器,data表插入数据后执行触发…

Vue的状态管理——Vuex34Pinia

Vue3中Vuex的使用_vue3 vuex-CSDN博客 VueX详解_组合式vuex-CSDN博客 15分钟学会Pinia Vuex 3和4详解 Vuex 3 Vuex 3是Vue.js 2.x版本的状态管理库,它提供了一种集中式存储和管理组件状态的方式。以下是Vuex 3的一些关键特性: 状态集中管理&#x…

建模杂谈系列250 Hello2Pymc

说明 pymc算是多年的老朋友了,中间失联了好几年。 内容 1 安装 安装更加麻烦了,不能很好的和其他的环境兼容。在官网上,也是建议用conda的方式安装。 conda create -c conda-forge -n pymc_env "pymc>5" conda activate p…

自闭症儿童托管学校

在自闭症儿童的成长道路上,寻找一个既能够提供专业康复又充满关爱的托管学校,是许多家庭的重要课题。星启帆自闭症儿童康复机构,作为国内规模较大的自闭症儿童托管学校,以其专业的师资力量、科学的康复方法、严格的管理制度以及温…

Milvus向量数据库-数据备份与恢复

前言 随着Milvus版本的持续迭代,越来越多的用户将其作为构建生产环境的向量数据服务使用。作为数据服务使用,其中的运维、数据安全、容灾备份自然是用户最关心且不容有失的需求。为解决这一需求,Milvus-backup项目工具应运而生。 Milvus-ba…

【并集查找 图论】2421. 好路径的数目

本文涉及知识点 C图论 LeetCode2421. 好路径的数目 给你一棵 n 个节点的树(连通无向无环的图),节点编号从 0 到 n - 1 且恰好有 n - 1 条边。 给你一个长度为 n 下标从 0 开始的整数数组 vals ,分别表示每个节点的值。同时给你…

【C++11及其特性】函数返回值当引用

函数返回值当引用目录 一.若返回变量为栈变量1.例子2.不能成为其他引用的初始值3.不能作为左值 二.若返回变量为静态变量或全局变量1.列子2.即可左值也可右值 三.若返回变量为形参1.普通形参2.引用形参 四.结论 一.若返回变量为栈变量 1.例子 返回的是局部变量的引用,这里用的…

【Python系列】SQLAlchemy 基本介绍

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…