Chat GPT原理

ChatGPT一经发布就在科技圈火得不行,这两天也是被传得神乎其神,听说它写得了代码、改得了 Bug,小说、段子统统不再话下!那他到底是怎么训练成现在这样的呢?本文介绍李宏毅老师的分析。

那么接下来我们就来介绍Chat GPT是怎样练成的!

1.找寻资料参考:

        李老师在翻看OpenAI的博客发现,其目前并没有发表关于ChatGPT的论文。但是!在OpenAI官方博客介绍中,我们可以发现CharGPT有一个兄弟,InstructGPT,因此他决定依靠InstructGPT去寻找一些ChatGPT的训练逻辑。

        当我们看到ChatGPT与InstructGPT的对比时,更加坚定的确定通过InstructGPT是可以找到ChatGPT模型的蛛丝马迹的。如下,上面为ChartGPT的训练流程下面为InstructGPT的流程图。可以说像的7788了,比较面明显的区别其实只有GPT的版本不同而已,前者是GPT3.5,后者是GPT3。所以李老师决定直接分析InstructGPT来推测Chat GPT是怎样练成的!

2.正式开始介绍Chat GPT的学习四阶段:

2.1 学习文字接龙

        学习文字接龙,其实就是依据目前已有的信息,去推测下一个可能出现的字,以此类推。与我们在学习机器学习中的文字翻译Transformer架构很相似。

        正如下面的例子所演示的,当我们有目前有:“你好”这一个不完整的句子的时候,程序可以基于在互联网上学习到的知识去预测下一个字,有可能是 “美” 

         这种学习的好处是,我们并不需要人工标注出机器需要训练的内容,只需要把他放到互联网上,看到文字就自我学习文字接龙即可。

        但是,坏处也显而易见了,对于一个不完整的句子,我们后面的词可以是很多种多样的,比如说在 “你好” 后面,我们可以接上 “吗” 、 “高”、“美” 等,所以GPT返回的其实是一个概率分布,也就是说每次回答的内容其实都是随机的。这次说 “你好吗”,下次可能就说 “你好美了” 。

        但是单单依靠文字接龙,其实GPT就已经可以回答问题了。比如下面的例子,我们问出“台湾最高的山是哪座?” 当GPT在网上看过这么多资料,它通过文字接龙的形式回答,可能可以直接回答出玉山,也可能给你出一道选择题(如果他读过的资料是这么连接起来的),也可能反问你 “谁来告诉我呀?”

2.2 人类老师引导文字接龙方向

        经过了文字接龙,我们会发现GPT虽然能回答我们的问题,但是并不一定能回答出我们想要的答案。说白了就是人工来筛选哪些是我们需要的答案(还是逃离不了有多人工就有多智能呐!)

 2.3 模仿人类老师的喜好

        人类希望获得的答案就会被赋予更高的分数 

2.4 使用增强向模拟老师学习

        就是我们将每次GPT得到的答案都丢给TeacherModel来评判,如果是人类希望的答案就给高分,如果不是则给低分,这个模式被称为增强式学习种的“Reward”模块 

3. 当然,ChatGPT目前并不是完美的...

        目前ChatGPT模型已经很难再被找到错误了,但是根据上面的分析,我们只需要问出一些没有人问过的内容,他就回答不出来了。比如说:我问 “numbers”是由几个字母组成的,他会回答八个,这是八个吗???这明明就是七个!!!

4.总结 

        李宏毅老师认为本流程是GPT的社会化过程,从一开始的想说什么就说什么,一直到后面的人类引导他说出期望的答案。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20256.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

探索 Apple 公司股价数据-Python实现

探索 Apple 公司股价数据 环境和数据题目代码详解这个例子比较适合数据挖掘入门一段时间。都还是比较基础的一些函数的应用。 环境和数据 这里使用的是pycharm2020.1.1 x64的 一般都是用的是Python 3.7.3 一些包就自己看着下 处理的数据 -appl_1980_2014.csv,如下图 题目 …

ChatGPT老板的核能公司要上市了,估值61亿

尚恩 发自 凹非寺量子位 | 公众号 QbitAI OpenAI CEO的核能公司,宣布上市! Sam Altman旗下的核裂变初创公司Oklo Inc.已官宣,与空壳公司AltC Acquisition Corp.达成最终业务合并协议。 合并交易预计将于今年底或2024年初完成,合并…

【历史上的今天】2 月 24 日:乔布斯出生;苹果推出 Thunderbolt 接口;WhatsApp 创始人诞生

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2022 年 2 月 24 日,在 2010 年的今天,苹果公司宣布 iTunes 上面的音乐曲目下载量超过了 100 亿首,创下一大辉煌纪录;苹…

[苹果解密]创新是伟大公司诞生的源泉--Apple再度成为美国最大上市公司

近日不论美股还是A股,都是跌落的入水声一片,夹杂着小民的眼泪声和割肉声。但其中也发现了一个令人激动的消息:苹果已经成为美国最大上市公司!大概在去年,苹果就已经是美股IT业最大市值的上市公司了,而今天&…

分析师意外下调评级为中性,苹果财报能否改变科技股走向?

新年的投资热情为苹果市值短暂达到3万亿美元铺平了道路,这是有史以来第一家跨过这一门槛的美国公司。尽管许多华尔街分析师和投资者对苹果的评级为看涨,但目前Seeking Alpha的量化评级给苹果的评级为中性(HOLD)。 苹果将于1月27日公布2022财年第一季度财…

苹果收购公司,为什么总是低调而高效---转自百度新闻|DTCHAT

苹果真的太壕了。有多壕?在很多年里面,苹果是全球最值钱的公司。为什么那么值钱?主要是因为它一点也不缺钱。最能存钱截至2022年末,苹果手里的现金、现金等价物和有价证券总价值为1654.5亿美元。那些亏损的企业看到这里&#xff0…

基于WebGPU的AI原生3D引擎将会迎来新机遇!Orillusion在GOTC上做主题演讲

全球开源技术峰会(Global Open-source Technology Conference) GOTC 2023 由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起, 于 5 月 27 日至 28 日在上海顺利举行。 GOTC是面向全球开发者的一场盛大开源技术…

就ChatGPT最近这情况......大家还是多一手准备吧

大家期待的经济繁荣,没有来。 往年的金三银四,跳槽涨薪,也没有来。 最近硅谷的大公司裁员了17万,三个月的裁员数,超过了去年一整年的。 中国估计也没好太多,只不过很多公司没有爆出来而已,大家都…

由浅入深之字符串的算法题(vs: chatGPT做算法)

背景 俗话说,温故而知新。chatGPT效果太惊艳了!简直就是碾压的效果。但是还要有希望,先拾取,再创新。先了解,再超越吧。 ps: 再刷最后一遍算法题思路。顺便基于chatGPT3.5感受一下大模型的魔力。 字符串基础 C/C每个字…

Postman的使用:测试Excel文件导入导出

1.导入的测试方法 选择form-data,key值填写方法对应的参数,选择File,Value处上传文件即可。 2. 导出的测试方法 在导出文件的时候,响应结果是乱码,然后在测试的时候选择下载,下载完成的Excel文件不是乱码

postman 导出导入文件excel 请求方式设置

导出: 正常发送请求: 发送请求设置: 导入: post请求,接口参数 RequestParam("file") MultipartFile file

导入/导出 Postcat 格式文件,打通数据不再难

导入 Postcat 插件。 使用 导入功能有多个入口,你可以在 API 分组处点击加号导入 API: 也可以在点击设置,然后选择导入选项 导出 Postcat 插件 支持导出 Postcat JSON 文件。 使用 进入空间页面,可以看到导出功能,点…

chatgpt赋能python:Python怎么导入CSV文件?

Python怎么导入CSV文件? 导入CSV文件是Python编程中的一项非常常见的任务。CSV文件是一种结构化文件格式,通常用于存储表格形式的数据。Python提供了多种方法来导入CSV文件,如以下三种: 1. 使用csv模块 Python的csv模块是一种简…

postman测试Excel文件导入导出功能

导入Excel核心代码 ApiOperation("导入Excel")PostMapping("/importExcel")public ActionResult importExcel(RequestParam("file") MultipartFile file){if (file.getOriginalFilename().contains(".xlsx")) {ImportParams params n…

chatgpt赋能python:Python中的文件导入方法

Python中的文件导入方法 在Python编程中,需要经常导入外部的文件,以增强程序的功能和可读性。本文将介绍常见的Python中的文件导入方法。 import语句 Python通过import语句来导入其他.py文件中的模块,语法如下: import module…

搭建自己的学术科研专用ChatGPT

前言 最近在github上看到有大佬开源了一个科研工作专用ChatGPT,为此很感兴趣就根据说明自己在本地搭建了一下,此文章用来记录一下。github地址:科研工作专业ChatGPT 科研工作专用ChatGPT拓展,特别优化学术Paper润色体验&#xff…

ChatGPT prompt engineering for developers 笔记

最近好多人在推荐这个课程,学习记录一下~ 原视频 【中文完整版全9集】ChatGPT提示工程师|AI大神吴恩达教你写提示词|prompt engineering_哔哩哔哩_bilibili 完整笔记 prompt-engineering-for-developers/content at main datawhalechina…

latex的Windows安装教程:texlive和texstudio—经验汇总内含详细图文链接

最近因为有文章被外国某同行出版商(医学相关)看中,邀请把文章内容编成一个小章节,发过来一个tex文件,需要按照他们的要求进行排版,于是本小白开启了两天的卸载和安装过程。 结合大家的安装经验和我自己在安…

electron + vue3 + element-plus + blockly项目记录

目录 项目背景 框架版本 框架的个人理解 项目搭建 electron搭建 blockly(大坑) 开发 blockly 吐槽 electron loadFile和loadURL BrowserWindow.getAllWindows() 项目背景 笔者之前主要是做后端,前端只了解一点点,用…

C++ MFC 学习笔记+小型通讯录系统实现

MFC 最详细入门教程 [MFC常用函数总结](https://www.cnblogs.com/jiu0821/p/4606639.html) [C & MFC]https://www.cnblogs.com/gaohongchen01/p/4176963.html [MFC入门(一)]https://www.cnblogs.com/yangyuqing/p/10283641…