ChatGPT原理简明笔记

学习笔记,以李宏毅的视频讲解为主,chatGPT的官方博客作为补充。
自己在上古时期接触过人工智能相关技术,现在作为一个乐子来玩,错漏之处在所难免。
若有错误,欢迎各位神仙批评指正。

chatGPT的训练分为四个阶段:

  1. 给一段不完整的话,让基线模型(GPT3)学习怎么接话茬子。这个步骤基于GPT3进行fine-tuning。
  2. 弄一个人工标注的数据集,对1中的模型进行训练,通过人工数据集让GPT3了解人类的喜好。
  3. 基于另一个人工标注的数据集(包括问题、答案和人类打的分)训练一个打分模型,其功能主要在于:输入问题和答案,让打分模型根据排序进行打分。
  4. 用PPO让基线模型和打分模型进行对抗,优化GPT3,得到chatGPT。
    在这里插入图片描述

首先,chatGPT从网上找大量的语料学习怎么说话,其方式为文字接龙,即根据前面已有的句子成分来说下面的话。这个过程是无监督的。
在这里插入图片描述
但是,即使我们知道了半句话,这半句话的后面也可以接很多东西,所以输出的是一个概率分布。GPT模型要输出字的话,就从概率分布里采样。
在这里插入图片描述

学习文字接龙的用处在于,给GPT一段话它就可以续写,续写的一种可能就是回答问题了。
在这里插入图片描述

但是,GPT的输出是随机的,通过网上的语料进行学习,什么话都可能被这玩意拿来接。一个典型的例子是下图:

于是问题变成引导GPT产生有用的输出。
在这里插入图片描述
如何进行引导?让人类引导文字接龙的方向。通过引入一个人工标注的数据集,里面都是问题-答案,从而告诉GPT人类的偏好是什么。

在这里插入图片描述
这样的人工标注的问题-答案不需要太多,几万个足够。
本来chatGPT就有能力生成这些答案,但是需要让它知道并模仿人类的喜好。

第三步,训练一个新的Teacher model,数据集中的元素主要包括:一个问题和几个针对这个问题的答案,每个答案都打了分。
在这里插入图片描述

最后,用强化学习PPO算法让GPT和Teacher model进行对抗。

在这里插入图片描述
chatGPT仍然不是完美的。本质上,它还是学习了两点:人类怎么说话和人类的偏好。ChatGPT根据人的偏好来说话。
在使用中的一个比较致命的点:让它找文献的时候它存在一定的概率瞎编几个。
再比如,可以用一些冷门问题(没有涵盖在2和3的数据集中的问题)来头吸:
在这里插入图片描述
下图是openAI给出的插头GPT的训练图。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2646.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT原理解读

目录 GPT痛点基于人类反馈的强化学习机制(ChatGPT)step1:Fine-tune SFT模型step2:训练Reward模型step3:强化学习训练PPO模型 一些技术问题猜想ChatGPT的多轮对话能力ChatGPT的交互修正能力 GPT痛点 GPT作为一个通用大…

ChatGPT 基地

大家好,我是贺同学。 一直以来密切关注 ChatGPT 的趋势,最近相关的话题可谓是热度不减,并且相关的付费社群已经有雨后春笋般冒出来很多,但我最近发现一个比较独特的星球。 在这个星球里面,大家不搞噱头,而是…

关于安卓以及微软用户chatgpt上一篇文章如今第五点无法正常进入更新解决方法以及附加本地部署

目录 一、问题出现: 1、问题: 原因: 二、解决办法(本地部署chatgpt) 1、解决(国内网络使用真的chatgpt并非镜像)一次部署终生使用 第一步: ​编辑第二步: 三、实现结…

chatgpt赋能python:Python手机App开发:打包你的Python代码并在Android或iOS上运行

Python 手机App开发:打包你的Python代码并在Android或iOS上运行 Python是当今最受欢迎的编程语言之一,经过了十多年的发展,其用户群体已经非常庞大,和诸多行业广泛应用。从网站开发到机器学习和Data Science,Python都…

ChatGPT:如何使用正在改变一切的 AI 聊天机器人

转载自ChatGPT: How to use the AI tool thats changing everything | Digital Trends DownLoad 个人中心 ChatGPT 继续通过AI 生成的内容让互联网眼花缭乱,从一个新颖的聊天机器人转变为一项推动下一个创新时代的技术。不过,并不是每个人都参与其中&…

谷歌或被抛弃!ChatGPT 引爆手机市场新一轮洗牌:Android 手机销冠三星30亿美元大单欲改投 Bing...

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 整理 | 褚杏娟 核子可乐 今年三月,谷歌员工突遭意外打击:韩国消费电子巨头三星正考虑用微软 Bing 取代谷歌搜索,作为其设备上的默认搜索引擎。 以 New Bing …

利用ChatGPT进行表格的数据分析!

第一步:既然是分析表格数据,我们就先让GPT来生成一组表格数据,提问问题如下,你也可以自己发挥 请给我生成10组表格数据,姓名,年龄,基本工资,全勤奖励,绩效奖金&#xff0…

chatgpt帮你制作excel表格

场景: 让chatgpt帮你制作工作表格方法 输入你的需求,让chatgpt帮你解答逐步添加需求

ChatGPT辅助处理excel表格数据

选择使用方法 找现成的工具。试了两个,有各种问题。比如比如北大团队出品的ChatExcel等。我的表格列比较多,上传文件后需要砍掉一部分。输入几个命令以后就识别不了了。即使识别到了,输出也受限制,还不如手工处理。另外&#xff…

让ChatGPT来制作Excel表格,ChatGPT实现文本和表格的相互转换

Office 三套件可以说是现代办公族必备的办公工具。其中,Excel 因为内置的计算函数、VBA 宏等高级功能又成为了非专业人士最头疼的 Office 组件。非财务专业人士,估计平常会用的 Excel 函数仅限于 SUM(), AVERAGE() 等,甚至这些都是通过界面点…

使用ChatGPT处理Excel表格-终极指南

ChatGPT是由OpenAI开发的人工智能聊天机器人,可用于各种Excel任务,以提高您的办公效率,无论您是会计师、金融分析师、经理、管理员还是其他企业专业人士。 我们将讨论ChatGPT在Excel中可以帮助您的顶级方法。您会惊叹于使用ChatGPT将办公室在…

这么方便吗?用ChatGPT生成Excel(详解步骤)

文章目录 前言使用过 ChatGPT 的人都知道,提示占据非常重要的位置。而 Word,Excel、PPT 这办公三大件中,当属 Excel 最难搞,想要熟练掌握它,需要记住很多公式。但是使用提示就简单多了,和 ChatGPT 聊聊天就…

ChatGPT使用技巧—如何快速制作表格?

一、背景: 在学习或工作中,时常会需要做一些表格进行数据统计、分析,通常我们会用word或者excel做出表格,然后把数据一个个复制进去,非常慢,用了ChatGPT之后,你会发现工作会变得如此简单…

使用ChatGPT做简单Excel表格及数据分析

解锁 ChatGPT 表格能力 如果我们想用ChatGPT做一些简单的表格 或者想让他具备编辑分析能力 只需要在提问的时候告诉 ChatGPT:请以表格的形式展示回复的内容 这么说... 可能有点抽象 下面我们就用一个完整的例子展开学习一下 举例 假如我们拿到了下面这组数据 希望…

Chatgpt使用技巧(一):Chatgpt处理python+excel+tableau的技巧。

#分享一个使用chatgpt处理pythonexceltableau的技巧。 首先需要一个chatgpt的账号,如果没有的话可以在csdn中使用。 其次(图一)中是我建的excel样本。 我通过询问(图二)chatgpt获取python跑取excel的代码。 然后绘制…

chatGPT是什么?最新需要了解的都在这

ChatGPT是什么? ChatGPT是一种基于人工智能的聊天机器人。它能够使用自然语言处理技术,与人类进行交互,并回答各种问题或提供帮助。ChatGPT的目的是为了让用户更容易地获取所需信息,并进行沟通。 ChatGPT是一款基于人工智能技术的…

ChatGPT更新说明(20230524)

原文传送门:ChatGPT — Release Notes 更新说明(5月24日) 简要:iOS应用在更多国家可用,Alpha测试中的共享链接,Bing插件,iOS上的历史记录禁用 ChatGPT iOS应用在更多国家可用 好消息&#xf…

突发!ChatGPT!王炸级更新!!!

ChatGPT宣布推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力。 有多牛逼,举例来说,之前的 ChatGPT 如果相当于 iPhone手机的话,现在的插件就相当于苹果的 App Store。 直接解决了ChatGPT原有不能联网的问题,原…

[技术杂谈][chatgpt]chatgpt相关开源代码地址汇总

1、有预训练模型且可以训练自己的数据集: OpenChatKit: GitHub - togethercomputer/OpenChatKitContribute to togethercomputer/OpenChatKit development by creating an account on GitHub.https://github.com/togethercomputer/OpenChatKit dolly:…

iOS版ChatGPT初体验,还支持语音输入 !

北京时间5月19日凌晨,OpenAI官方推出了iOS版ChatGPT。 据介绍,iOS版ChatGPT供用户免费使用,并在不同设备(移动端和网页端)上同步聊天历史。同时,它还集成了开源语音识别系统Whisper,可以实现语音…