【笔记】ChatGPT是怎样炼成的(李宏毅2023机器学习课程引入部分)

来源:【授权】李宏毅2023春机器学习课程
ChatGPT太火热了,借此简单了解一下


ChatGPT的newbie之处在哪里?
同一个问题,它的每次回答都不同;处于同一个chat中,我可以追问多个问题,因为它知道上下文。

对于ChatGPT的误解

误解1: ChatGPT的回应是罐头回应。(ie. 比如我让ChatGPT给我讲个笑话,罐头回应就是程序员让ChatGPT事先准备好了一些笑话,ChatGPT从中随机抽一个来回答我)
解释: 不是罐头回应哦,下文会解释。

误解2: ChatGPT的回答是Google一下的结果。
解释: ChatGPT不联网。它是用2021年前的网络数据训练的,所以问它2021年后的问题它会回答“无法预测”。

对于ChatGPT的正解

ChatGPT的工作原理实质是:文字接龙
作为一个函数function,它的 input 是历史对话信息+我们输入的问题(eg. 历史对话信息+"什么是机器学习?")。
它的 output 是跟在 input 之后的可能紧跟着的词汇出现概率分布(eg. 机50%、是30%、我10%、所20%),然后ChatGPT选那个概率最大的(eg. 输入变成了 历史对话信息+"什么是机器学习?机")。至于候选的词汇,是sample出来的(所以每次它的回答都不一样)。那么何时结束呢?当候选词中“end符”的概率最大时。
在这里插入图片描述

李宏毅老师猜测ChatGPT这个模型拥有1700亿以上的参数。

ChatGPT的关键技术

pre-training预训练(或者叫 self-supervised model自监督模型 / foundation model基石模型)
从名字就可以体现—— ChatG(generative) P(pre-training) T(transformer)
预训练技术的出现动机:人类能给出的带标签的训练数据是非常有限的,是成本很高的。
ChatGPT所需的对话数据,如果人工给出则非常耗时,但是其实网络上的每一段文字都能够作为文字接龙的训练数据。eg. [世界第一高峰是(input)] [喜马拉雅山(output)]。如果我们能让机器自己学习这些数据,就可以大大提高效率。
在这里插入图片描述

ChatGPT的历史

一代GPT-2018年。二代GPT-2019年。三代GPT-2020年(数据量已经到达了570GB)。ChatGPT是在三代GPT(GPT3)的基础上,补充了一些人为标注的数据集,然后训练的。

ChatGPT的结构

在这里插入图片描述
GPT是纯靠预训练而成的基石模型。在GPT的基础上,加上监督学习(ie. 带标签数据)和增强学习(ie. 告诉机器它的输出是√还是×),训练成了ChatGPT(这一过程叫做微调)。

ChatGPT的有趣

网络上有许多调教ChatGPT的教程。
ChatGPT还可以结合midjourney,生成剧情游戏(视频里演示了一个,有一点点点无聊)。
在这里插入图片描述

ChatGPT带来的研究问题

  1. 如何精确提出需求,让ChatGPT精准回答?——使用催眠prompting
  2. 如何更正ChatGPT的错误/更新2021年之后的信息?——Neural editing
  3. 如何侦测AI生成的物件?
  4. ChatGPT不小心泄露秘密怎么办?——machine unlearning

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42583.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

登录、退出(关于token)

关于token https://www.jianshu.com/p/8d28e60af440 一般APP都是刚安装后,第一次启动时需要登录(提示你需要登录或者直接启动在登录界面)。而只要登录成功后,以后每次启动时都是登录状态,不需要每次启动时再次登录。…

ChatGPT商业版免授权源码/AI绘画系统/用户付费系统

🎉 有需要的朋友记得关赞评,文章底部来交流!!! 🎉 ✨ 源码介绍 最新 ChatGPT商业版源码,该产品支持用户付费套餐,AI 绘画,支付对接,卡密购买兑换等功能&#…

Latex投稿Elsevier后被要求修改格式(三)图、表和算法汇总

目录 1. 图 2. 表 3. 算法 想要在Latex中加入相关图、表和算法只要将对应的代码段放在正确的位置即可,这个“正确”就是文中提到图、表和算法的段落下方啦~~ 附上Latex文章代码(这里面还没有图、表和算法) Latex投稿Elsevier后被要求修改…

Latex投稿Elsevier后被要求修改格式(四)如何修文章References的颜色

论文到了修改阶段,不可避免就要标记对应的修改部分,之前修改设计的都是正文部分的内容,修改颜色的代码相对简单, 如下所示: \textcolor{blue}{正文修改后需要标记的句子} 这样的代码无法跨行标记,想要实现…

视频编辑软件有哪些?介绍几种功能强大的编辑软件

视频编辑软件有哪些呢?如果我们录制了一段视频,但是其中包含了一些无用或者不太好的片段,我们就需要进行视频修剪,剪掉这些片段,让视频更加精炼。通过修剪视频素材,我们可以将一些不必要的部分去掉&#xf…

CDN,高防IP接入报错504是为什么。解答方案一。

当出现504错误的时候,说明节点和源之间的通信出了问题,一般都是因为没有加白名单引起的,源IP要给节点IP加白名单,节点IP也要给源IP加白名单。而像阿里云ECS这种类型的,很多人以为这个是没墙的不用加白,其实…

大模型之外,阿里云对未来的真正布局是什么?

2023年,阿里云进入到了新的发展阶段。作为全球市场第三大、中国市场第一大公共云,阿里云在截止到2022年3月的2022年财年,已经实现13年来首次实现年度盈利,营收规模在8年时间增长了57倍,2023年财年前三财季营收超过了65…

CSDN蒋涛对话阿里云CTO周靖人:大模型风起云涌,阿里云将毫无保留地开放各项能力...

4月 7 日,阿里大语言模型“通义千问”官宣邀测引发热议,国内大模型一触即发。 今天在2023阿里云峰会上,阿里云智能首席技术官周靖人正式发布“通义千问”。阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试…

阿里云李钟:弹性计算控制系统团队的提效之路

2023 年 3 月 25 日,“城市领航之夜第一期”活动在上海举行,阿里云弹性计算控制系统技术架构负责人李钟出席了本次活动并带来了《弹性计算控制系统团队提效之路》的主题演讲,为大家详细分享了阿里云弹性计算控制系统团队所面临的挑战、如何通…

树莓派声控小车

树莓派声控小车 一、实验方案设计 声控小车的实现方案由三部分组成:①语音识别指令;②控制小车;③语音识别指令直接控制小车。 1.语音识别指令 识别声音利用百度AI开放平台的语音识别功能。由于搭配的麦克风和可识别音频的采样率不同&…

当我获取了文心一言的体验资格,立刻重复了和李彦宏发布会一样的问题,看看文心一言有没有进步(或者是“退步”?

当我获取了文心一言的体验资格,立刻重复了和李彦宏发布会一样的问题,看看文心一言有没有进步(或者是退步? 引言文心一言申请方法测试结果文学创作《三体》的作者是哪里人?可以总结一下三体的核心内容吗?如果…

年终反思潮!李彦宏:“马化腾说的问题,百度也都有……”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 到了年末,难免少不了“年终总结”、“反思潮”,互联网的“大佬”们怎能落下? 前段时间,马化腾在 2022 年内部员工大会上,谈及…

谷歌一雪前耻!全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化

来源:新智元 【导读】新版PaLM 2超强进化,办公全家桶Workspace全面升级,Bard全面增强、所有人可用……可以看出,这届I/O大会,谷歌是真的憋出不少大招。 谷歌I/O 2023大会,仿佛又给谷歌的支持者们打了一针强…

阿里巴巴取消 CTO 一职;近半数微软员工担心被 AI 抢饭碗;Flutter 3.10 发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

图灵奖得主杨立昆炮轰ChatGPT:五年内就没人用了

近日,图灵奖得主杨立昆现身芒克辩论会,他表示,每一项科技都会伴随风险,但 AI 会屈从于人类并服务人类。“ChatGPT 并没有真正理解现实世界,因为它们都是纯粹的文本训练,而人类的大部分知识与文本或语言无关…

微信流量主小程序源码万能工具箱+完整搭建教程

微信流量主小程序源码系统万能工具箱小程序源码,自带流量主广告位功能,新手小白即可快速上手,带完美搭建教程。 微信流量主小程序源码系统春哥万能工具箱小程序源码源码下载地址:春哥技术博客

代码随想录第二天| 977.有序数组的平方 、 209.长度最小的子数组、 59.螺旋矩阵II

977.有序数组的平方 977. 有序数组的平方 - 力扣(LeetCode) 代码随想录 (programmercarl.com) 1.暴力解法 class Solution:def sortedSquares(self, nums: List[int]) -> List[int]:for i in range(len(nums)):# nums[i] pow(nums[i], 2)nums[i] *…

【AIGC】大模型协作系统 HuggingGPT 深度解析

欢迎关注【youcans的 AIGC 学习笔记】原创作品 【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要2. 前言3. HugginGPT 大模型协作系统3.1 任务规划3.2 模型选择3.3 任务执行3.4 响应生成 4. HugginGPT 测试案例4.1 实验条件的设置4.2 定性的实验结果4.2.1 任务之间存在资源…

chatgpt赋能python:Python访问控制

Python访问控制 Python是一种非常流行的编程语言,它具有很多优点,其中包括易学、易用、可读性高等等。但是,在编写Python代码时,访问控制是一个很重要的话题。访问控制可以帮助您保护您的代码,并防止非授权用户访问和…

chatgpt赋能python:Python访问网络路径的SEO指南

Python访问网络路径的SEO指南 在当今互联网时代,访问网络路径是一项极为常见的技能。Python作为一种高效、灵活的编程语言,也可以用于访问网络路径。本文将为大家详细介绍Python访问网络路径的方法和技巧,并介绍如何通过优化Python代码来提升…