【LLM GPT】李宏毅大型语言模型课程

目录

  • 1 概述
    • 1.1 发展历程
    • 1.2 预训练+监督学习
      • 预训练的好处
    • 1.3 增强式学习
    • 1.4 对训练数据的记忆
    • 1.5 更新参数
    • 1.6 AI内容检测
    • 1.7 保护隐私
    • 1.8 gpt和bert
    • 穷人怎么用gpt
  • 2 生成式模型
    • 2.1 生成方式
      • 2.1.1 各个击破 Autoregressive
      • 2.1.2 一次到位 Non-autoregressive
      • 2.1.3 两者结合
    • 2.2 预训练和微调
    • 2.3 指示学习 instruction learning 和 上下文学习 in-context learning
      • 2.2.1 上下文学习 in-context learning
      • 2.2.2 指示学习 instruction learning
      • 2.2.3 chain of thought (CoT) prompting
      • 让模型自动生成prompt
    • 2.3 训练数据的预处理
    • 2.4 Human Teaching (强化学习)
    • KNN+LM
    • 2.5 信心越高,正确率越高
  • 让AI 解释AI
    • 如何判断解释的好不好?
    • 大致流程

1 概述

怎么学习?——给定输入和输出:
在这里插入图片描述
但是这样做不现实,因为这样输入-输出需要成对的资料,而chatgpt 成功解决了这一个难题。

chatgpt不需要成对的资料,只需要一段有用的资料,便可以自己学习内容,如下:
在这里插入图片描述

1.1 发展历程

初代和第二代gpt
在这里插入图片描述
第二代到第三代
在这里插入图片描述
gpt3还会写代码
在这里插入图片描述
其性能表现
在这里插入图片描述
但是gpt3也有缺点在这里插入图片描述

1.2 预训练+监督学习

想要实现chat的功能,就得经过一个监督式学习(问答),就要在预训练后,增加一个监督学习的流程,赋予模型问答能力
在这里插入图片描述

预训练的好处

在多种语言上做过多训练以后,某一语言的任务会帮助其他语言学会同样的任务。

在这里插入图片描述
在这里插入图片描述

实验数据如下:
在这里插入图片描述

1.3 增强式学习

chatgpt还引入了增强式学习,给好的回答更多奖赏回馈。
在这里插入图片描述

1.4 对训练数据的记忆

其能够记得训练数据的部分信息:
在这里插入图片描述

1.5 更新参数

可以通过对话改变其记忆:

在这里插入图片描述

1.6 AI内容检测

检测某一段文字是否为AI生成的,最简单的做法是这样:
在这里插入图片描述

1.7 保护隐私

有时候模型会泄漏训练数据,需要遗忘学习:
在这里插入图片描述

1.8 gpt和bert

一个是做文字接龙,一个是做文字填空:
在这里插入图片描述

穷人怎么用gpt

方法1 缩短输入


把多个问题一起丢进去:
在这里插入图片描述
方法2 自建模型

方法3 LLM cascade

2 生成式模型

主要分为以下三种,注意英文的token指的不是单个完整的单词,而是要把一个单词拆分成前缀后缀的形式,拆解成更小的单位:

在这里插入图片描述

2.1 生成方式

生成式有两种策略——各个击破一次到位,下面先介绍各个击破

2.1.1 各个击破 Autoregressive

每次生成一个(token),然后按照序列形式把全部完整的内容生成:
在这里插入图片描述
这种方式生成效果好,但是所需要的时间长。%

2.1.2 一次到位 Non-autoregressive

x需要先设定最大输出长度,由于不需要每次都保证输出的内容一样长,需要一个end标志符表示结束。
在这里插入图片描述
两者比较:
在这里插入图片描述

2.1.3 两者结合

在这里插入图片描述

2.2 预训练和微调

一般都是先训练一个通用模型,然后在某些任务上做微调(finetune)。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2.3 指示学习 instruction learning 和 上下文学习 in-context learning

和chatgpt进行交互的时候,我们的promt可能包可以分为两种情况:指示学习 instruction learning 和 上下文学习 in-context learning。所以在模型训练阶段,我们需要制造一些成对的语料数据加强模型的这两种学习的能力。

前者是给模型一些指示,当模型进行学习和回答,后者是通过一些例子,让模型进行学习和回答。

2.2.1 上下文学习 in-context learning

即让机器在例子中进行学习。为got提供一些例子,比如情感分析中:
在这里插入图片描述
但是不同于传统的模型更新(梯度下降),这里gpt的学习,不会更改其模型参数。
通过例子,虽然不会提升多少情感分析的能力,而是为了唤醒gpt的情感分析能力,这个结果来自一篇文献的实验结论。
在这里插入图片描述

2.2.2 指示学习 instruction learning

让gpt能够看懂指令:
在这里插入图片描述
一个指示学习的例子:判断这句话的情感:给女朋友买了这个项链,她很喜欢。选项:A=好;B=一般;C=差。

训练阶段和测试阶段,可以是不同的任务的指示。
在这里插入图片描述
用人类的语言训练:
在这里插入图片描述

2.2.3 chain of thought (CoT) prompting

让模型给出推理过程,这样能够让模型做出更正确的答案。
在这里插入图片描述
让模型具备这个能力,就得在模型训练阶段给出这样的“带有推理过程”的语料。
在这里插入图片描述

让模型自动生成prompt

这里的promt也可以理解为指令。
1。 使用 soft prompt
之前我们讲的都是hard prompt,但其实还有soft prompt,给一堆向量而不是人类语言。
在这里插入图片描述
2. 使用强化学习。
在这里插入图片描述
3. 让模型自己寻找,下一些特殊指令:
在这里插入图片描述
最佳指令可以极大的提升模型的性能:
在这里插入图片描述

2.3 训练数据的预处理

数据的收集和处理需要用到以下内容:
在这里插入图片描述
去掉重复资料的重要性:假设一段话在训练数据中出现了6w多次,会发现模型很容易说出这些话,因此应该避免这种情况。

在固定运算资源的情况下,如何选择模型规模和数据集规模?有人做了相关实验,一条线表示固定的运算资源情况下的结果,纵轴的越小越好:
在这里插入图片描述
所以要找到每个U型曲线的最低点,把这些最低点串起来可以得到如下的图:
在这里插入图片描述
模型规模和资料最佳适配比:
在这里插入图片描述
除此以外,指示学习(instruction-tuning)也可以大大提升模型的性能。
在这里插入图片描述
在这里插入图片描述

2.4 Human Teaching (强化学习)

这也是一种辅助模型训练的技术(强化学习),可以有效提高模型的性能,让小模型吊打大模型的性能。
在这里插入图片描述

在这里插入图片描述

KNN+LM

一般的LM是这样的运作方式:
在这里插入图片描述
而KNN+LM是这样的,寻找embedding的相似度
在这里插入图片描述
这样做会带来什么神奇的效果?
d
但是这种语言模型非常的慢

2.5 信心越高,正确率越高

在这里插入图片描述

让AI 解释AI

来解读一下这篇文章:
在这里插入图片描述
解释什么?——知道每一个神经元的作用、和哪些词关联度最大:
在这里插入图片描述
有工作发现了某一个神经元遇到以下词时输出会很大,通过观察发现,下一个会出现“an”:
在这里插入图片描述
在这里插入图片描述
如何操作?输入以下promt:
在这里插入图片描述
能得到以下结果:
在这里插入图片描述
其他结果:
在这里插入图片描述

如何判断解释的好不好?

在这里插入图片描述
然后去gpt2模型找到那个神经元检查一下:
在这里插入图片描述

完整的prompt

在这里插入图片描述
纵轴表示可解释性的分数,分数越高,可解释性越好,结论是小模型更容易解释、越底层的神经元越容易解释。
在这里插入图片描述

大致流程

在这里插入图片描述
让模型扮演一个神经元:
在这里插入图片描述
寻找神经元在什么时候激活值较大:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47538.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4比人类更懂融资!AI企划书让VC疯狂打call

尚恩 发自 凹非寺量子位 | 公众号 QbitAI 你敢信,一份由AI写的融资企划书,竟然引发VC疯狂追捧! 甚至有VC投资人当场承诺,愿意给这份由GPT-4生成的企划书直接投资。 又一个用GPT赚钱的小技能,Get。 对此咱真不得不感叹一…

微信小游戏个人开发者上架:从注册到上线的详细步骤

微信小游戏个人开发者上架:从注册到上线的详细步骤 一,注册小程序账号1.1 微信公众平台1.2 填写信息1.3 绑定管理 二,打包步骤2.1 工具准备2.2 关于Unity版本2.3 打包详解 三,提包步骤3.1 填写用户隐私3.2 完善开发者自查3.3 游戏…

对标GPT核心技术RLHF!港科大开源RAFT「木筏」,适用GPT扩散模型

梦晨 发自 凹非寺 量子位 | QbitAI 开源大模型火爆,已有大小羊驼LLaMA、Vicuna等很多可选。 但这些羊驼们玩起来经常没有ChatGPT效果好,比如总说自己只是一个语言模型、没有感情blabla,拒绝和用户交朋友。 归根结底,是这些模型没…

DDPM详解 AI绘画

话说DDPM DDPM模型,全称Denoising Diffusion Probabilistic Model,可以说是现阶段diffusion模型的开山鼻祖。不同于前辈GAN、VAE和flow等模型,diffusion模型的整体思路是通过一种偏向于优化的方式, 逐步从一个纯噪音的图片中生成图…

对抗生成网络GAN系列——DCGAN简介及人脸图像生成案例

🍊作者简介:秃头小苏,致力于用最通俗的语言描述问题 🍊往期回顾:对抗生成网络GAN系列——GAN原理及手写数字生成小案例 🍊近期目标:写好专栏的每一篇文章 🍊支持小苏:点赞…

用户画像·用户性别预测

文章目录 一、为什么进行性别预测二、特征数据选取三、算法选择四、代码示例1、使用朴素贝叶斯,进行建模2、使用支持向量机3、使用逻辑斯蒂回归 一、为什么进行性别预测 用户注册时,所填写的性别,存在大概率的随意性;不能完全作为…

云开发视频资源变现微信小程序源码

简介: 云开发视频资源变现微信小程序源码,带有流量主功能。获取视频,获取资源需先看广告,资源变现小程序全源码无删减,自己付费做的。 主要功能,就是用户想观看你的视频或者获取你的资源,就需…

拉伯证券|年报行情如火如荼 博弈“超预期”还须警惕“风险点

本周以来,在指数转入高位盘整的背景下,A股商场资金围绕年报头绪展开布局,“年报预增”一跃成为商场最强主线,不少成绩预增公司短期股价收获明显超额收益。 Choice数据显现,截至1月12日盘前,开年以来共136家…

基于上证金融数据的情感分析和走势预测 代码+数据

目录 情感分析结果: ​编辑 首先是获取 股票评论数据的网站: 程序: 数据展示: 情感分析结果: 首先是获取 股票评论数据的网站: 上证指数股吧_上证指数分析讨论社区-东方财富网 程序: im…

FTT暴雷加密熊市雪上加霜?如何对抗系统风险

11月加密领域,正在上演一场新的戏剧:CZ vs SBF。 行情及后续风险预判,这是一场亿万富翁之战。中心化交易所币安和FTX的首席执行官CZ和SBF正在对峙。 FTX事件到11月11日似乎进入了一个新的阶段,在过去的几天里发生的事情几乎可以确…

fastposter v2.9.3 简单易用的海报生成器

🔥🔥🔥 fastposter海报生成器是一款快速开发海报的工具。只需上传一张背景图,在对应的位置放上组件(文字、图片、二维🐴、头像)即可生成海报。 点击代码直接生成各种语言的调用代码,…

fastposter v2.6.1 发布 程序员专属海报生成器

fastposter v2.6.1 发布 程序员专属海报生成器 fastposter电商级海报生成器,程序员专属海报生成器,一分钟完成海报开发,轻松在线作图。支持Java、Python、PHP、 Go、JavaScript等多种语言。 v2.6.1 发布 程序员专属海报生成器 解决Windows下…

你是如何看待“孔乙己的长衫”?

学历是一个十分有争议的话题,观点不一,这使得这个话题讨论起来令人热血沸腾。就人生而言,学历是否会成为敲门砖或枷锁,可以说是个纯粹的看法和态度问题。 首先,我们要看到学历本身。学历是告诉人们你有哪些学科的专业…

浅谈“孔乙己”的长衫

书中的孔乙己 孔乙已是鲁迅笔下人物,穷困流倒还穿着象征读书人的长衫,迁腐、麻木。最近,大家自我调佩是“当代孔乙己”,学历成为思想负担,找工作时高不成低不就。 当代的“孔乙己” 如今社会,从小学开始每…

打工人都在用的AI工具

随着ChatGPT的问世,AI也算迎来了高光时刻!下文是技术宅整理的一些和ChatGPT相关的工具应用,排名不分先后,也不代表个人推荐,但真心真心好好用,主打的就是一个纯粹! 本文将先分享10个有趣的AI小工…

巴黎时装周儿童单元上海站圆满落幕,代言人陈沫含亮相并献上精彩走秀

3月18日,巴黎时装周儿童单元上海站在上海宝华喜来登酒店圆满落幕。巴黎时装周儿童单元(又名:巴黎儿童时装周)由巴黎高定协会(Paris advanced customization Association,PACA)及法国视听艺术协会(Association franaise…

人工智能迎来高光时刻,拟人化AI进入爆发前夜

3 月,随着 OpenAI 新一代模型 GPT-4 以及百度“文心一言”的正式公布,通用人工智能 AGI 的概念再次点燃全球社交平台。从最初的文字对话到如今的看图写代码,AGI 领域终于迎来了属于自己的“iPhone 时刻”,而对话式 AI 这一充满无限…

Meta发布LLaMA 2:分析及解读

Meta发布了LLaMA的新版本。该版本将被称为LLaMA 2,并且可以免费用于研究和商业用途。这是Meta和Microsoft联合发布的成果。 我认为微软希望垄断所有第三方LLM,并将它们作为SaaS(软件即服务)保留在自己的平台上作为商业产品。现在…

用Rword2vec告诉你券商的推荐买股票是否靠谱

最近国内A股走势不错,又有听到周边有不少同事打算入市了。那么咱们IT人员如果相关金融知识不多,又不想买基金交管费的话,跟着券商的推荐买行不行呢? 如果是零基础的朋友请参考https://blog.csdn.net/BEYONDMA/article/details/879…

音频合并的软件有哪些?这几个软件分享给你

我们平时听过的歌曲串烧,是由多首歌曲拼接起来的。如果大家不想在听音乐时手动切换歌曲的话,不妨试试使用软件,将歌曲剪辑拼接起来。但是作为剪辑小白,不知道音频拼接软件哪个好用。没关系,下面给你们分享几款手残党也…