ChatGPT 介绍篇:ChatGPT 的前世今生

今天是我们的第一篇 ChatGPT 的前世今生

本篇文章会从 GPT-1 一直讲到 GPT-4 ,看一看现在火爆的ChatGPT 背后,到底经历了些什么。

我们要想知道 ChatGPT 为什么爆火,这就要我们静下心来,稍微理解一下 NLP 领域的一些历史故事。

NLP 是自然语言理解的缩写,属于 AI 人工智能领域的一个分支,主要目的是让计算机能够理解,解释和生成人类的语言。

 

早在 2018年之前,实际上 NLP 自然语言理解已经基本处于半废的状态,市面上几乎没有可以说得上的产品存在。这是因为 NLP 之前缺乏大规模数据集,计算能力,以及有效的算法和模型,导致整体 NLP 领域发展非常缓慢。

而到了 18年6月 OpenAI 推出了预生成语言模型 GPT 。

GPT-1

其中 GPT 第一代,也就是 GPT-1 使用了7000本书籍作为训练集,总大小大约 5G 左右,最关键的是 GPT-1 是一个生成式预训练语言模型,这种模型通过两个阶段来进行训练,包括先通过无监督模式进行通用语言模型的训练,再针对特殊的下游任务,比如对文本分类,问答等任务进行微调

 

虽然通过微调后的 GPT-1 模型在各个任务上都超过了原有的模型,但这也导致GPT-1 使用起来比较麻烦,因为所有的下游任务都需要进行微调

GPT-2

而到了2019年2月的GPT-2 , 它使用了 800万份文档,大约 40GB 的数据作为训练集,同时 OpenAI 为了解决所有任务都需要微调的麻烦,提出了一个叫做 zero-shot 的概念,也就是训练完的模型不需要做任何微调,不管你的下游任务是什么,模型都可以直接应对

怎么做到呢?

这里通过的是暗示,或者说提示,也就是告诉模型它需要完成什么任务

 

这就像是我们现在在使用 ChatGPT 的时候,想让它做什么事情,会告诉它,比如你想让他做翻译。

那么就告诉它,请翻译以下句子。这时候把提示“请翻译以下句子”和问题本身一起传入到模型中。模型就知道你要做什么事情了,那不管是翻译,分类,还是其他下游任务,通过 GPT-2 就完全可以在不用微调的情况下,依然可以应对。

这时候 GPT-2 的出现,真正的让 NLP 领域看到了希望,这个希望就是可以通过一个统一的生成式大模型来完成所有下游任务,而不是再像往常一样,每个任务都还需要单独训练模型。

那为什么 19年的时候大家没有听说过 GPT-2 呢?

这主要因为 GPT-2 虽然有了 zero-short 的概念,但实现的效果并不理想,生成的内容很可能并不合适,也会有很多虚假的信息,歧视类的信息,甚至是陷入死循环。这是因为 GPT-2 在训练的过程当中,并不知道哪些信息对人类友好,哪些信息又算作歧视,并且生成内容的多样性做的也不好。

GPT-3

到了2020年5月,GPT-3首次亮相,它的训练包含了多个数据集大约 45TB 的训练数据,这让 GPT-3的模型可以说是上知天文,下知地理,在多项自然语言处理任务上都取得了非常惊人的表现,后面 OpenAI 也推出了 API , 让广大开发者可以调用模型进行体验,那时据统计每天就会产生 450亿个词,相当于每小时写了100w 本书,

大家要知道,那时候大众基本都没听过 GPT ,可想而知现在 2023年3月份这个数据会多么恐怖。

除了训练集变大外,GPT-3 当中将 GPT-2 的 zero-shot 概念进行延展。推出了另外两个概念 Few-shot 和 One-shot 。

ChatGPT从基础到项目实战icon-default.png?t=N3I4https://edu.csdn.net/course/detail/38557

 

 

 

zero-shot 我们刚才知道了,相当于提问的时候加上个提示指令,比如翻译以下句子为英文。

one-shot 相当于,在提问的时候给个例子,还是以翻译句子为例,如果你想要固定的格式,可以提前给模型一个例子,这样模型可以参照你的例子来进行内容生成。

如果一个例子不够或者说效果不好,那就需要 few-shot 给多个例子,让模型更加详细的了解要做的事情。

这三种方式本身都没有更新模型,但却可以让模型实现不同的下游任务。

而且 zero-shot , one-shot , few-shot 随着我们给的例子越多,模型生成的效果就会越准确,虽然准确了,但这时候会导致另外一个问题,就是模型调用成本变大了,因为每次提问的时候问的字数多了。

但这种庞大的训练数据也导致了一个问题,懂的内容太多了,这就会在回答问题的时候随意联想,有时候看起来就像是胡说八道,说的内容也不受约束。

那为什么只有 OpenAI 把这个事情做成了呢?

因为他有一个金主爸爸 - 微软。

 

微软专门在 OpenAI 的总部设置了一个数据中心,用于训练这些模型。这其中每年耗费的算力资源是非常恐怖的,OpenAI 官方的数据是说 GPT-3使用了上万个 GPU 进行训练,光电费就花费超过 1200 万美元,所以 GPT 这种大语言模型不是任何一家小企业可以玩的,只有顶级的云计算厂商在不确定未来的情况下,依然舍得持续投入,才有可能做出来。

ChatGPT

那我们前面提到的都是 GPT ,而不是 ChatGPT 。

这是因为 ChatGPT 本身实际相当于 GPT 模型的一个扩展,基于 GPT 模型, OpenAI 做出来的一个应用层,让其模型本身可以真正的用于去解决一些问题,并给到更多用户进行体验。

 

而这里最关键的就是如何让 GPT 更像人,而不是一个机器一样的生成文字内容。

这时候就必须要在预训练模型的基础上,采用有监督学习了,因为纯靠无监督学习做出来的模型,它生成的东西是好是坏都没法控制。

为了解决这个问题, OpenAI 雇佣了很多的人,来进行人工干预,相当于通过人工来给一些高质量的生成结果。这些示例相当于真实人类的说话方式,并将这些数据用于微调训练 GPT3,从而得到 GPT3.5模型 。

这就是重点了,在 ChatGPT 推出的时候,使用到的是 GPT3.5 模型,这个模型可以让ChatGPT 初步具备理解人类意图的能力,只不过当时并没有公开 3.5 模型的 API ,市面上当时能够使用的 API 还是 GPT-3 的,因此当时唯一能够体验到GPT3.5 模型效果的方式只有使用 ChatGPT 本身。

更多chatGPT干货实践内容点击如下地址获取:

ChatGPT从基础到项目实战icon-default.png?t=N3I4https://edu.csdn.net/course/detail/38557

 

 

 

当 ChatGPT 经过人工标注的微调训练之后,还会使用到的 GPT3.5 模型另一个概念,叫做RLHF 人类反馈强化学习

简单来说,它是指模型生成内容的时候,通过人类来对输出结果进行打分,从而不断改进模型,让模型的生成可以更符合人类的预期。

注意,这里的关键是对内容进行打分,而并不是直接判断对错。这是因为回答的结果无法完全用对错来判断。

你并不能说模型回答的就不对,你只能说是他回答的不够好,这时候打分的机制就很关键了。

通过打分的机制,模型自己会觉得,你为什么给我的回答打了7分,是不是我的回答中有哪些方式不对?这时候模型就能够生成更多的多样性结果。比如在评分较低时,会尝试生成不同的响应结果,来获得更高的分数

而这个强化学习中的得分机制,背后是通过 OpenAI 的一个奖励模型(小版本GPT)来实现的。

假设随便一个问题,产生了A,B,C,D四种答案,人工需要针对这四种回答分别进行打分。

之后会根据打分的结果进行排序,再把标注的数据用于训练,从而得到一个奖励模型。

 

而当这个奖励模型训练出来以后,结合微调后的的 GPT3.5 模型和这个奖励模型来采用强化学习的方法来进行行为策略的更新,从而让 ChatGPT 整体能够更好的理解人类意图,输出更符合人类需求的文字内容。

举个例子,相当于我们有了奖励模型后,再拿出一个问题来问 ChatGPT ,这时候ChatGPT 给到一个输出结果,这个结果会传递到奖励模型中,奖励模型会给出一个评分,再根据这个评分的高低来更新 ChatGPT 模型,而这个更新的方法叫做 PPO ,这个大家不需要理解,这里面都是些数学的内容。大家只需要知道一个大致过程就行。

经过这一系列不断的训练,最终就形成了 GPT3.5模型,同时 OpenAI 也在 2022年11月推出了 ChatGPT 这个使用了 GPT3.5 模型的应用层,让用户可以在网页中和机器人进行对话,机器人可以回答问题,撰写文本,生成代码,归纳总结等等。并且在全球大量用户的体验下来,发现 ChatGPT 不像是以往哪些 AI 一样,多说几句话就会露出破绽。 ChatGPT 几乎可以接近真实的人类对话,还有上下文的语言理解,直接在体验上碾压了过去的所有同类型产品,至此 ChatGPT 开始在全球爆火。

GPT-4

而时间来到了 2023年3月14日, OpenAI 宣布了全新的大型多模态模型 :GPT-4 ,整体性能和准确性上都优于之前的 GPT3.5 版本,还能更好的编写多种不同的写作风格,同时他还能支持用户输入图像,从而理解图像当中的信息。此外,相比ChatGPT的4096词,GPT-4 支持 25000字的文本输入,这让 GPT-4 可以从更长的文本内容中执行下游任务,例如原先只能分析几千个字的文章,但现在可以分析2w字的文章来写总结报告。

 

ChatGPT Plugin

直到前两天2023年3月24日,OpenAI 推出了 ChatGPT 插件功能,让ChatGPT可以和开发者定义的 API 进行交互,这项更新直接赋予了 ChatGPT 使用其他工具和联网的能力。比如原先我们只能询问 ChatGPT 一些酒店推荐,但现在我们可以直接使用 ChatGPT 预定酒店;原先我们只能询问 21年9月之前的数据,因为 ChatGPT 的模型本身是使用 21年9月之前的互联网数据进行的训练,但现在通过 browsing 插件,让ChatGPT 可以基于微软 Bing 的搜索 API 来访问最新的互联网信息,从而突破模型数据的限制。

 

hatGPT更新插件功能后,相信未来用不了多长时间,现有的一切应用交互方式都将发生改变。

总结

纵观整个 GPT 的发展历史,我们能发现 ChatGPT 的爆火背后是无数科研人员的努力以及大量资金支持的结果。可能很多人都会对 ChatGPT 感到害怕,产生焦虑,但我们又能做什么呢?生活还要继续,我们能做的,只有拥抱技术,保持学习。

更多chatGPT干货实践内容点击如下地址获取:
ChatGPT从基础到项目实战icon-default.png?t=N3I4https://edu.csdn.net/course/detail/38557

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11994.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT的工作原理,这篇文章说清楚了

来源:图灵人工智能 作者:史蒂芬沃尔弗拉姆(Stephen Wolfram)英、美籍 计算机科学家, 物理学家。他是 Mathematica 的首席设计师,《一种新科学》一书的作者。 ChatGPT 能够自动生成一些读起来表面上甚至像人…

用ChatGPT发的第一篇顶会。。

小时候特别羡慕大雄,因为他有可以帮他写作业的机器猫小叮当。 熬夜读论文,却无法得出一个好的idea,深夜薅头发苦恼的时候,就会想如果有一个机器人,给出一串指令就能马上生成一篇质量上佳的论文,就好了。 现…

Claude AI和ChatGPT的区别

Claude AI和ChatGPT都是基于人工智能技术的智能对话系统,但它们的设计和应用场景有一些不同。 Claude AI是一个基于语音识别、自然语言处理和机器学习等技术的智能客服平台。它能够像人一样进行对话,并根据用户提供的问题提供相应的答案,从而…

当ChatGP遇上数据库,看完我不淡定了......

12月1日,OpenAI发布了针对对话场景优化的语言大模型ChatGPT。 各路大神纷纷加入了“调戏”ChatGPT的行列 本以为会和普通的聊天机器人差不多 没想到看完这些, 程序员们瞬间不淡定了 那就先从简单的问题开始~ 推荐一款关系型数据库 推荐一款时空数据…

ChatGPT/Midjourney 微信机器人 部署教程 自己的AI助手

三分钟,创建一个 ChatGPT/Midjourney AI 微信(企业微信)小助手。 负载均衡:多个 OpenAI Token 增强其稳定性 场景模式:可通过 PROMPT 配置机器人为专业的翻译、面试官、医生等 群聊控制:可控制在那些群开启…

学习经验分享【30】Pycharm插件chatgpt,用来辅助编写代码

在Pycharm中发现ChatGPT插件,很好用,免费安全,大家可以作为编代码的辅助工作,也可用来玩GPT的接口。具体方法如下 实现效果如下: 更多精彩内容敬请持续关注。如果本博文对你有帮助的话,欢迎点赞、评论区留言…

【花雕学AI】32:WeTab——使用 ChatGPT 聊天的新标签页,免费又好用

引言: 你是否厌倦了每次打开浏览器都看到同样的新标签页?你是否想要让你的新标签页更有个性,更有趣,更有用?如果是的话,那么你一定要试试 WeTab! WeTab 是一款免费的浏览器扩展,它…

chatgpt赋能python:如何用Python模拟控制安卓屏幕

如何用Python模拟控制安卓屏幕 如果你是一名Android开发者,你可能曾经想过如何模拟控制安卓屏幕来进行自动化测试或者其他任务。这篇文章将介绍如何使用Python来模拟控制安卓屏幕的方法。 Android Debug Bridge (ADB) 在控制安卓屏幕之前,我们需要先了…

chatgpt赋能python:用Python编写手机APP的优势及方法

用Python编写手机APP的优势及方法 随着移动互联网的快速发展,智能手机已经成为人们生活中不可缺少的一部分。越来越多的企业开始开发手机APP以便更好的服务用户。在开发手机APP的过程中,Python成为了一种备受关注的语言。本文将介绍Python编写手机APP的…

ChatGPT的最新功能:自定义指令

OpenAI推出了ChatGPT的最新功能:自定义指令。这项功能让ChatGPT具备了更高的个性化设置,你可以输入自我介绍,包括你来自哪里、从事什么职业、有什么爱好或专长等,最多可以输入1500个字符。如你是一位日常只用NodeJS的程序员&#…

chatgpt赋能python:Python版本介绍及如何看版本

Python版本介绍及如何看版本 Python作为一个备受欢迎的编程语言,其版本的更新也非常频繁,版本的不同对于程序的运行和开发都会产生不同的影响。因此,了解Python的版本是十分必要的。 Python 2 和 Python 3 Python 2 和 Python 3 是两个不兼…

下百度文库要券?来用 Python 自动下!

80行代码打造微信机器人实现下载百度文库 Python资源共享群:484031800 一 一 简述 生活当中免不了要下载百度文库,但是百度很恶心的是要下载券,收费呀啥的(这次的这个不能下载收费文档哦),所以我就在微…

还敢白嫖吗?利用插件破解百度文库下载文档,被判赔200万元!还不收手吗?

百度文库,是百度于2009年11月12日发布的供网友在线分享文档的平台。 百度文库的文档由百度用户上传,经过百度的审核后方可发布,支持其他网友在线阅读和下载。 百度文库的文档内容非常全面,包括了教学资料、考试题库、专业资料、公…

百度文库会员什么时候便宜

需要购买百度文库的会员,不知道什么时候便宜,下面办公人导航就和大家分享百度文库会员什么时候便宜。 1.不需要等什么时候百度文库便宜,因为只要我们通过百度文库的活动链接进入就是优惠的。如果非要等到最便宜的话那就要看618,双…

当当图书每满100减50,两种优惠券助你两手薅羊毛

囤书囤书 我们一起阅读经典&#xff0c;紧跟前沿技术不掉队 这次继续给爱读书的你们最大的优惠力度 当当图书大促 >> 每满100减50 << 满200减100 满300减150 满400减200 不止如此&#xff01;秉持绝不让大家多花一分钱的精神 华章计算机联合【超哥的杂货铺】特别送…

文档在线阅读(类似百度文库)的实现

因为需要在网站中添加文档在线阅读功能&#xff0c;故查阅了相关资料。下面分享一下实现过程。 一般的在线文档阅读思路大概是这样&#xff1a; 文件上传至服务器服务器端脚本语言&#xff08;如&#xff1a;PHP&#xff09;&#xff0c;调用文件类型转换程序&#xff08;比如&…

复制百度文库及其他收费文档的方法

今天来给大家分享一下复制网页的无法复制的内容的方法&#xff0c;例如百度文库的内容。准备的东西就是谷歌浏览器&#xff0c;还有安全上网原则 首先我么们需要使用安全上网原则&#xff0c;使用谷歌浏览器&#xff0c;至于安全上网原则&#xff0c;各位小伙伴自己找途径了解下…

如何免费使用百度文库

随笔小文&#xff1a; 目的&#xff1a; 对一些不能免费下载和浏览的百度文库文章进行操作&#xff0c;以达到免费使用的目的。 方法&#xff1a; 对随意一篇百度文库&#xff0c;在其链接中加vvv如.baidu.com则在du.com中间加3个v&#xff08;vvv&#xff09;。可能会要求…

薅羊毛——我的最爱 常用的书籍羊毛大全

hhhh没想到第一篇博客居然是关于书籍方面的羊毛记录&#xff0c;最近在B站上很多up主例如喘喘wiliwili等等博主学习到了关于书籍薅羊毛的小知识&#xff0c;用此文章予以记录~&#xff08;ps:封面也是如此的草率了&#xff09; 缺书网&#xff08;针对当当和京东&#xff09;豆…

Beezy 实测:Bard Google vs ChatGPT,你该怎么选?

随着人工智能技术的不断发展&#xff0c;越来越多的创新型公司开始加入这场“智能化”竞赛。在众多的AI企业中&#xff0c;Bard Google和ChatGPT无疑是两大巨头。两家公司都拥有自己独特的技术&#xff0c;同时也面临着自己的挑战。 在本文中&#xff0c;我们将通过交互功能、…