GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

GPT-4是一种改进,但是应该适当降低期望

当OpenAI在2022年末推出ChatGPT时,震惊了全世界。这个新的生成式语言模型预计将彻底改变包括媒体、教育、法律和技术在内的整个行业。简而言之,ChatGPT听起来可以颠复一切。甚至在我们没有时间真正设想一个ChatGPT后的世界之前,OpenAI又推出了GPT-4。

最近几个月,突破性的大型语言模型发布的速度令人惊叹。如果您仍然不了解ChatGPT与GPT-3,更不用说GPT-4之间的区别,听起来也很正常。

在本文中,我们将介绍ChatGPT和GPT-4之间的主要相似之处和差异,包括它们的训练方法、性能和能力,以及限制。

ChatGPT与GPT-4的训练方法的相似之处和差异

ChatGPT和GPT-4都站在巨人的肩膀上,建立在GPT模型的先前版本上,同时改进模型架构,采用更复杂的训练方法,并增加了训练参数的数量。

两个模型都基于 Transformer 架构。GPT-2和GPT-3使用 multi-headed self-attention 来决定要关注哪些文本输入。这些模型还使用 decoder-only 的架构,逐个 token 地生成输出序列,迭代地预测序列中的下一个 token。虽然ChatGPT和GPT-4的精确架构尚未发布,但我们可以假设它们仍然是 decoder-only 模型。

OpenAI的GPT-4技术报告提供了很少有关GPT-4模型架构和训练过程的信息,引用了“竞争环境和大规模模型的安全影响”。我们所知道的是,ChatGPT和GPT-4可能以类似的方式进行训练,这是与GPT-2和GPT-3使用的训练方法不同的。我们对ChatGPT的训练方法了解得比GPT-4多得多,所以我们从那里开始。

ChatGPT

首先,ChatGPT 是在聊天数据集上进行训练的,其中包括演示数据,即人类标注员提供特定提示的聊天机器人助手预期输出的演示。使用这些数据对 GPT3.5 进行有监督的微调,产生一个策略模型,该模型用于在给定提示时生成多个响应。然后,人类标注员对于给定提示生成的响应产生的最佳结果进行排名,用于训练奖励模型。然后使用奖励模型通过强化学习迭代地微调策略模型。

0cbe270add7f9fbb06925c92380113ff.png

总的来说,ChatGPT是使用人类反馈的强化学习(RLHF)训练的,这是一种在训练过程中融入人类反馈以改善语言模型的方式。这使得模型的输出能够与用户要求的任务相一致,而不仅是基于通用训练数据集(例如GPT-3)预测句子中的下一个单词。

GPT-4

关于GPT-4的训练细节,OpenAI目前还未披露。他们的技术报告中没有包括有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等的详细信息。我们所知道的是,GPT-4是一种基于转换器的生成多模态模型,使用公开可用的数据和经许可的第三方数据进行训练,然后使用RLHF进行微调。有趣的是,OpenAI分享了有关其升级的RLHF技术的细节,以使模型的响应更准确,并且不太可能偏离安全防护栏。

在训练策略模型后(与ChatGPT类似),RLHF在对抗性训练中使用,这个过程是训练模型对恶意示例进行欺骗,以便在未来保护模型免受此类示例的影响。在GPT-4的情况下,跨多个领域的人类领域专家对策略模型对抗性提示的响应进行评分。然后使用这些响应来训练额外的奖励模型,以逐步微调策略模型,从而得到一个更不可能提供危险、回避或不准确的响应的模型。

d74a5df51c26da33305b2c2e3d709b30.png

ChatGPT和GPT-4在性能和能力方面的相似性和差异

能力

就能力而言,ChatGPT和GPT-4的相似之处比差异多。像它的前身一样,GPT-4也以对话的方式与用户交互,旨在与用户保持一致。如下图所示,对于一个广泛的问题,两个模型的回答非常相似。

OpenAI认为,区分这两个模型的区别可能是微妙的,并声称“当任务的复杂性达到足够的阈值时,差异就会显现出来。”考虑到GPT-4基础模型在后训练阶段经历了六个月的对抗性训练,这可能是一个准确的描述。

与只接受文本的ChatGPT不同,GPT-4接受由图像和文本组成的提示,并返回文本响应。截至本文发布,不幸的是,使用图像输入的能力尚未向公众开放。

性能

正如前面提到的,OpenAI报告称,在安全性能方面,与GPT-3.5(ChatGPT的基础)相比,GPT-4有显着的改进。但是,目前还不清楚禁止内容请求的响应减少,有害内容生成减少以及对敏感话题的改进是由于GPT-4模型本身还是由于额外的对抗测试。

53abc6642a3e93594154ae251daf75cb.png

此外,GPT-4在大多数人类参加的学术和专业考试中表现优异。值得注意的是,与GPT-3.5相比,GPT-4在统一律师考试中得分排名达到了90分位数,而GPT-3.5的得分排名为10分位数。 GPT-4在传统语言模型基准测试以及其他SOTA模型方面也明显优于其前身,尽管有时仅仅优于一点点。

ChatGPT和GPT-4在限制方面的相似性和差异

ChatGPT和GPT-4都有显著的限制和风险。 GPT-4系统卡片包括OpenAI对此类风险进行的详细探讨的见解。

以下是两个模型都面临的风险(部分):

  • 幻觉(倾向于产生荒谬或事实不准确的内容)

  • 产生违反OpenAI政策的有害内容(例如仇恨言论、煽动暴力)

  • 放大和延续边缘化人群的刻板印象

  • 产生旨在欺骗的逼真的虚假信息

尽管ChatGPT和GPT-4面临相同的限制和风险,但OpenAI已经采取了特殊措施,包括广泛的对抗性测试,以减轻GPT-4的这些限制和风险。尽管这是令人鼓舞的,但GPT-4系统卡片最终证明了ChatGPT的脆弱性(可能仍然存在)。

结论

在本文中,我们回顾了ChatGPT和GPT-4之间最重要的相似之处和不同之处,包括它们的训练方法、性能和能力以及限制和风险。

虽然我们对GPT-4模型架构和训练方法的了解要少得多,但它似乎是ChatGPT的改进版本,现在可以接受图像和文本输入,并声称更安全、更准确、更有创造力。不幸的是,我们只能相信OpenAI的话,因为GPT-4只能作为ChatGPT Plus订阅的一部分提供。

下表说明了ChatGPT和GPT-4之间最重要的相似之处和不同之处:

98bb580dffbeea749a4302178c2aa332.png

创建最准确和动态的大型语言模型的竞争已经达到了惊人的速度,在短短几个月内发布了ChatGPT和GPT-4。随着我们在这个令人兴奋但快速发展的大型语言模型领域中不断前进,了解这些模型的进展、风险和限制是至关重要的。

·  END  ·

HAPPY LIFE

d8b17a632076345d38aa6d800ea736fa.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8161.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

摆脱网络限制:用Vercel打造属于你的ChatGPT网站

摆脱网络限制:用Vercel打造属于你的ChatGPT网站 前言 上一篇分享了如何用自己的服务器搭建chatgpt服务器,但是需要你有一个服务器,还是有点成本的。今天我带来一个无需自备服务器的方式,让你也能搭建属于自己的chatgpt专属助手&a…

oa人员导入模板_巧用OA系统模板办公,让重复的事情简单做

是什么让我们的工作变得低效? 机械的重复绝对算得上一项。有时候,我们不得不花费大量的时间去进行信息的重复填写、格式的重复校对,却没有进行相应模板的总结,让简单的事情变得复杂。 那么,如何才能告别低效工作&#…

​如何高效开发一个OA办公系统​?

如何才能高效开发一个OA办公系统?这篇教你使用零代码工具从0-1搭建一个OA办公系统,无需代码基础,只要你懂业务,只需3步即可搭建! 先来看看效果—— 系统模板>> https://www.jiandaoyun.com/ 整个系统包含物资管…

通达OA工作流程-使用方法

第3章 工作流使用 3.1 新建工作 进入工作流新建工作,选择需要的流程即可新建。如果用户没有流程第一步的经办权限,那么用户在新建界面看不到这个流程;相应的,如果用户没有流程分类所有流程的经办权限,那么用户…

ChatGPT与OA平台:办公效率提升的最佳组合

OA平台,是企业办公自动化的一种重要形式。在这个信息化时代,OA平台已经成为企业必不可少的一部分,对企业的管理和生产效率起着重要的作用。而ChatGPT则是一种基于自然语言处理技术的人工智能模型,它能够自主学习并进行语言生成。那…

离谱!美国教授用ChatGPT「证实」论文抄袭,半个班学生惨遭挂科

【导读】天下苦GPT检测器久矣!用AI的怕被揪出来,没用AI的怕被冤枉。最近,又发生了一起被AI误判的冤假错案。 离了个大谱! 辛辛苦苦码出的毕业论文,居然被教授拿去放在ChatGPT里检测,然后就被判定为抄袭&a…

【ChatGPT】一个凭借两百多年历史的公式崛起的巨星

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后端的开发语言A…

原美团联合创始人欲打造中国版 OpenAI ;ChatGPT 爆红惊动谷歌退隐创始人布林;Gradle 8.0 发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

ChatGPT2论文解读《Language Models are Unsupervised Multitask Learners》(2019)

论文总结 以下是我阅读完整篇论文做的个人总结,包含了ChatGPT-2文章的主要内容,可以仅看【论文总结】章节。 数据集 自制了一个网页爬虫,被抓取的网页部分来自于社交平台,这些网页由人工进行过滤。最终生成WebText数据集&#…

ChatGPT风头正劲,Sam Altman透露发展新动态

引语:大家好我们是权知星球,开启你独特的知识星际之旅 目录 RazaHabib的完整记录 1.目前,OpenAI的发展受到GPU的严重限制。 2.OpenAI的发展路线图 3.「没有PMF」这个插件短时间内可能不会在API中出现。 4.除了与「类ChatGPT」竞争之外&…

警惕!ChatGPT爆火下的能耗危机,数据中心运营商挑战巨大

即使是数字产品也需要能源来开发和消耗,ChatGPT也不例外,据估计,机器学习工作中推理处理占算力消耗的80-90%,粗略计算,自ChatGPT于2022年11月30日上线以来,碳排放已超过814.61吨。 ——摘要 近期&#xff0…

云端需求助力跑赢周期,金山办公有望借助ChatGPT加速腾飞

与微软在办公领域“搏杀”了三十年的金山办公,或许正在迎来自己的“第二春”。 2月25日,金山办公(688111)发布2022年度业绩快报,全年营收38.85亿元人民币(单位下同),同比增加18.44%&…

「从零入门推荐系统」21:chatGPT、大模型介绍

作者 | gongyouliu 编辑 | gongyouliu 自2022年11月30日OpenAI发布chatGPT以来,大模型技术掀起了新一轮人工智能浪潮。chatGPT在各个领域(包括对话、摘要、内容生成、问题解答、识图、数学计算与推理、代码编写等)取得了比之前算法好得多的成…

ChatGPT、Claude和Bard,三足鼎立之势已成

由前OpenAI研究人员创立的人工智能公司Anthropic推出了其更新版的聊天机器人Claude 2,与 ChatGPT和Google Bard等竞争对手正面硬刚。 由于国内的大模型基于不在一个能量量级,AI界大模型三足鼎立之势已经形成,背后的技术都在是谷歌Transformer…

ChatGPT 关闭 Plus 付费;首批因 AI 失业的人出现,某游戏公司裁掉半数原画师;Slint 1.0 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

Kyligence Zen 产品体验 — 迈入云办公

一、前言: 本人在一家净水器行业的公司做售后助理的岗位,平时80%的主要工作,就是跟excel报表打交道,以下为本人的岗位职责: 由于也是初创几年的公司,领导在下班时候,也会经常有统计报表的需求&…

基于低成本CNC和热转印技术的双面PCB制备流程详解

基于低成本CNC和热转印技术的双面PCB制备 材料准备基本概念机械加工基本概念数控机床(CNC)机床加工刀具及其种类 PCB制造基本概念热转印铺铜 软件安装嘉立创EDA软件下载PCB绘制时的注意事项 FlatCAM(用作将Gerber制版文转换成NC刀路文件&…

从0到1:如何使用AI工具提升工作效率?

目录 1.chatPPT 2.GitHub Copilot 3.AUto.GPT 4.newBing 5.Microsoft Designer 6.ChatDOC 7.Excel Formularizer 8.ChatMind. chatGPT国内镜像网站 1.chatPPT 链接地址 : ChatPPT_AI一键对话生成PPT_智能排版美化 (chat-ppt.com) ChatPT是必优科技旗下…

谷歌Bard:ChatGPT之外的第三选择

2023年年初,为了对应ChatGPT方面的压力,谷歌Bard仓促上线,此后便进入了低调前行。目前为止已经迭代了9个版本,也就是在近期的版本更新中支持了中文(简体/繁体)语言,对国内用户可以说又友好了一步…

bugku中的misc题

工具: https://blog.csdn.net/qq_44204058/article/details/122995362 这是一张单纯的图片 用winhex打开图片,发现下面有一些编码明显不同,Unicode解码为 ASCII,得到flag 隐写1 打开压缩包,发现是一张图片 补充一些png格式的内容 一个PN…