【NLP相关】GPT-X合集:GPT类模型介绍(附相关论文和Github项目地址)


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

GPT-X

GPT-X:GPT类模型介绍(附相关论文和github项目)

1. GPT介绍

GPT(Generative Pre-trained Transformer)是一类基于Transformer架构的预训练语言模型。这一类模型采用自回归的方式进行训练,通过大规模的语料库预训练来学习语言的概率分布,从而能够用于各种自然语言处理任务。

GPT-3

2. GPT类模型介绍

(1)GPT-1

GPT-1是由OpenAI于2018年推出的第一代GPT模型,使用了12层Transformer架构,共有117M个参数。GPT-1在多项自然语言处理任务上均取得了较好的效果,例如文本生成、机器翻译、问答等。

论文:https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

github链接:https://github.com/karpathy/minGPT

(2)GPT-2

GPT-2是在GPT-1的基础上进一步扩展和优化的模型,使用了更大的数据集和更多的参数。GPT-2采用了48层Transformer架构,共有1.5B个参数。GPT-2在多项自然语言处理任务上取得了SOTA的效果,例如文本生成、文本分类、语言推理等。GPT-2还引起了广泛的社会讨论,因为它能够生成高度逼真的文本,包括假新闻和有害内容。

论文:https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf

github链接:https://github.com/openai/gpt-2

(3)GPT-3

GPT-3是当前最大的预训练语言模型,由OpenAI于2020年推出。GPT-3使用了1750B个参数,比GPT-2大了一千倍以上。GPT-3在多项自然语言处理任务上取得了SOTA的效果,并能够完成一些常识推理和常识问答等任务。与GPT-2相比,GPT-3不仅参数更多,而且采用了更多的训练数据,以及更加复杂的预训练任务。

论文:https://arxiv.org/pdf/2005.14165.pdf

github链接:https://github.com/openai/gpt-3

(4)GPT-Neo

GPT-Neo是由EleutherAI推出的一个社区项目,旨在构建一个更加开放和透明的预训练语言模型。GPT-Neo使用了和GPT-3类似的训练数据和预训练任务,但是采用了更加分散的训练和模型分布式计算的方式,以此来避免依赖于单个GPU或TPU。GPT-Neo目前已经推出了多个版本,包括GPT-Neo 1.3B、2.7B和6B。

论文:https://pile.eleuther.ai/

github链接:https://github.com/EleutherAI/gpt-neo

(5)GShard-GPT

GShard-GPT是谷歌研究团队于2021年推出的一种基于GShard的高效分布式GPT预训练模型。与传统的GPT模型不同,GShard-GPT将Transformer架构的每个层都分割成了多个“分片”(Shard),并且每个分片都可以在不同的设备上并行处理。GShard-GPT使用了与GPT-3相同的训练数据和任务,并将模型的大小扩展到了600B个参数。

论文:https://arxiv.org/abs/2006.16668

(6)GPT-J

GPT-J是由EleutherAI团队于2021年推出的一个大型预训练语言模型,使用了6B个参数。GPT-J使用了和GPT-3类似的训练数据和预训练任务,并且采用了分布式的训练方式。GPT-J的主要目标是提供一个可访问、高质量的自然语言处理工具,以便开发人员和研究人员可以更容易地使用自然语言技术。

论文:https://arxiv.org/abs/2302.04761

github链接:https://github.com/kingoflolz/mesh-transformer-jax

(7)GPT-4

GPT-4是目前还未推出的一种预训练语言模型,但已经引起了广泛的关注。OpenAI的研究人员曾在2021年宣布正在研发GPT-4,而且计划将模型的大小扩展到数万亿个参数。但目前尚不清楚GPT-4何时推出以及具体的技术细节。

(8)PEGASUS

一种由谷歌研究团队开发的预训练模型,使用了Transformer架构,但不是采用自回归方式进行训练,而是采用了自编码器(autoencoder)架构。PEGASUS主要用于文本摘要任务。

论文:https://arxiv.org/pdf/1912.08777.pdf

github链接:https://github.com/google-research/pegasus

(9)T5

一种由谷歌研究团队推出的预训练模型,采用了与GPT类似的Transformer架构,但是可以用于多种自然语言处理任务,例如文本分类、命名实体识别等。T5也可以用于生成型任务,例如文本生成和文本摘要。

论文:https://arxiv.org/pdf/1910.10683.pdf

github链接:https://github.com/google-research/text-to-text-transfer-transformer

(10)GShard

一种由谷歌研究团队开发的分布式训练框架,可以用于训练大型的预训练语言模型。GShard的核心思想法是将模型分成多个分片(Shard),并且每个分片都可以在不同的设备上并行处理,从而加速模型训练。GShard已经应用于多个预训练模型中,例如T5和GPT-2。

论文:https://arxiv.org/pdf/2006.16668.pdf

(11)ELECTRA

一种由谷歌研究团队推出的预训练模型,采用了一种新的训练方式,称为“替代生成任务”(Replacing Token Detection),可以大大减少训练时间和计算资源的消耗。ELECTRA的性能与同等大小的BERT模型相当,但训练速度更快。

论文:https://arxiv.org/pdf/2003.10555.pdf

github链接:https://github.com/google-research/electra

(12)总结

GPT类模型是自然语言处理领域的重要突破之一,其在多项自然语言处理任务上取得了优异的表现。随着技术的不断发展和研究的不断深入,GPT类模型的规模也越来越大,性能也越来越强。同时,也涌现出了许多不同的GPT变种和改进版,以满足不同应用场景和需求。未来,GPT类模型还有很大的发展空间和潜力,我们可以期待更多的创新和突破。

3. GPT类模型的区别和联系

  • 模型规模:GPT、GPT-2和GPT-3的规模依次增大。GPT有117M个参数,GPT-2有1.5B个参数,GPT-3则有175B个参数。这意味着每个模型可以处理的任务和数据集越来越大。

  • 数据集和训练方式:这三个模型都使用了大量的无标注数据进行训练,其中包括了网络上的大量文本和语言数据。GPT使用的数据集是WebText,GPT-2使用的数据集包括了WebText、BooksCorpus、Common Crawl等多个数据集,而GPT-3则使用了更多的数据集,包括Common Crawl、Wikipedia、Books等。

  • 任务和应用:这三个模型都可以用于语言生成和相关的自然语言处理任务,如文本分类、摘要生成、对话系统等。但是,由于规模和训练数据集的不同,它们的性能和应用场景也有所不同。例如,GPT-3在机器翻译等任务上的表现要比GPT-2好得多,而GPT-2在文本生成方面则更加灵活和多样化。

  • 论文和代码:这三个模型的论文和代码都是公开的,研究者和开发者可以在自己的任务上进行改进和优化。此外,一些变种的代码和论文也已经发布,例如GPT-Neo、GShard、GPT-J等。

参考文献

[1] GPT-1/GPT-2/GPT-3简介 https://zhuanlan.zhihu.com/p/473001104
[2] 让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主使用工具 https://www.51cto.com/article/746420.html
[3] GPT-3没有亲自上手,不如展望一下GPT-4?https://baijiahao.baidu.com/s?id=1674342266465949516
[4] 帝国理工联手谷歌提出抽象文本摘要最佳模型|ICML 2020 https://baijiahao.baidu.com/s?id=1671531819242389224
[5] ICLR 2020|electra https://zhuanlan.zhihu.com/p/263010688


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29824.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Safari高级使用

Safari是苹果公司为旗下设备开发的一款强大的浏览器不论是iPhone还是iPad亦或是MAC OS上都能使用。但是针对不同的系统,Safari也有一定的改动。那么在MacOS中如何使用Safari呢? 1.全新的标签管理界面 Safari 8 的感觉和 iOS 系统里的移动端越来越接近&am…

手机safari导入html书签,iPhone手机Safari浏览器书签如何同步至电脑?

如果在 Safari 中添加了很多书签,想要把它们全部同步到电脑浏览器上,逐一手动添加并不是什么好方法。对于 Mac 电脑,登录同一 Apple ID 并开启同步,就可以实现自动同步 Safari 书签,不过这仅限于 Safari 浏览器&#x…

实用的Safari浏览器扩展工具——浏览标签太多?来一键保存!

Tab Space 是一款为提升网络浏览效率而生的 Safari 浏览器扩展。灵感来自于 Chrome 插件 OneTab 的快速保存当前所有的标签页和一键恢复功能,Tab Space 最初只是为此而开发。此扩展需要 macOS 10.13 Safari 12.1 及更高版本才能正常使用。 功能介绍 1、可以一键恢…

Alfred 搜索不到 Safari 浏览器的书签

Mac 的版本是 macOS Mojave 10.14.1,使用 Alfred 的搜索书签功能,发现不能搜索 Safari 的书签,但可以搜 Chrome 的书签。 重启 Safari,重启 Alfred 都尝试过,但还是不行。 最后在Alfred 的论坛里面找到了原因。 在安…

Safari导入书签

1、打开Safari 这边safari会自动带出一些关联的浏览器,但如果你要导入的浏览器不在这里的话,就需要看第二步。 2、比如,这里我要从QQ浏览器导入,先打开QQ浏览器。 其他浏览器都类似,找到书签管理,都能找到一…

windows下Edge浏览器Google Chrome与Safari双向同步书签

最近刚入手了 iPad,在上面装了edge浏览器后实现了收藏夹,浏览记录同步的问题,可是Safari浏览器也同样好用,于是想体验一下不同系统之间的协同 1 下载iCloud应用并登录自己的Apple ID 设置和使用 Windows 版 iCloud 2 修改导入注…

Safari书签同步

无论是手机同步到电脑,或者电脑同步到手机都可以,并且Apple会帮你自动合并。 打开 “系统偏好设置”-iCloud- 如果已经勾选Safari前面已经勾选了,先取消,再勾选,这时会提示是否合并,选“好”就可以了。前提…

ios跳转到safari_如何在iOS上将书签从Safari传输到Chrome

ios跳转到safari Chrome for iOS may never outperform Safari, but it has still become a solid browser alternative with some nice extra features all its own. The trouble is, when you install Chrome for iOS, there’s no way to directly import bookmarks from Sa…

将Windows电脑上的浏览器书签同步至iPad中的Safari

Windows电脑上的浏览器书签同步至iPad中的Safari 当我们的电脑用的是Windows系统,同时有iPad时,有时会希望能够将电脑浏览器中的书签同步到iPad上,这样就会比较方便,那么接下来我将介绍如何进行同步: 首先打开Micros…

通过iMazing将Safari浏览器的书签导出至电脑

我们的iOS设备在Safari浏览器中存储了多种类型的数据,包括历史记录、书签、阅读清单。而书签就相当于电脑浏览器中的收藏夹,方便我们再次访问保存的网站。那我们想要将这些书签信息导出至电脑又该如何操作呢? 我们都知道想在iTunes中导出Saf…

如何在safari浏览器中添加书签

鼠标拖放置顶端 书签->添加书签 点击添加即可

Edge与Safari双向同步书签

Edge与Safari双向同步书签 目标:将Windows上的edge浏览器(或chrome浏览器)和iOS、iPad OS、Mac OS上的Safari浏览器双向同步书签。 背景:我之前成功过,但是换了新电脑忘记了,又摸索了好久,为防…

使用iCloud让Safari与Chrome/FireFox/IE的书签保持同步

随着现在Mac电脑的普及程度越来越高,很多人都会像笔者一样,在公司和家里用着不同种类的操作系统。 而浏览器又是一个不可或缺的存在,根据笔者的使用习惯,在Mac上会使用Safari浏览器,而在Windows上会使用Chrome。 就这…

如何同步Safari和Chrome中的书签与密码

如何同步Safari和Chrome中的书签与密码 微软商店下载ICloud Chroome中安装相应插件 多点几遍插件,出现 先取消勾选书签,再选上书签,再点击应用就行

safari浏览器怎么导入书签

导入html文件书签 打开safari浏览器,点击文件-》导入自-》书签html文件…,即可

如何把谷歌浏览器的书签导入safari浏览器

1 打开safari浏览器 2 文件--导入--谷歌浏览器 3 退出谷歌浏览器,并点导入 第一步:打开safari浏览器,一般情况下刚安装的safari浏览器默认是没有显示菜单栏的如图: 2 第二步点击右边的箭头选择显示菜单如图: 3 第三…

GPT-4内幕大泄露!1.8万亿巨量参数,13万亿token训练,斥资6300万美元

来源 | 量子位 作者 | 金磊 Complete bullshit. 完全胡扯。这么一句简短犀利评论,竟是出自深度学习三巨头之一的Yann LeCun之口。 而让他如此怒怼的事情,则是在日内瓦召开的世界首场人机新闻发布会。 顾名思义,在这场新闻发布会中&#xff0…

LeCun爆粗口、马斯克哭笑不得,只因9个人形机器人开了场新闻发布会

来源 | 量子位 | 公众号 QbitAI Complete bullshit. 完全胡扯。 这么一句简短犀利评论,竟是出自深度学习三巨头之一的Yann LeCun之口。 ​ 编辑切换为居中 添加图片注释,不超过 140 字(可选) 而让他如此怒怼的事情&#xff0c…

今年这个情况,我劝你多留一手准备...

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 老读者应该还有印象,一年以前K哥在文章里就做过预判:往后几年,大环境不容乐观,因为已经进入新一轮的经济周期,职场人要开展“ABZ计划”来应对…

37岁,兼职搞副业,月入3万!

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 老读者应该还有印象,一年以前K哥在文章里就做过预判:往后几年,大环境不容乐观,因为已经进入新一轮的经济周期,职场人要开展“ABZ计划”来应对…