从 ELMo 到 ChatGPT：历数 NLP 近 5 年必看大模型

news/2024/12/24 8:39:38/文章来源:https://blog.csdn.net/u010280923/article/details/129045051

目录

AI21 Labs
Alibaba
Allen Institute for AI
Amazon
Anthropic
BAAI
Baidu
BigScience
Cohere
DeepMind
EleutherAI
Google
Huggingface
iFLYTEK
Meta (Facebook)
Microsoft
NVidia
OpenAI
Salesforce
Tsinghua University
UC Berkeley
Yandex
持续更新中 ...
参考

团队博客: CSDN AI小组

相关阅读

ChatGPT 简介
关于 ChatGPT 必看的 10 篇论文
ChatGPT 中的人类反馈强化学习 (RLHF) 实战

先上 “万恶之源”：Transformer
在这里插入图片描述

按机构分类

AI21 Labs

发布时间	模型名称	参数量	机构	相关链接	开源
2021-09	Jurassic-1 (J1)	J1-Jumbo v1 (178B), J1-Large v1 (7.5B), J1-Grande v1 (17B)	AI21 Labs	论文 , 官方文档, 技术报告	受限

Alibaba

发布时间	模型名称	参数量	机构	相关链接	开源
2019-08	StructBert	structbert.en.large(340M), structroberta.en.large(355M), structbert.ch.large(330M)	Alibaba Group Inc.	论文, GitHub	模型

Allen Institute for AI

发布时间	模型名称	参数量	机构	相关链接	开源
2018-02	ELMo	Small(13.6M), Medium(28.0M), Original(93.6M)	Allen Institute for AI & University of Washington	论文	模型

Amazon

发布时间	模型名称	参数量	机构	相关链接	开源
2022-03	DQ-BART	与标准BART相比，参数减少了30倍	Cornell University & AWS AI Labs & University of Pennsylvania	论文

Anthropic

发布时间	模型名称	参数量	机构	相关链接	开源
2021-12	Anthropic-LM	Anthropic-LM v4-s3 (52B)	Anthropic	论文1, 论文2	未开源

BAAI

发布时间	模型名称	参数量	机构	相关链接	开源
2021-06	Wu Dao 2.0	1.75T	BAAI	官网	模型

Baidu

发布时间	模型名称	参数量	机构	相关链接	开源
2019-05	ERNIE	114M	Baidu	GitHub, 论文	模型

BigScience

发布时间	模型名称	参数量	机构	相关链接	开源
2022-05	T0pp	11B	BigScience etc.	论文	模型
2022-07	BLOOM	176B	BigScience	论文	模型
2022-11	BLOOMZ	176B	BigScience etc.	论文	模型

Cohere

发布时间	模型名称	参数量	机构	相关链接	开源
2022-06	Cohere	Cohere xlarge v20220609 (52.4B), Cohere large v20220720 (13.1B) , Cohere medium v20220720 (6.1B) , Cohere small v20220720 (410M) , Cohere xlarge v20221108 (52.4B), Cohere medium v20221108 (6.1B)	Cohere	官网	受限

DeepMind

发布时间	模型名称	参数量	机构	相关链接	开源
2021-07	AlphaFold	21M	DeepMind etc.	论文
2021-12	Gopher	280B	DeepMind	论文, 官网	未开源
2022-03	Chincilla	70B	DeepMind	论文	未开源
2022-03	GopherCite	280B	Deepmind & University College London	论文
2022-04	Flamingo	80B (largest)	Deepmind	论文	flamingo-mini模型
2022-05	Gato	1.2B	Deepmind	论文
2022-09	Sparrow	70B	Deepmind	论文

EleutherAI

发布时间	模型名称	参数量	机构	相关链接	开源
2021-03	GPT-Neo	5B, 2.7B (XL)	EleutherAI	论文	模型
2021-06	GPT-J	6B	EleutherAI	博客	模型
2021-12	StableDiffusion	890M	LMU Munich & Stability.ai & Eleuther.ai	论文	模型
2022-04	GPT-NeoX	20B	EleutherAI	论文	模型

Google

发布时间	模型名称	参数量	机构	相关链接	开源
2018-10	BERT	Base = 110M, Large = 340M	Google AI Language	论文	模型
2019-01	Transformer XL	151M	Carnegie Mellon University & Google Brain	论文	模型
2019-05	XLNet	Base=117M, Large=360M	Google AI Brain Team & Carnegie Mellon University	论文	模型
2019-09	ALBERT	Base = 12M, Large = 18M, XLarge = 60M	Google Research & Toyota Technological Institute at Chicago	论文	模型
2019-10	T5	11B	Google	论文	模型
2019-12	Pegasus	Base = 223M, Large = 568M	Imperial College London & Google Research	论文	模型
2020-03	ELECTRA	Base = 110M, Large = 330M	Google Brain & Stanford University	论文	模型
2020-07	BigBird	取决于整体架构	Google Research	论文	模型
2020-10	ViT	86M(Base) to 632M (Huge)	Google Research	论文	模型
2021-01	Switch	1T	Google	论文	模型
2021-06	Decision Transformers	117M	Google Brain & UC Berkeley & Facebook AI Research	论文	模型
2021-12	GLaM	1.2T覆盖64个专业领域，但只有96B被激活用于推理	Google	论文, 官方博客
2022-01	LAMDA	137B	Google	论文, 官方博客
2022-04	PaLM	540B	Google Research	论文, 官方博客	未开源
2022-05	UL2	20B	Google Research	论文	模型
2022-06	Imagen	2B	Google Research	论文, 官网
2022-06	Minerva	540B	Google Research	论文, 官网
2022-12	Flan-T5	11B	Google	论文	模型

Huggingface

发布时间	模型名称	参数量	机构	相关链接	开源
2019-10	DistilBERT	66M	Huggingface	论文	模型

iFLYTEK

发布时间	模型名称	参数量	机构	相关链接	开源
2020-11	MacBert	MacBERT-large, Chinese(324M), MacBERT-base, Chinese(102M)	iFLYTEK AI Research & Harbin Institute of Technology	论文	模型

Meta (Facebook)

发布时间	模型名称	参数量	机构	相关链接	开源
2019-07	RoBERTa	356M	Facebook AI & University of Washington	论文	模型
2019-10	BART	比 BERT 多 10%	Facebook AI	论文	模型
2019-10	XLM-RoBERTa	Base = 270M, Large = 550M	Facebook AI	论文	模型
2020-01	mBART	与BART相同	Facebook AI Research	论文	模型
2021-07	HTML	400M	Facebook AI & University of Washington	论文
2022-01	CM3	13B (largest)	Facebook AI Research	论文
2022-03	SeeKer	与基模型相同	Facebook AI Research & ETH Zürich	论文, 官网
2022-05	OPT	175B, 66B	Meta AI	论文, 官网	模型
2022-08	BlenderBot3	175B	Meta AI & Mila/McGill University	论文	blenderbot-3B模型, 模型
2022-11	Galatica	120B	Meta AI	论文	模型

Microsoft

发布时间	模型名称	参数量	机构	相关链接	开源
2019-03	MT-DNN	330M	Microsoft Research	论文	模型
2019-05	UniLM	340M	Microsoft Research	论文, GitHub	模型
2019-10	DialoGPT	1.5B	Microsoft Corporation	论文	模型
2020-02	Turing NLG	17B	Microsoft	官方博客
2021-03	Swin Transformer	29M-197M	Microsoft Research Asia	GitHub , 论文	模型

NVidia

发布时间	模型名称	参数量	机构	相关链接	开源
2019-09	Megatron-LM	8.3B (GPT-like), 3.9B (BERT-like)	NVidia	论文, GitHub
2021-10	Megatron Turing NLG	530B	Microsoft & NVIDIA	论文, 官方博客	未开源
2022-06	Global Context ViT	90M	NVidia	论文

OpenAI

发布时间	模型名称	参数量	机构	相关链接	开源
2018-06	GPT	117M	OpenAI	论文	模型
2019-02	GPT-2	1.5B	OpenAI	论文	模型
2020-05	GPT-3	GPT-3 davinci v1 (175B), GPT-3 curie v1 (6.7B), GPT-3 babbage v1 (1.3B), GPT-3 ada v1 (350M)	OpenAI	论文, GitHub	受限
2021-01	DALL-E	12B	OpenAI	论文, 官方博客, Demo
2021-02	CLIP	未知	OpenAI	论文, GitHub	模型
2021-07	Codex	Codex davinci v2 (Unknow), Codex davinci v1 (Unknow), Codex cushman v1 (Unknow)	OpenAI	论文	受限
2021-12	GLIDE	12B	OpenAI	论文, Demo
2022-01	InstructGPT	InstructGPT davinci v2 (175B), InstructGPT davinci v1 (175B), InstructGPT curie v1 (6.7B), InstructGPT babbage v1 (1.3B), InstructGPT ada v1 (350M*)	OpenAI	论文, 官网	受限
2022-04	DALL-E-2	3.5B	OpenAI	论文, 官网
2022-10	GPT-3.5	175B	OpenAI	官网	未开源
2022-10	ChatGPT	与 GPT3 相同	OpenAI	官网	未开源

Salesforce

发布时间	模型名称	参数量	机构	相关链接	开源
2019-09	CTRL	1.63B	Salesforce Research	论文	模型

Tsinghua University

发布时间	模型名称	参数量	机构	相关链接	开源
2020-10	GLM	130B	Tsinghua University & Zhipu.AI	论文, Demo	10B版模型

UC Berkeley

发布时间	模型名称	参数量	机构	相关链接	开源
2021-06	Trajectory Transformers	比 GPT 更小的架构	UC Berkeley	论文	模型

Yandex

发布时间	模型名称	参数量	机构	相关链接	开源
2022-06	YaLM	100B	Yandex	GitHub, 博客	模型

持续更新中 …

由于涉及到的模型较多，文中可能存在纰漏，还望指正，谢谢！

参考

[1] CRFM Benchmarking
[2] Transformer models: an introduction and catalog — 2023 Edition

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/45112.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Adobe全新AI工具引关注，Adobe firefly助力创作更高效、更有创意

Adobe全新AI工具引关注，Adobe firefly助力创作更高效、更有创意

原标题：Adobe全新AI工具引关注，Adobe firefly（萤火虫）助力创作更高效、更有创意。以ChatGPT为首的生成式AI、AIGC等工具的战局正如火如荼的进行中..... 除了微软、百度的聊天机器人和一些初创公司的AI画图工具令人惊艳&#xff…

阅读更多...

李飞飞高徒盘点年度十大AI亮点：核聚变、ChatGPT、AlphaFold上榜

李飞飞高徒盘点年度十大AI亮点：核聚变、ChatGPT、AlphaFold上榜

来源：新智元编辑：Aeneas 昕朋【导读】2022年有哪些人工智能的突破？今天，李飞飞高徒Jim Fan盘点了年度十大AI亮点。人工智能的爆炸正在扭曲我们的时间感。你能相信Stable Diffusion只有4个月大，而ChatGPT的出现还不…

阅读更多...

【教学类-38】20230724京剧脸谱涂色（Python 彩图彩照转素描线描稿）

【教学类-38】20230724京剧脸谱涂色（Python 彩图彩照转素描线描稿）

一、作品预览京剧脸谱（涂色）学具展示（64份） 二、背景需求： 1、大班主题《我是中国人》里面有一个“京剧脸谱”的子主题。从网上下载的彩色脸谱（红黄绿蓝紫黑白），作为环境装饰。引…

阅读更多...

智能ai生成绘画软件有哪些？亲测好用的软件分享

智能ai生成绘画软件有哪些？亲测好用的软件分享

小伙伴们有听说过ai绘画吗？这是目前比较火的一种绘画方式，我们可以通过给AI输入一段关于画面描述的文字内容，ai就可以根据这些内容，生成一幅相关的画作。对于不会画画，但是有创意的小伙伴，你们会不会也想试…

阅读更多...

Drawio免费绘图软件下载

Drawio免费绘图软件下载

drawio是一款强大、免费的绘图工具，使用起来非常方便，非常好用，可以满足大部分画图功能，例如UML、页面设计（Android&iOS）等visio能画的图它都可以画。支持网页版使用（网页版可以自己部署一套…

阅读更多...

ai绘画生成软件哪个好？这3款ai绘画生成软件还不错

ai绘画生成软件哪个好？这3款ai绘画生成软件还不错

你知道ai绘画生成软件哪个好吗？随着人工智能技术的不断进步，AI绘画已经成为了一种极具前瞻性的技术。在过去的几年中，出现了许多强大的AI绘画工具，如一键AI绘画、梦幻AI画家和Midjourney软件等。这些工具利用机器学习和计算机视觉…

阅读更多...

文字生成绘画软件有哪些？推荐你几款好用的ai绘画工具

文字生成绘画软件有哪些？推荐你几款好用的ai绘画工具

在社交媒体应用中，文字生成绘画的软件可以使我们更好地记录生活中的美好瞬间，而且它可以把文字内容制作成好看的图片分享给亲朋好友，增强沟通和互动效果。那么，小伙伴们知道文字生成绘画软件有哪些吗？这篇文章就给你推…

阅读更多...

推荐几个ai生成绘画软件给你

推荐几个ai生成绘画软件给你

绘画是一门需要艺术家经过长时间的学习和实践才能精通的技能，但现在有了人工智能绘画软件，人们可以更加轻松地创作出美丽的作品。今天，我们将和大家介绍一下ai绘画软件有哪些，希望这篇文章能够帮助你们实现自己的创意。推荐电脑端…

阅读更多...

ai绘画生成软件哪个好？分享几个ai绘画软件

ai绘画生成软件哪个好？分享几个ai绘画软件

ai绘画是人工智能技术在绘画领域的应用。随着科学技术的不断发展，越来越多的绘画软件开始采用ai技术，为画家提供更加自由、更加灵活的绘画体验。ai绘画的基本原理是利用人工智能技术对绘画过程进行辅助。在传统的绘画中，艺术家需要通过手工完…

阅读更多...

这几个AI生成绘画软件推荐给大家

这几个AI生成绘画软件推荐给大家

以前只有专业的画家才能绘制出优秀的画作，但现在AI技术的进步为普通人带来了极大的便利，只需要使用特定的软件，就能轻松绘制出高质量的画作。那大家知道可以AI人工智能绘画的软件有哪些吗?如果不知道也没关系，我来分享几款给你。…

阅读更多...

AI绘画怎么生成？这些软件帮助你实现

AI绘画怎么生成？这些软件帮助你实现

不知道前段时间，大家的朋友圈会不会出现很多的ai绘画作品呢？这是近期一个深受年轻人喜欢的绘画手法，它主要是通过ai技术，将我们描述的文字以及图片绘制成一幅画。那大家知道ai绘画怎么弄的吗？不知道的没关系&#xff0…

阅读更多...

android手机绘图软件,手机绘画软件(MediBang Paint Tablet)

android手机绘图软件,手机绘画软件(MediBang Paint Tablet)

MediBang Paint Tablet 是一款功能丰富的手机绘画软件，主要是用来绘制插画和漫画，内置有丰富的笔刷、素材、漫画用字体等功能，方便动漫作者进行创作，软件还为作者提供了云存储空间，作品可以上传保存，也可以…

阅读更多...

AI可以自动生成绘画吗？分享几款AI绘画软件

AI可以自动生成绘画吗？分享几款AI绘画软件

AI绘画热潮来临之前，我在网上看到不少人发了AI绘画的图片，除了画人物，还有画漫画和风景的图片，画面真实和色彩丰富程度让我不敢相信是AI画的，于是就去网上搜索AI可以自动生成绘画吗？在搜索的过程中&#xf…

阅读更多...

最新python爬虫爬取国外亚马逊商品分类里的所有商品标题，图片，介绍和价格

最新python爬虫爬取国外亚马逊商品分类里的所有商品标题，图片，介绍和价格

亚马逊某个分类商品的页面一开始肯定就是只试试这一个页面，看看能不能请求到刚开始不知道反爬做的好不好，就简单的加个User-Agent,果然不行，爬到的网页是让输入验证码的网页。然后就是用session， 再加上cookie，咦&a…

阅读更多...

C#绘图及图像

C#绘图及图像

C#绘图及图像绘图的基本方法绘图的应用

阅读更多...

一键即可实现图片翻译成中文，多国语言任意选

一键即可实现图片翻译成中文，多国语言任意选

大家有没有遇到过以下这些困扰呢：职场上对接的甲方是外国人，对方发来一堆外文图片文件、或是想在网上了解一些国外的实时资讯，但通常内容中会夹杂着一些英文图片等等。这些情况对于外语基础薄弱的人来说，简直是一个头两个大&#…

阅读更多...

在线古诗自动生成器的设计与实现

在线古诗自动生成器的设计与实现

在线古诗自动生成器的设计与实现前言一、算法模型介绍LSTM简介模型框架实验环境实验与分析实验数据集数据集预处理训练过程模型训练结果模型的评估二.在线古诗生成器的设计与实现系统结构远程服务器的项目部署系统测试三.成品展示前言古诗，作为中华文化的凝结&…

阅读更多...

[R语言]手把手教你如何绘图(万字)

[R语言]手把手教你如何绘图(万字)

目录概况常用高级图形条形图 csv文件导入 csv文件导出 R语言sep函数 seq函数 with函数直方图和密度估计图盒型图 boxplot() 正态QQ图散点图 pairs()散点矩阵图曲线图 curve() 三维图动态三维图低级图形函数 abline() lines() legand()增加图例 …

阅读更多...

古诗文本自动生成唐诗文本生成（算例代码）

古诗文本自动生成唐诗文本生成（算例代码）

首先准备好一个本地文件，在此我命名为唐诗三百首.txt如下图(https://img-blog.csdnimg. 图片: ##代码如下 import numpy as np, os from collections import Counter from warnings import filterwarnings filterwarnings(ignore) # 不打印警告from keras.utils…

阅读更多...

UE4_UE5结合offline voice recognition插件做语音识别功能

UE4_UE5结合offline voice recognition插件做语音识别功能

市面上主流的语音识别大多是用科大讯飞的SDK，但是那个也不是完全免费使用的，于是我选择使用offline voice recognition的语音识别，购买插件终生使用。 offline voice recognition插件在UE官方商城卖200多元。我将它需要的资源都打包成一个r…

阅读更多...

最新文章

推荐文章