从 ELMo 到 ChatGPT:历数 NLP 近 5 年必看大模型

目录

  • AI21 Labs
  • Alibaba
  • Allen Institute for AI
  • Amazon
  • Anthropic
  • BAAI
  • Baidu
  • BigScience
  • Cohere
  • DeepMind
  • EleutherAI
  • Google
  • Huggingface
  • iFLYTEK
  • Meta (Facebook)
  • Microsoft
  • NVidia
  • OpenAI
  • Salesforce
  • Tsinghua University
  • UC Berkeley
  • Yandex
  • 持续更新中 ...
  • 参考


团队博客: CSDN AI小组


相关阅读

  • ChatGPT 简介
  • 关于 ChatGPT 必看的 10 篇论文
  • ChatGPT 中的人类反馈强化学习 (RLHF) 实战

先上 “万恶之源”:Transformer
在这里插入图片描述


按机构分类

AI21 Labs

发布时间模型名称参数量机构相关链接开源
2021-09Jurassic-1 (J1)J1-Jumbo v1 (178B),
J1-Large v1 (7.5B),
J1-Grande v1 (17B)
AI21 Labs论文 ,
官方文档,
技术报告
受限

Alibaba

发布时间模型名称参数量机构相关链接开源
2019-08StructBertstructbert.en.large(340M),
structroberta.en.large(355M),
structbert.ch.large(330M)
Alibaba Group Inc.论文,
GitHub
模型

Allen Institute for AI

发布时间模型名称参数量机构相关链接开源
2018-02ELMoSmall(13.6M),
Medium(28.0M),
Original(93.6M)
Allen Institute for AI &
University of Washington
论文模型

Amazon

发布时间模型名称参数量机构相关链接开源
2022-03DQ-BART与标准BART相比,参数减少了30倍Cornell University &
AWS AI Labs &
University of Pennsylvania
论文

Anthropic

发布时间模型名称参数量机构相关链接开源
2021-12Anthropic-LMAnthropic-LM v4-s3 (52B)Anthropic论文1,
论文2
未开源

BAAI

发布时间模型名称参数量机构相关链接开源
2021-06Wu Dao 2.01.75TBAAI官网模型

Baidu

发布时间模型名称参数量机构相关链接开源
2019-05ERNIE114MBaiduGitHub,
论文
模型

BigScience

发布时间模型名称参数量机构相关链接开源
2022-05T0pp11BBigScience etc.论文模型
2022-07BLOOM176BBigScience论文模型
2022-11BLOOMZ176BBigScience etc.论文模型

Cohere

发布时间模型名称参数量机构相关链接开源
2022-06CohereCohere xlarge v20220609 (52.4B),
Cohere large v20220720 (13.1B) ,
Cohere medium v20220720 (6.1B) ,
Cohere small v20220720 (410M) ,
Cohere xlarge v20221108 (52.4B),
Cohere medium v20221108 (6.1B)
Cohere官网受限

DeepMind

发布时间模型名称参数量机构相关链接开源
2021-07AlphaFold21MDeepMind etc.论文
2021-12Gopher280BDeepMind论文,
官网
未开源
2022-03Chincilla70BDeepMind论文未开源
2022-03GopherCite280BDeepmind &
University College London
论文
2022-04Flamingo80B (largest)Deepmind论文flamingo-mini模型
2022-05Gato1.2BDeepmind论文
2022-09Sparrow70BDeepmind论文

EleutherAI

发布时间模型名称参数量机构相关链接开源
2021-03GPT-Neo5B,
2.7B (XL)
EleutherAI论文模型
2021-06GPT-J6BEleutherAI博客模型
2021-12StableDiffusion890MLMU Munich &
Stability.ai &
Eleuther.ai
论文模型
2022-04GPT-NeoX20BEleutherAI论文模型

Google

发布时间模型名称参数量机构相关链接开源
2018-10BERTBase = 110M,
Large = 340M
Google AI Language论文模型
2019-01Transformer XL151MCarnegie Mellon University &
Google Brain
论文模型
2019-05XLNetBase=117M,
Large=360M
Google AI Brain Team &
Carnegie Mellon University
论文模型
2019-09ALBERTBase = 12M,
Large = 18M,
XLarge = 60M
Google Research &
Toyota Technological Institute at Chicago
论文模型
2019-10T511BGoogle论文模型
2019-12PegasusBase = 223M,
Large = 568M
Imperial College London &
Google Research
论文模型
2020-03ELECTRABase = 110M,
Large = 330M
Google Brain & Stanford University论文模型
2020-07BigBird取决于整体架构Google Research论文模型
2020-10ViT86M(Base) to 632M (Huge)Google Research论文模型
2021-01Switch1TGoogle论文模型
2021-06Decision Transformers117MGoogle Brain &
UC Berkeley &
Facebook AI Research
论文模型
2021-12GLaM1.2T覆盖64个专业领域,
但只有96B被激活用于推理
Google论文,
官方博客
2022-01LAMDA137BGoogle论文,
官方博客
2022-04PaLM540BGoogle Research论文,
官方博客
未开源
2022-05UL220BGoogle Research论文模型
2022-06Imagen2BGoogle Research论文,
官网
2022-06Minerva540BGoogle Research论文,
官网
2022-12Flan-T511BGoogle论文模型

Huggingface

发布时间模型名称参数量机构相关链接开源
2019-10DistilBERT66MHuggingface论文模型

iFLYTEK

发布时间模型名称参数量机构相关链接开源
2020-11MacBertMacBERT-large, Chinese(324M),
MacBERT-base, Chinese(102M)
iFLYTEK AI Research &
Harbin Institute of Technology
论文模型

Meta (Facebook)

发布时间模型名称参数量机构相关链接开源
2019-07RoBERTa356MFacebook AI &
University of Washington
论文模型
2019-10BART比 BERT 多 10%Facebook AI论文模型
2019-10XLM-RoBERTaBase = 270M,
Large = 550M
Facebook AI论文模型
2020-01mBART与BART相同Facebook AI Research论文模型
2021-07HTML400MFacebook AI &
University of Washington
论文
2022-01CM313B (largest)Facebook AI Research论文
2022-03SeeKer与基模型相同Facebook AI Research &
ETH Zürich
论文,
官网
2022-05OPT175B,
66B
Meta AI论文,
官网
模型
2022-08BlenderBot3175BMeta AI &
Mila/McGill University
论文blenderbot-3B模型,
模型
2022-11Galatica120BMeta AI论文模型

Microsoft

发布时间模型名称参数量机构相关链接开源
2019-03MT-DNN330MMicrosoft Research论文模型
2019-05UniLM340MMicrosoft Research论文,
GitHub
模型
2019-10DialoGPT1.5BMicrosoft Corporation论文模型
2020-02Turing NLG17BMicrosoft官方博客
2021-03Swin Transformer29M-197MMicrosoft Research AsiaGitHub ,
论文
模型

NVidia

发布时间模型名称参数量机构相关链接开源
2019-09Megatron-LM8.3B (GPT-like),
3.9B (BERT-like)
NVidia论文,
GitHub
2021-10Megatron Turing NLG530BMicrosoft &
NVIDIA
论文,
官方博客
未开源
2022-06Global Context ViT90MNVidia论文

OpenAI

发布时间模型名称参数量机构相关链接开源
2018-06GPT117MOpenAI论文模型
2019-02GPT-21.5BOpenAI论文模型
2020-05GPT-3GPT-3 davinci v1 (175B),
GPT-3 curie v1 (6.7B),
GPT-3 babbage v1 (1.3B),
GPT-3 ada v1 (350M)
OpenAI论文,
GitHub
受限
2021-01DALL-E12BOpenAI论文,
官方博客,
Demo
2021-02CLIP未知OpenAI论文,
GitHub
模型
2021-07CodexCodex davinci v2 (Unknow),
Codex davinci v1 (Unknow),
Codex cushman v1 (Unknow)
OpenAI论文受限
2021-12GLIDE12BOpenAI论文,
Demo
2022-01InstructGPTInstructGPT davinci v2 (175B*),
InstructGPT davinci v1 (175B*),
InstructGPT curie v1 (6.7B*),
InstructGPT babbage v1 (1.3B*),
InstructGPT ada v1 (350M*)
OpenAI论文,
官网
受限
2022-04DALL-E-23.5BOpenAI论文,
官网
2022-10GPT-3.5175BOpenAI官网未开源
2022-10ChatGPT与 GPT3 相同OpenAI官网未开源

Salesforce

发布时间模型名称参数量机构相关链接开源
2019-09CTRL1.63BSalesforce Research论文模型

Tsinghua University

发布时间模型名称参数量机构相关链接开源
2020-10GLM130BTsinghua University &
Zhipu.AI
论文,
Demo
10B版模型

UC Berkeley

发布时间模型名称参数量机构相关链接开源
2021-06Trajectory Transformers比 GPT 更小的架构UC Berkeley论文模型

Yandex

发布时间模型名称参数量机构相关链接开源
2022-06YaLM100BYandexGitHub,
博客
模型

持续更新中 …

由于涉及到的模型较多,文中可能存在纰漏,还望指正,谢谢!

参考

[1] CRFM Benchmarking
[2] Transformer models: an introduction and catalog — 2023 Edition

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/45112.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Adobe全新AI工具引关注,Adobe firefly助力创作更高效、更有创意

原标题:Adobe全新AI工具引关注,Adobe firefly(萤火虫)助力创作更高效、更有创意。 以ChatGPT为首的生成式AI、AIGC等工具的战局正如火如荼的进行中..... 除了微软、百度的聊天机器人和一些初创公司的AI画图工具令人惊艳&#xff…

李飞飞高徒盘点年度十大AI亮点:核聚变、ChatGPT、AlphaFold上榜

来源:新智元 编辑:Aeneas 昕朋 【导读】2022年有哪些人工智能的突破?今天,李飞飞高徒Jim Fan盘点了年度十大AI亮点。 人工智能的爆炸正在扭曲我们的时间感。 你能相信Stable Diffusion只有4个月大,而ChatGPT的出现还不…

【教学类-38】20230724京剧脸谱涂色(Python 彩图彩照转素描线描稿)

一、作品预览 京剧脸谱(涂色)学具展示(64份) 二、背景需求: 1、大班主题《我是中国人》里面有一个“京剧脸谱”的子主题。从网上下载的彩色脸谱(红黄绿蓝紫黑白),作为环境装饰。引…

智能ai生成绘画软件有哪些?亲测好用的软件分享

小伙伴们有听说过ai绘画吗?这是目前比较火的一种绘画方式,我们可以通过给AI输入一段关于画面描述的文字内容,ai就可以根据这些内容,生成一幅相关的画作。对于不会画画,但是有创意的小伙伴,你们会不会也想试…

Drawio免费绘图软件下载

drawio是一款强大、免费的绘图工具,使用起来非常方便,非常好用,可以满足大部分画图功能,例如UML、页面设计(Android&iOS)等visio能画的图它都可以画。支持网页版使用(网页版可以自己部署一套…

ai绘画生成软件哪个好?这3款ai绘画生成软件还不错

你知道ai绘画生成软件哪个好吗?随着人工智能技术的不断进步,AI绘画已经成为了一种极具前瞻性的技术。 在过去的几年中,出现了许多强大的AI绘画工具,如一键AI绘画、梦幻AI画家和Midjourney软件等。这些工具利用机器学习和计算机视觉…

文字生成绘画软件有哪些?推荐你几款好用的ai绘画工具

在社交媒体应用中,文字生成绘画的软件可以使我们更好地记录生活中的美好瞬间,而且它可以把文字内容制作成好看的图片分享给亲朋好友,增强沟通和互动效果。那么,小伙伴们知道文字生成绘画软件有哪些吗?这篇文章就给你推…

推荐几个ai生成绘画软件给你

绘画是一门需要艺术家经过长时间的学习和实践才能精通的技能,但现在有了人工智能绘画软件,人们可以更加轻松地创作出美丽的作品。今天,我们将和大家介绍一下ai绘画软件有哪些,希望这篇文章能够帮助你们实现自己的创意。 推荐电脑端…

ai绘画生成软件哪个好?分享几个ai绘画软件

ai绘画是人工智能技术在绘画领域的应用。随着科学技术的不断发展,越来越多的绘画软件开始采用ai技术,为画家提供更加自由、更加灵活的绘画体验。ai绘画的基本原理是利用人工智能技术对绘画过程进行辅助。在传统的绘画中,艺术家需要通过手工完…

这几个AI生成绘画软件推荐给大家

以前只有专业的画家才能绘制出优秀的画作,但现在AI技术的进步为普通人带来了极大的便利,只需要使用特定的软件,就能轻松绘制出高质量的画作。那大家知道可以AI人工智能绘画的软件有哪些吗?如果不知道也没关系,我来分享几款给你。…

AI绘画怎么生成?这些软件帮助你实现

不知道前段时间,大家的朋友圈会不会出现很多的ai绘画作品呢?这是近期一个深受年轻人喜欢的绘画手法,它主要是通过ai技术,将我们描述的文字以及图片绘制成一幅画。那大家知道ai绘画怎么弄的吗?不知道的没关系&#xff0…

android手机绘图软件,手机绘画软件(MediBang Paint Tablet)

MediBang Paint Tablet 是一款功能丰富的手机绘画软件,主要是用来绘制插画和漫画,内置有丰富的笔刷、素材、漫画用字体等功能,方便动漫作者进行创作,软件还为作者提供了云存储空间,作品可以上传保存,也可以…

AI可以自动生成绘画吗?分享几款AI绘画软件

AI绘画热潮来临之前,我在网上看到不少人发了AI绘画的图片,除了画人物,还有画漫画和风景的图片,画面真实和色彩丰富程度让我不敢相信是AI画的,于是就去网上搜索AI可以自动生成绘画吗?在搜索的过程中&#xf…

最新python爬虫爬取国外亚马逊商品分类里的所有商品标题,图片,介绍和价格

亚马逊某个分类商品的页面 一开始肯定就是只试试这一个页面,看看能不能请求到刚开始不知道反爬做的好不好,就简单的加个User-Agent,果然不行,爬到的网页是让输入验证码的网页。然后就是用session, 再加上cookie,咦&a…

C#绘图及图像

C#绘图及图像 绘图的基本方法 绘图的应用

一键即可实现图片翻译成中文,多国语言任意选

大家有没有遇到过以下这些困扰呢:职场上对接的甲方是外国人,对方发来一堆外文图片文件、或是想在网上了解一些国外的实时资讯,但通常内容中会夹杂着一些英文图片等等。这些情况对于外语基础薄弱的人来说,简直是一个头两个大&#…

在线古诗自动生成器的设计与实现

在线古诗自动生成器的设计与实现 前言一、算法模型介绍LSTM简介模型框架实验环境实验与分析实验数据集数据集预处理训练过程模型训练结果模型的评估 二.在线古诗生成器的设计与实现系统结构远程服务器的项目部署系统测试 三.成品展示 前言 古诗,作为中华文化的凝结&…

[R语言]手把手教你如何绘图(万字)

目录 概况 常用高级图形 条形图 csv文件导入 csv文件导出 R语言sep函数 seq函数 with函数 直方图和密度估计图 盒型图 boxplot() 正态QQ图 散点图 pairs()散点矩阵图 曲线图 curve() 三维图 动态三维图 低级图形函数 abline() lines() legand()增加图例 …

古诗文本自动生成唐诗文本生成(算例代码)

首先准备好一个本地文件,在此我命名为唐诗三百首.txt如下图(https://img-blog.csdnimg. 图片: ##代码如下 import numpy as np, os from collections import Counter from warnings import filterwarnings filterwarnings(ignore) # 不打印警告from keras.utils…

UE4_UE5结合offline voice recognition插件做语音识别功能

市面上主流的语音识别大多是用科大讯飞的SDK,但是那个也不是完全免费使用的,于是我选择使用offline voice recognition的语音识别,购买插件终生使用。 offline voice recognition插件在UE官方商城卖200多元。 我将它需要的资源都打包成一个r…