国产开源ChatGPT模型对比

国产开源ChatGPT模型对比(大雾)

概述

为什么要做国产开源ChatGPT模型对比呢(大雾),答案显而易见嘛。最近尤其是这阵子ChatGPT爆火, 2月3日在ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。
而要达到这个用户量,TikTok用了9个月,Instagram则花了2年半的时间。作为一款聊天机器人,凭借大规模预训练模型GPT3.5(~100B参数)、指令微调尤其是人类反馈强化学习微调(RLHF,OpenAI在强化学习领域有独特的创见)等两件法宝,
ChatGPT拥有充足的知识储备和不可思议的问答逻辑性,尤其是强悍的多轮问答能力,满足了广罗大众对通用人工智能的幻想,那么其快速出圈就顺理成章了。此外,谷歌与OpenAI的恩怨情仇,那更是大家喜闻乐见的吃瓜情节啦。
让我们恭喜OpenAI这个bi,终于一洗往日的阴霾(或许是早前BERT始终压GPT一头)。果然,竞争、对抗才能迸发创造力呀。

简介

回到正题,让我们今天收集汇总一下当前的国产开源ChatGPT模型(2023.02.08)。

一、基本信息

模型基础架构训练数据量参数量开源程度PyTorch作者源地址应用领域
ChatGPTGPT3.545TB~100B(GPT3是175B)--OpenAI-通用
ChatRWKVRWKV-40.78TB0.1B/1.5B/3B/7B/14B(开源)/20B(训练中)训练/推理代码和模型都开源huggingfacePENG Bogithub中英文对话(语料不多)
ChatYuanT50.5TB(存疑?)0.7B(开源)/~10B(api)PromptCLUE指令微调代码开源huggingfaceClueAIgithub功能型对话/生成(语料不多)
SkyTextGPT20.5TB(存疑?)3B/14B(开源)推理代码和模型开源huggingfaceSkyWorkAIGCgithub功能型对话/生成(语料不多)

二、训练过程

2.1 ChatGPT

步骤

  • a. 训练GPT3.5系列模型, 在45TB数据上进行文本预训练(学习语言建模, GPT3), 在代码数据集上进行预训练(包括代码理解与生成, Codex), GPT3.5的参数量为175B;
  • b. 有监督的指令微调(类似Instruct-GPT, Supervised Fine-tuning, SFT), 在高质量开源任务数据集上微调, 遵循人类指令, 为了泛化到没有见过的任务;
  • c. 强化学习版有监督的指令微调(12.9k数据? Reinforcement Learning From Human Feedback, RLHF), 基于人类偏好, 从人类的反馈中标注排序;
  • d. 思维链提示微调(Chain-of-thought, CoT), 使用逐步推理的指令数据集(对话数据集), Think step by step;

2.2 ChatRWKV

步骤

  • a. 训练RWKV-4模型, 类似GPT(linear transformer的RNN), 早期用于小说生成, 使用的Pile数据集有800GB语料;
  • b. 中英文语料指令微调(已知的有95G开源多语言数据xP3, 使用到的是en数据37.43G和zh数据4.38G), 指令微调模板为bigscience/promptsource, 注意这里只用了QA模板;
  • c. 训练时间(存疑?), 显卡100-1000张A100(存疑?): RWKV-4-1.5b-8040训练了45天; RWKV-4-3b-8023训练了28天; RWKV-4-7b-8047训练了65天; RWKV-4-14b-7324训练了109天;

2.3 ChatYuan

步骤

  • a. 在T5模型上继续训练, 数百G中文语料(400G存疑?)中文语料上进行语言模型的预训练;
  • b. 指令微调PromptCLUE, 在已有的开源16个任务类型150+数据集(几百个数据集累积亿级别任务数据, 200M存疑?)训练, 也和a交替训练, 防止灾难遗忘;
  • c. 多轮对话语料(数亿条功能对话多轮对话数据(200M?存疑))指令微调;
  • d. 训练时间/显卡: 500张V100训练一个月;

2.4 SkyText

步骤

  • a. 训练GPT2模型, 千亿级别的高质量数据(400G存疑?)中文语料上进行语言模型的预训练, 支持聊天、问答、中英互译、分类、文本续写、生成菜谱/对联/哲理/五言诗/采访/对联, 其他未知;
  • d. 训练时间/显卡: SkyText-14B使用A100-GPU集群,训练200张显卡,训练4周,后续优化2周;

三、简单猜想

3.1 通用人工智能

在这里插入图片描述

实现通用人工智能的三条路:

  • 1.符号主义(就像数学一样存在可以推倒一切的公理、定理)
  • 2.连接主义(类脑模型的模仿, 如大模型就是模仿人脑数以亿计的神经元)
  • 3.行为主义(注重与环境的交互, 如人类的后天学习等, 强化学习)

ChatGPT似乎是第一个把这三种路同时走通的算法模型, 称赞通用人工智能的里程碑事件也不为过。
代码训练语料的注入就是为了学习符号主义, 构建指令Prompt也与符号主义有关, 为了推理与泛化到没见过的任务;
模型175B参数量就与人脑800B神经元接近, 存储大量知识等待激活, 注意力Attention机制更是模仿人眼聚焦输入;
有人类反馈的强化学习版有监督的指令微调RLHF显然就是行为主义了, 与外界交互获得更多的聊天细节, 激活能力;

四、ChatGPT涉及的技术

4.1 ChatGPT进化树

图来自符尧等的ChatGPT的前世今生
在这里插入图片描述

4.2 GPT-3.5进化历程

图来自符尧等的ChatGPT的前世今生
在这里插入图片描述

参考

  • ChatGPT内核:InstructGPT,基于反馈指令的PPO强化学习
  • ChatGPT评测观察之对话能力
  • ChatGPT的前世今生
  • 2022年NLP突破进展
  • RWKV-LM
  • ChatRWKV
  • PromptCLUE
  • ChatYuan
  • SkyText
  • SkyText-4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2317.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智见|专访智谱AI CEO张鹏: 国产ChatGPT的春天来了吗

出品|网易科技《智见访谈》 采访|丁广胜 撰文|袁宁 风暴自ChatGPT 震撼亮相起。 国外,一路狂飙,其背后的GPT大模型全方位秀肌肉,不断展现其惊人能力。又迅速演化,完成迭代,仅四个月后就发布GPT4,引发连连惊…

国产ChatGPT「套壳」的秘密,现在被找到了

衡宇 发自 凹非寺量子位 | 公众号 QbitAI “套壳ChatGPT!”“套皮Stable Diffusion!”“实则抄袭!”…… 外界对国产大模型产生质疑已经不是一次两次了。 业内人士对这个现象的解释是,高质量的中文数据集实在紧缺,训模…

复旦“首发”国产版 ChatGPT!名为 MOSS 惹群嘲,回应称:还非常不成熟

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 身处科技圈的各位,最近应该都被 ChatGPT “刷屏”了吧。 不仅国外微软、谷歌、Meta 等科技巨头争相布局,国内百度、科大讯飞、华为、阿里巴巴、360、京东等大厂也集体“上车”…

ZeLinAI是什么?国产ChatGPT快速搭建自己的AI应用

ChatGPT使用门槛高,需要科学上网短信接码等,不如直接选择国产ZelinAI,使用超简单轻轻松松从0到1零代码创建自己的AI应用。目前模型仅支持GPT-3.5-turbo,后续应该会接入文心一言、GPT-4、GPT-4.5和Bard,新手站长分享国产…

果然,ChatGPT还是被拿去搞黄色了...

来源:网络 此前,推出的各类AI绘画工具。 想要制作出还能看得过去的作品,需要一定的美术功底和美感,上手门槛一点也不低。 大部分绅士顶多做个饱饱眼福的观众,完全没有参与感。 啪得一下很快啊,最近一个新的…

国产版 ChatGPT 来了,百度确认将推出文心一言,计划三月面世!

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 快来了,快来了,带着众人的期望,国产版 ChatGPT 就快来啦! 近日,经百度内部确认,其正在研发一款 AI 对话式聊天机器人,…

一天现六个国产ChatGPT大模型,“百模大战”全面开打

(图片来源:Shutterstock) 国内人工智能(AI)大模型行业到底有多火?你看看下面消息就知道了。 仅4月18日一天,就有6个关于大模型的重要消息公布: 钉钉宣布正式接入阿里巴巴“通义千问…

国产 ChatGPT 争夺战打响!科大讯飞有信心百天内实现应用落地

近日,由人工智能实验室 OpenAI 发布的对话式大型语言模型 ChatGPT一路“狂飙”,在全球学术界和产业界卷起了新一轮 AI 龙卷风,成为了史上增速最快的消费级应用程序。 短短两个月,这个 AI 界乃至科技圈的“新晋顶流”月活便超过 1 …

国产 ChatGPT 赛道又添一员:「天工」大模型发布,我们准备了 20 问火速实测!...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 一个月前,百度「文心一言」的发布可谓赚足了眼球,国产 ChatGPT 之战也由此正式拉开序幕:阿里版类 ChatGPT「通义千问」突然官宣,商汤也发布了「商量」语…

通过百度文心一言大模型作画尝鲜,感受国产ChatGPT的“狂飙”

3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、…

现在就能用!公测版本的“国产ChatGPT”,实力几何?

ChatGPT 的热度依然在持续,大家热切期待着国内类 ChatGPT 产品的出现。 最近还真的出现了一个公测产品——对话写作猫,由秘塔科技自研的 LLM 大模型。 之前被各种山寨/转接/内测版本吊起来的胃口,这下终于有放开大吃一顿的机会了。 一直以来大…

国产ChatGPT之初体验

ChatGPT的大火,不仅让人惊讶现代人工智能的发展速度,更让人增加了人类会不会被人工智能取代的担忧。ChatGPT属于NLP自然语言处理人工智能,虽然仍然有很多不足,但在其能力范围内,在网络上整合资源的效率似乎要比普通人强…

国产chatgpt:基于chatGLM微调nlp分类任务

文章目录 一、源码网址1. 硬件设施:2. INT4 量化示例 二、重要的开源社区功能:网址:使用方法:利用方法:对 NLP 工作者的作用:对大模型工程师的用处: 三、重要的开源库四、提示词工程五、进行分类…

千万不要把ChatGPT引入浏览器回答问题

试用的时候有多爽,最后你删对话的时候就有多狼狈

ChatGPT重磅升级,可以联网、添加插件!最后的封印解除了!

这下没什么能阻止 ChatGPT 了? ChatGPT 是个「智商超高」的人工智能,经过 GPT-4 内核的升级版更是如此。然而我们知道,它的训练数据截止到 2021 年,没有训练过的东西,AI 是不可能准确回答出来的。 自去年 11 月上线以来…

如何用edge浏览器调用chatgpt的api接口?

目录 (1)首先在apifox或postman编写接口 url:https://api.openai.com/v1/completions 参数说明:prompt是问题的文本,max_tokens是最大token数,目前最大为4097(包括标题)&#xff…

假冒的ChatGPT浏览器扩展被发现劫持Facebook账户

谷歌已介入从官方网上商店中删除伪装成 OpenAI 的 ChatGPT 服务的虚假 Chrome 浏览器扩展程序,以获取 Facebook 会话 cookie 并劫持帐户。 “ChatGPT For Google”扩展程序是合法开源浏览器插件的木马化版本,自 2023 年 3 月 14 日被删除以来吸引了超过…

merlin—chatgpt浏览器插件

下载 视频一键总结 CtrlQ 打开智能问答

推荐一款国人开发的ChatGPT浏览器插件

一、糟糕的搜索引擎体验 在使用主流的搜索引擎(百度、谷歌、必应)搜索一个java问题的时候,经常搜索出来的答案很不理想。 有时候答案基本会有很多重复,不知道谁是原创,谁是抄袭的; 有时候回答地过于简单&…

效率神器!神级ChatGPT浏览器插件分享

大家好,我是卷了又没卷,薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师,带来最新的前沿AI知识和工具,欢迎大家交流~,后续我还会分享更多 AI 有趣工具和实用玩法,包括AI相关技术、ChatGPT、AI…