ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星

点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达33304d8baca89a7a607ec1e984512bd5.jpeg

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。

它叫OpenChatKit,由前OpenAI研究员共同打造。

3833686d9f83edf3250531d65d7a9cbb.png

效果是这样儿的:

可以用简单的语言解释机器学习的概念,也可以回答测试者提出的第二个小问题。

信息提取也难不倒它,比如将一大段计划用表格表示。

6c8100aa2ff89816918eebac3a1a5a41.png

据悉,OpenChatKit一共包含200亿参数,在EleutherAI的GPT-NeoX-20B(GPT-3开源替代品)上进行了微调,还可以连接其它API或数据源进行检索等等。

这不,GitHub刚刚上线,就已经获得了800+标星。

841ecfc54c8958e81c24888e6a849fd0.png

有网友感叹“事情进展得也太快了吧”,作者则回应: 

安全带系紧,享受“飙车”吧。

efa9e4ddb07f30bb44871b1e9663df95.png

来看看它具体怎么玩?

OpenChatKit,你的平替ChatGPT

据介绍,OpenChatKit一共包含4个基本组件:

1、一个指令调优的大型语言模型。

用EleutherAI的GPT-NoX-20B对聊天功能进行了微调,后者在carbon-negative计算上具有4300万条指令。

调整重点是多轮对话、问答、分类、提取和摘要等几个任务。

2、定制配方(recipe)。

用来帮助微调模型使其能够为特定任务提供高精度的结果,只需要准备自己的数据集。

3、一个可扩展的检索系统。

可以让你在推理时从文档存储库、API或其他实时更新信息源添加信息。

7d0c07289dc9bd90a8bc7956f2cbb03c.png

4、一个由GPT-JT-6B微调而成的调节模型(moderation model)。可以过滤模型对一些问题的响应。

这样的OpenChatKit可以为各种应用程序创建专用和通用的聊天机器人。

a89ade7f7628ec3a22351b813f3bc2af.png

在GitHub上的仓库,你可以找到它的训练代码、测试推理代码以及通过检索增强模型的代码。

具体如何使用?

首先,在开始之前,安好PyTorch和其他依赖项。

先从作者团队的网站(Together)安装Miniconda,然后用此repo根目录下的environment.yml文件创建一个名为OpenChatKit的环境。

由于repo使用Git LFS来管理文件,所以还需要按照他们网站上的说明进行安装,然后运行git lfs install。

接着,关于预训练权重

GPT-NeoXT-Chat-Base-20B是GPT NeoX的200亿参数变体,它在会话数据集上进行了微调。

作者在Huggingface上的GPT-Next-Chat-Base-20B发布了预训练权重。

数据集方面,OpenChatKit模型是在LAION、Together和Ontocord.ai共同构建的OIG数据集上训练的。

同样,从Huggingface下载数据集,然后在repo的根目录运行以下命令就行:

python data/OIG/prepare.py。

(你也可以贡献新的数据来改善模型效果~)

然后就可以预训练基础模型了。

方法是在根目录用以下命令下载GPT-NeoX-20B模型:

python pretrained/GPT-NeoX-20B/prepare.py。

它的权重放在pretrained/GPT-NeoX-20B/EleutherAI_gpt-neox-20b目录中。

下载好之后,执行bash training/finetune_GPT-NeoXT-Chat-Base-20B.sh脚本,开始配置和训练。

训练会启动8个进程,管道并行度为8,数据并行度为1。Checkpoints则将保存到repo根目录的model_ckpts目录中。

推理之前,请务必将模型转换为Hugginface格式。

为了帮助你测试模型,作者也在这里提供了一个简单的测试命令行工具来进行交互,执行命令:

python inference/bot.py。

默认情况下,脚本会在目录下加载名为GPT-NeoXT-Chat-Base-20B model的模型,但我们可以通过—model进行改变。

都弄好之后,在提示符处输入文本,模型就会回复了。

c8e596ea985273a911315d11b842b292.png

最后,作者还提供了一个用维基百科进行扩展搜索的例子,操作也比较简单,感兴趣的同学可以自行查看。

关于作者

OpenChatKit的归属单位叫Together。

db36019323dc9794696331d9d0562db0.png

这是一家去年7月才成立的创业公司,专门为AI行业做去中心化的云服务。

CEO是Vipul Ved Prakash,他曾在苹果做了5年高级总监。

4526d006a8f3f07cc3c2dbe9555510af.png

CTO是Zhang Ce,苏黎世联邦理工学院计算机专业的助理教授。

4f54efdc962b9d23f7bb08269d3469db.png

据推特博主Itamar Golan称,OpenChatKit的作者包含多位前OpenAI研究员。

总的来说,OpenChatKit开箱即用,擅长多项任务,包括带有上下文的总结和问题回答、信息提取、文本分类等。

但它还不太擅长创意写作(尤其是编长故事)、写代码,以及有时可能会重复响应你的请求、在切换话题时表现迟钝……

不过,正如Together在博客中说的那样:

这个模型不是发布完就完了,它是一个开源项目的开始。

或许我们可以持续关注一波~

那么,如果你感兴趣,传送门在这里:

https://github.com/togethercomputer/OpenChatKit
https://huggingface.co/spaces/togethercomputer/OpenChatKit

参考链接:

[1]https://twitter.com/ItakGol/status/1634590622286741504
[2]https://www.together.xyz/blog/openchatkit

2eeff34e2ff9556d3c84027aa47f93b8.png

outside_default.png

点个在看 paper不断!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5265.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT开源优秀项目推荐

作为一名开发者,总是希望能够找到一些优秀的开源项目来学习、使用和贡献。而随着人工智能技术的不断发展,ChatGPT作为一个开源的大型语言模型,已经成为了人们学习和开发自然语言处理应用的重要工具。在这篇技术博客中,我将向大家介…

复旦版 ChatGPT 正式开源,太强了!!

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

【关于ChatGPT的30个问题】28、如何评价ChatGPT的安全性?/ By 禅与计算机程序设计艺术

28、如何评价ChatGPT的安全性? 目录 28、如何评价ChatGPT的安全性? ChatGPT安全性评价

openAi ChatGPT调用性能优化的一些小妙招

参考的demo:GitHub - ddiu8081/chatgpt-demo: A demo repo based on OpenAI API. 扭曲调教: openai提供的chat接口(https://api.openai.com/v1/chat/completions)由于其模型很大(什么1750亿个参数啥的),单…

逆天了!ChatGPT回答癌症问题,准确性与美国国家癌症研究所标准答案不相上下...

编译丨王聪 编辑丨王多鱼 排版丨水成文 ChatGPT,是由人工智能研究实验室 OpenAI 于2022年11月30日发布的全新聊天机器人模型——人工智能技术驱动的自然语言处理工具。ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动&…

脑洞|ChatGPT加持下,ChatOps将如何革新团队协作与运维管理?

要说近期科技圈 “顶流”,非 ChatGPT 莫属。 比起目前常见的语音助手与聊天 bot,这位机器人显得更有 “人味儿”,不仅能模拟人类的语气,跟你聊得有来有回,还能写剧本、编音乐、写代码。 说到聊天工具,就让…

ChatGPT 太强大 感觉无所不能

今天开发的项目需要在C# 中调用Matlab仿真模型 读取仿真数据,在百度查了大半天还是没搞定,试着问问ChatGPT,结果给的方法还真好使,有着怎样的小伙伴可以借鉴一下。 废话不多说直接贴代码: ChatGPT体验连接&#xff08…

设计界 ChatGPT ?有哪些强大功能? #Uizard Autodesigner ,

每一个使用过 ChatGPT 的人大概都会被这一强大的工具所折服,写代码、写论文、写情书......无所不能。 除了 AI 生成文字,设计界的 ChatGPT 也有强大的生成功能。 比如 Uizard 最新推出的 AI 设计功能—— Autodesigner 。 Uizard Autodesigner Autodesi…

向AI提问,这个新职业火了

将深燃设为“星标⭐” 第一时间收到文章更新 深燃(shenrancaijing)原创 作者 | 唐亚华 编辑 | 黎明 最近几个月,AI火爆空前,甚至催生了一个新职业,AI提示词工程师(Prompt Engineer)。 这个职业最…

AI提问师,这个新职业能火嘛

深燃(shenrancaijing)原创 作者 | 唐亚华 编辑 | 黎明 最近几个月,AI火爆空前,甚至催生了一个新职业,AI提示词工程师(Prompt Engineer)。 这个职业最早出现在美国求职网站Indeed上&#xff0c…

10个可以实现高效工作与在线赚钱的 AI 工具网站

自 2020 年以来,内容开发领域已经感受到人工智能工具的存在。 目前,营销人员和内容创作者正在利用这些工具来加快他们的工作流程。 如果您拥有最流行的 AI 工具之一,例如 CopyAI、Jasper AI 或 Content at Scale,您可能正在考虑…

GPT-4的前世、今生和未来!

作者 | 王思若 编辑 | 夕小瑶的卖萌屋 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 前言 诚然,从关系数据库到互联网信息检索,每一次知识表示和调用方式的跃迁都会在科技史引起一场巨大的技术变革。当ChatGP…

Auto-GPT的5大用例:建网站、当客服、数据分析......

Auto-GPT仅用了30多天的时间在github就突破了10万颗星,成为一款风靡全球的开源程序。Auto-GPT帮助ChatGPT突破了AI的界限,充当其“四肢”使得跨业务流程、平台实现超级自动化成为了可能。 由于Auto-GPT调用的是GPT-3.5或GPT-4的API,在代码开…

集成 GPT-4,动动嘴就能上线一个网站,这个工具强的离谱!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 GitHub Copilot X 正式问世以来,已经快过去半个月了。 在产品发布当天,最震撼我的,不是 AI 助理 Copilot Chat,也不是智能命令行 Copilot…

python的发展方向有哪些?

Python是一门面向对象的编程语言,编译速度超快,从诞生到现在已经25个年头了。它具有丰富和强大的库,常被称为“胶水语言”,能够把用其他语言编写的各种模块(尤其是C/C)很轻松地联结在一起。其特点在于灵活运用,因为其拥…

Python赚外快指南!找点轻松的活增加收入!

当今收入低于5000的人至少占到40%,完全不够养活一家人,而且很多小伙伴其实空余时间比较多,特别是大学生,零花钱又不够花,都想靠业余时间找点轻松的活增加收入。但是缺没门路,为此结合我多年编程开发经验&am…

GPT 即将为软件工业化开发带来“贾维斯时刻”!

大语言模型的出现让很多人担心劳动岗位替代的问题,但是,首先要“瑟瑟发抖”应该是企业当前的开发模式,这是释放工具潜力的关键。 作者 | 付晓岩 责编 | 梦依丹 出品 | CSDN(ID:CSDNnews) GPT 最近几乎…

微软许建志:AI-First App,一个既残酷、又美好的时代

责编 | Carol 出品 | CSDN(ID:CSDNnews) 内容编辑应该都有做网站专题的经历,通过给定网站模板套用来搭建页面。这样确实方便,但问题是对于千变万化的内容,并非几套,或者数十上百套模板就能够尽情…

三个Chat*GPT的创业机会,如何让它赚钱变现

今天是回来的第三个月了,回来就开始走上ChatGPT创业的这条路上,辛酸苦辣只有自知,晚上一点多了,团队都还在加班,我也还在写文章,也是痛并快乐着,废话不多说; 今天分享的三个赚钱变现…

GPT-4 重磅发布!零基础也能一秒做网站了?

大家好 当我还沉浸于收集各种基于 chatgpt 开发的 AI 效率神器时,OpenAI 竟然发布了 GPT-4。之前为大家介绍 ChatGPT 时就提到过它使用的是 GPT-3 的模型,而当时 OpenAI 的研发进度其实已经超过了 GPT-3,但是没想到 GPT-4 的发布会这么突然&…