ChatGPT 的开源“替代”来了!前 OpenAI 团队出手,能用中文提问,3 天斩获 3k+ Star...

e09447d68d7b136be11fa18428a8f59f.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

近来 ChatGPT 的爆火,令不少人开始关注其背后的 OpenAI。

追溯过往才发现,原来成立于 2015 年的 OpenAI,最初声称是一家非营利机构,会向公众开放专利和研究成果,要为人类谋福利。

但 2019 年,OpenAI 变成了一家名为 OpenAI LP 的营利性公司,又接受了微软注资的 10 亿美元后:GPT-3 仅通过 API 发布而非开源模型,ChatGPT 也毫无开源迹象——许多人唏嘘:不如改名为 ClosedAI。

意外的是,ChatGPT 的开源“平替”还是来了。

3 月 12 日,Orca Security 数据科学主管 Itamar Golan 在推特分享了“第一个 ChatGPT 的开源替代”:Together 组织中的前 OpenAI 研究员团队,发布了一个类 ChatGPT 开源模型,名为 OpenChatKit。

c607123d7e22ee73523aecc4b96a0993.jpeg

值得一提的是,不论是 OpenChatKit 的源代码、模型权重还是训练数据集,Together 已全部公开。

85c5aebd63b476f4aca9c83eccb88175.png

在问答、提取和分类方面,表现尚佳

根据 Together 官方介绍,GPT-NeoXT-Chat-Base-20B 是构成 OpenChatKit 基础的大型语言模型,而它则基于“黑客组织” EleutherAI 的 GPT-NeoX-20B 模型。

作为一个诞生于 2020 年 7 月的“黑客组织”,EleutherAI 由一群机器学习研究人员组成,为反抗微软与 OpenAI 对大规模 NLP 模型的垄断(微软与 OpenAI 达成协议,拥有对 GPT-3 源码的独家访问)而成立,旨在构建和开源大型语言模型。

EleutherAI 创始人 Connor Leahy 曾说:“起初这真的只是一个有趣的业余爱好。我们认为自己是几十年前经典黑客文化的后裔,只是在新的领域,出于好奇和对挑战的热爱而对技术进行试验。”

成立不到 3 年,EleutherAI 不断实现其目标:先发布了类 GPT 的 27 亿参数模型 GPT-Neo,又开源了 60 亿参数的 NLP 模型 GPT-J,去年又免费开放了包含 200 亿参数的 GPT-NeoX-20B。

得益于 GPT-NeoX-20B 的开源,Together 用 4300 万条高质量指令的集合对模型的聊天功能进行了微调,主要在多轮对话、问答、分类、提取和摘要等方面重点调优,从而得到了 GPT-NeoXT-Chat-Base-20B。

据介绍,GPT-NeoXT-Chat-Base-20B 开箱即用,为一系列广泛的自然语言任务提供了一个强大基础,它在 HELM 基准测试上的得分高于其基本模型 GPT-NeoX,特别是在涉及问答、提取和分类的任务上。

778fd2deaa88c1d6f2c63510f0b8c38f.png

基于 GPT-NeoXT-Chat-Base-20B 的 OpenChatKit,也就继承了这些优点。

98326d6b658cd1448d6ae9ce2e8a0bfc.png

在编码等方面还有欠缺

具体来说,OpenChatKit 一共包含 4 个关键组件:

(1)一个经过指令调整的大型语言模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,经过了 4300 万条指令的微调。

(2)定制配方,对模型进行微调,以实现任务的高精确度。

(3)一个可扩展的检索系统,能够在推理时用来自文件库、API 或其他实时更新的信息源的信息来增强响应。

(4)一个由 GPT-JT-6B 微调的调节模型,以此过滤一些问题的响应。

基于这些组件,现阶段的 OpenChatKit 开箱即用,并且在问答、信息提取和文本分类方面较为擅长:

user:将下面句子的情感分为正面、中性或负面:对于教授斯坦福大学的第一门大型语言模型课程,我感到非常兴奋!在这里查看教学大纲。

bot:正面的。

user:将下面句子的情感分为正面、中性或负面:外面在下雨,我感到很忧郁。

bot:负面的。

同时 Together 也承认,目前刚发布的 OpenChatKit 仍存在不少问题和缺陷,例如编码能力不足、会重复回答等:

  • 基于知识的封闭式问答:聊天机器人可能会产生幻觉并给出不正确的结果,用户务必进行事实核查,并在可能的情况下提供反馈和更正的信息。

  • 编码任务:聊天机器人没有经过足够大的源代码库的训练,所以暂且无法出色地编写代码。

  • 会重复:有时聊天机器人会重复回答,用户可以通过单击刷新按钮开始新的对话。

  • 语境切换:如果在对话中改变话题,聊天机器人可能无法自动进行切换,并将继续提供与先前主题相关的答案。

  • 创意写作和较长的回答:当前的聊天机器人不能生成有创意的长文,例如散文或故事。

为此,Together 呼吁大家一起尝试与 OpenChatKit 对话(https://huggingface.co/spaces/togethercomputer/OpenChatKit),如发现问题可随时反馈,以此加强数据集并提高其准确性:“这不仅是一个模型的发布,更是一个开源项目的开始,希望能在社区的帮助下不断改进。”

1a473f7d20ec027978dc85252fe1b636.png

可以用中文问答

或许是拥有着“前 OpenAI 研究团队开发”的前缀,OpenChatKit 仅发布 3 天,就在 GitHub 上收获了 3k+ Star,在 Issues 页面还能看到不少国内开发者的提问:

a7f906344bcf4a2c008bca08f2e9c56a.png

76cab2c9bd0593011ddd89fb32a5d680.png

“ChatGPT 支持多语言问答和推理,尽管在大多数情况下,首先生成英语答案,然后翻译成其他语言。所以我想问一下,OpenChatKit 是否支持直接的中文问答,还是我需要使用中文数据集进行训练,然后才能进行中文问答?”

对此,使用过 OpenChatKit 的开发者回答称直接就可以。至于用中文问答 OpenChatKit 的效果,也有开发者分享了截图:“中文提示也可以(输出质量取决于你的提示)。”

c7d476f47b52d048c3dfaa168d9ba86d.png

不过,毕竟与 ChatGPT 在模型参数量上就有“壁”,OpenChatKit 显然还有很大的差距和不足,需较长时间的成长与迭代。对 OpenChatKit 感兴趣的程序员们可前往项目主页具体查看和尝试:

项目地址:https://github.com/togethercomputer/OpenChatKit

测试链接:https://huggingface.co/spaces/togethercomputer/OpenChatKit

参考链接:

https://www.together.xyz/blog/openchatkit

https://github.com/togethercomputer/OpenChatKit

 

4a38c748eae77598567ed8231c17a527.gif

 
 
☞久久为功,华为云助力软件行业高效创新
☞烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
☞深挖 ChatGPT 原理,保姆级解说!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19534.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

免费搜索vs付费搜索:百度谷歌的有力竞争者刚刚出现!

北大出版社,人工智能原理与实践 人工智能和数据科学从入门到精通 详解机器学习深度学习算法原理 人工智能原理与实践 全面涵盖人工智能和数据科学各个重要体系经典 搜索引擎的游戏刚刚被改变! 人们对昨天(12月1号)OpenAI 发布…

探索大语言模型垂直化训练技术和应用-陈运文

内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:达观数据董事长兼CEO 陈运文博士 分享主题:《探索大语言模型垂直化训练技术和应用》 转载自CSDN稿件 本文整理自 3月11日 《ChatGPT 及大规模专题研讨会》上,达观数据董事长兼CEO…

ECharts之柱状图 饼状图 折线图

1.柱状图 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>柱状图</title><script src"https://cdn.bootcss.com/echarts/3.7.2/echarts-en.js"></script> </head> …

ChatGPT工作提效之数据可视化大屏组件Echarts的实战方案(大数据量加载、伪3D饼图、地图各省cp中心坐标属性、map3D材质)

ChatGPT工作提效系列文章目录 ChatGPT工作提效之初探路径独孤九剑遇强则强ChatGPT工作提效之在程序开发中的巧劲和指令(创建MySQL语句、PHP语句、Javascript用法、python的交互)ChatGPT工作提效之生成开发需求和报价单并转为Excel格式ChatGPT工作提效之小鹅通二次开发批量API对…

100天精通Python(可视化篇)——第93天:Pyecharts绘制多种炫酷饼图参数说明+代码实战(百分比、环形、玫瑰、内嵌、多个子图饼图)

文章目录 专栏导读1. 基础饼图add函数简单案例改变颜色 2. 百分比饼图3. 环形饼图4. 玫瑰饼图5. 内嵌环图6. 多个饼图书籍推荐&#xff08;包邮送书5本&#xff09; 专栏导读 &#x1f525;&#x1f525;本文已收录于《100天精通Python从入门到就业》&#xff1a;本专栏专门针…

李宏毅对ChatGPT的原理剖析—包括常见误解、背后的预训练和其所带来的研究问题...

一天前&#xff0c;李宏毅老师突然在youtube上更新里了三个关于【生成式AI】ChatGPT 原理剖析的视频和一个使用ChatGPT玩文字冒险游戏的视频&#xff0c;很有深度&#xff0c;所以我搬到了视频号上了&#xff0c;请大家享用~ 【生成式AI】ChatGPT 原理剖析 (1/3) — 對 ChatGPT…

分享一款全网最全的 AI 工具导航网站:未来百科

我们来让ChatGPT帮助我们写一篇短文来介绍这个强大的AI工具网站。鄙人才疏学浅&#xff0c;就不费口舌了。【欢迎转载】。 未来百科&#xff08;https://nav.6aiq.com&#xff09;是一个全面收录AI工具的导航网站&#xff0c;涵盖了多个领域和应用场景的优质AI产品。该网站旨在…

《花雕学AI》大揭秘:ChatGPT 如何让你的聊天机器人更智能、更有趣、更有用

你是否想过有一个可以和你聊天、陪你玩耍、帮你学习、给你创意的机器人&#xff1f;如果你的答案是肯定的&#xff0c;那么你一定会喜欢 ChatGPT。 ChatGPT 是一个基于 GPT-3 或者 GPT-4 技术的聊天机器人&#xff0c;可以与人类进行自然和流畅的对话。GPT-4 是目前最先进的自…

table表格转Excel

我定义的js文件为table.js 下面的html中引入 $(document).ready(function () {var base64 function (s) { return window.btoa(unescape(encodeURIComponent(s))) };var format function (s, c) {return s.replace(/{(\w)}/g,function (m, p) {return c[p];});};var uri &q…

怎么把图片转换成表格?分享三个简单方法给你

你们是否在工作的时候会遇到这样的情况&#xff1a;收到同事发来的一张表格图片&#xff0c;需要你进行汇总登记&#xff0c;通常这种时候&#xff0c;你们都会怎么做呢&#xff1f;是根据图片的内容&#xff0c;手动输入制作成一份表格吗&#xff1f;虽然这样子可以进行表格的…

想学习如何把excel图片转表格?1分钟教会你图片转表格怎么转

应该有不少小伙伴接收过上司或领导以图片格式发送过来的excel表格吧&#xff1f;并且还会要求我们将里面的内容整理为电子档&#xff0c;便于后期的内容编辑以及数据修改。 而当你们收到这种任务时&#xff0c;是怎么去操作的呢&#xff1f;是不是大部分人会选择手动重新制作&…

想知道图片转表格怎么转?简单实用的转换方法分享

最近收到了小伙伴的私信&#xff0c;上级让他把表格进行汇总归类&#xff0c;重新制作一份新的表格&#xff0c;但是上级发来的却是一张表格图片&#xff0c;这下子让他有点摸不着头脑。表格数据很多很杂&#xff0c;如果照着这些数据来制作表格的话&#xff0c;会非常麻烦。所…

图片转excel表格方法介绍,办工常备工具

图片怎么转换成excel表格&#xff1f;Excel表格作为一种文件格式早就被大家习以为常&#xff0c;我们经常会通过它来处理问题、汇报成果。有时候在网上查找资料时也会碰到表格形式的文件&#xff0c;整理起来还算方便&#xff0c;但如果是图片想整理成表格就会麻烦很多&#xf…

vCard通讯录(vcf文件)转excel表格的方法

vCard通讯录文件也是vcf文件&#xff0c;一般用来导出导入手机通讯录&#xff0c;vcf文件基本上手机都通用都支持的&#xff0c;很多人都是用这个格式来备份通讯录。但是vcf文件除了手机通讯录&#xff0c;在其他地方查看起来不太方便&#xff0c;这时候我们就想要把vcf转为exc…

有哪些图片转excel表格的软件?

在日常工作中&#xff0c;我们常常需要对一些表格进行分析和处理。有时候&#xff0c;这些表格可能以图片的形式存在&#xff0c;这时候我们就需要将图片中的表格内容提取出来并转换为Excel表格&#xff0c;以便进行后续的操作和分析。通过图片转Excel表格的方法&#xff0c;我…

怎么把图片里的表格转成电子版表格?说一个渠道

我们在日常学习办公时&#xff0c;经常遇到需要提取手头上或者同事发来图片中的表格的情况&#xff0c;手动录入费时费力。其实不用这么麻烦&#xff0c;现在市面上已经有很多识别软件可以快速帮助我们做到表格转换&#xff0c;下面就给大家推荐两种&#xff0c;一起来看看吧~ …

图片怎么免费转excel表格?说一种思路

Excel相信大家都使用过&#xff0c;它汇总归纳和展现数据可视性的能力十分强大。有时我们需要将图片中的数据转成Excel表格&#xff0c;有没有转换后和原图保持一致的办法呢&#xff1f;下面给大家分享三种转换工具&#xff0c;一起来看看吧。 一、借助Word将图片转成excel表格…

图片怎么转换到Excel表格?偷偷安利一个好用的方法

小伙伴们是否遇到过领导或同事需要你帮忙来做一个Excel文件呢&#xff1f;而且给到的参考数据还是图片的形式。如果我们根据图片重新创建一个Excel&#xff0c;那就要费时费力了。其实对于这种要求我们可以用一些工具来实现图片到Excel的转换。那么图片怎么转换到Excel表格呢&a…

如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署

文章目录 前言 - 浅谈 AIGCAIGC - 引领人工智能走向春天春天里盛开的 AI 绘画AI 绘画之Stable Diffusion 2.0 登场人人都有机会成为前沿的技术探索者 基于Amazon SageMaker进行Stable Diffusion 模型部署认识 Amazon SageMaker借助 Amazon SageMaker 进行环境搭建和模型推理1. …

数影周报:微星被索要2750万元巨额赎金,标贝科技获超亿元融资

本周看点&#xff1a;微星被索要2750万元巨额赎金&#xff1b;微软发布Windows 365 Frontline 服务&#xff1b;Shopify Functions将于2024年替代Shopify Scripts&#xff1b;标贝科技获超亿元B2轮融资...... 数据安全那些事 微星被索要2750万元巨额赎金 4月7日消息&#xff0c…