笔记本就能运行的ChatGPT平替来了,附完整版技术报告(附github代码)

关注并星标

从此不迷路

计算机视觉研究院

777f1d84104e8db44de36a4964e1ebea.gif

a02f3746aec034c9ef3920621948999a.gif

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

GPT4All 是基于大量干净的助手数据(包括代码、故事和对话)训练而成的聊天机器人,数据包括~800k 条 GPT-3.5-Turbo 生成数据,基于 LLaMa 完成,M1 Mac、Windows 等环境都能运行。或许就像它的名字所暗示的那样,人人都能用上个人 GPT 的时代已经来了。

转自《机器之心》

自从 OpenAI 发布 ChatGPT 后,最近几个月聊天机器人热度不减。

虽然 ChatGPT 功能强大,但 OpenAI 几乎不可能将其开源。不少人都在做开源方面的努力,比如前段时间 Meta 开源的 LLaMA。其是一系列模型的总称,参数量从 70 亿到 650 亿不等,其中,130 亿参数的 LLaMA 模型「在大多数基准上」可以胜过参数量达 1750 亿的 GPT-3。

LLaMA 的开源可是利好众多研究者,比如斯坦福在 LLaMA 的基础上加入指令微调(instruct tuning),训练了一个名为 Alpaca(羊驼)的 70 亿参数新模型(基于 LLaMA 7B)。结果显示,只有 7B 参数的轻量级模型 Alpaca 性能可媲美 GPT-3.5 这样的超大规模语言模型。

又比如,我们接下来要介绍的这个模型 GPT4All,也是一种基于 LLaMA 的新型 7B 语言模型。项目上线两天,Star 量已经突破 7.8k。

65458eac0e9d96e2e3d7cc50ffd1c5e9.png

项目地址:https://github.com/nomic-ai/gpt4all

简单来讲,GPT4All 在 GPT-3.5-Turbo 的 800k 条数据上进行训练,包括文字问题、故事描述、多轮对话和代码。

根据项目显示,M1 Mac、Windows 等环境都能运行。

1688468c59993972b5c327e6e4218342.png

我们先来看看效果。如下图所示,用户可以和 GPT4All 进行无障碍交流,比如询问该模型:「我可以在笔记本上运行大型语言模型吗?」GPT4All 回答是:「是的,你可以使用笔记本来训练和测试神经网络或其他自然语言(如英语或中文)的机器学习模型。重要的是,你需要足够可用的内存 (RAM) 来适应这些模型的大小……」

接下来,如果你不清楚到底需要多少内存,你还可以继续询问 GPT4All,然后它给出回答。从结果来看,GPT4All 进行多轮对话的能力还是很强的。 

7c2cebefcec6c6082f475e91c463f2cc.gif在 M1 Mac 上的实时采样

有人将这项研究称为「改变游戏规则,有了 GPT4All 的加持,现在在 MacBook 上本地就能运行 GPT。」

007c0c58406b1ea17a05de3a1663f2f7.png

与 GPT-4 相似的是,GPT4All 也提供了一份「技术报告」。

2d8a7a5f575388ff3448a6445a42fbcc.png

技术报告地址:https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf

这份初步的技术报告简要描述了 GPT4All 的搭建细节。研究者公开了收集的数据、数据整理程序、训练代码和最终的模型权重,以促进开放研究和可重复性,此外还发布了模型的量化 4 位(quantized 4-bit)版本,这意味着几乎任何人都可以在 CPU 上运行该模型。

接下来,让我们看看这份报告中写了什么。

GPT4All 技术报告

1、数据收集和整理

在 2023 年 3 月 20 日至 2023 年 3 月 26 日期间,研究者使用 GPT-3.5-Turbo OpenAI API 收集了大约 100 万对 prompt 回答。

首先,研究者通过利用三个公开可用的数据集来收集不同的问题 /prompt 样本:

  • LAION OIG 的统一 chip2 子集

  • Stackoverflow Questions 的一个随机子样本集 Coding questions

  • Bigscience/P3 子样本集进行指令调优

参考斯坦福大学 Alpaca 项目 (Taori et al., 2023),研究者对数据准备和整理给予了大量关注。在收集了最初的 prompt 生成对的数据集后,他们将数据加载到 Atlas 进行整理和清理,删除了所有 GPT-3.5-Turbo 未能响应 prompt 并产生畸形输出的样本。这使得样本总数减少到 806199 个高质量的 prompt - 生成对。接下来,研究者从最终的训练数据集中删除了整个 Bigscience/P3 子集,因为它的输出多样性非常低。P3 包含许多同质化的 prompt,这些 prompt 从 GPT-3.5-Turbo 中产生了简短而同质化的反应。

这种排除法产生了一个包含 437,605 个 prompt - 生成对的最终子集,如图 2 所示。

fccffd4344c81658570d4d3340c18c15.png

模型训练

研究者在 LLaMA 7B (Touvron et al., 2023) 的一个实例中将几个模型进行微调。他们最初的公开版本相关的模型是用 LoRA (Hu et al., 2021) 在 437605 个后处理的例子上以 4 个 epoch 训练的。详细的模型超参数和训练代码可以在相关的资源库和模型训练日志中找到。

可重复性

研究者发布了所有的数据(包括未使用的 P3 generations)、训练代码和模型权重,供社区进行复现。感兴趣的研究者可以在 Git 存储库中找到最新的数据、训练细节和检查点。

成本

研究者大概用了四天的时间制作这些模型,GPU 成本为 800 美元(从 Lambda 实验室和 Paperspace 租的,其中包括几次失败的训练),此外还有 500 美元的 OpenAI API 费用。

最终发布的模型 gpt4all-lora 可以在 Lambda 实验室的 DGX A100 8x 80GB 上用大约 8 小时训练完成,总成本为 100 美元。

这个模型可以在普通笔记本上运行,真就像网友说的「除了电费之外,没有任何成本。」

aac134be781a17046f84e353d7c2917e.png

评估

研究者使用 SelfInstruct 论文 (Wang et al., 2022) 中的人类评估数据对该模型进行了初步评估。报告还对比了该模型与已知最好的公开的 alpaca-lora 模型(该模型由 huggingface 的用户 chainyo 提供)的 ground truth 困惑度。他们发现,所有的模型在少数任务上都有非常大的困惑度,并且报告的困惑度最大为 100。与 Alpaca 相比,在这个收集的数据集上进行微调的模型在 Self-Instruct 评估中表现出了更低的困惑度。研究者表示,这个评估不是详尽的,仍存在进一步的评估空间 —— 他们欢迎读者在本地 CPU 上运行该模型(文件见 Github),并对它的能力有一个定性的认识。

最后,需要注意的是,作者公布了数据和训练细节,希望它能加速开放的 LLM 研究,特别是在对齐和可解释性领域。GPT4All 模型的权重和数据仅用于研究目的,并获得许可,禁止任何商业使用。GPT4All 是基于 LLaMA 的,LLaMA 具有非商业许可。助理数据是从 OpenAI 的 GPT-3.5-Turbo 收集的,其使用条款禁止开发与 OpenAI 进行商业竞争的模型。

© The Ending

转载请联系本公众号获得授权

fe525122d7eac3f646ab4b3f379e65e4.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

761920d018e1ab85114c1726fde77abf.jpeg

扫码关注

计算机视觉研究院

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

 往期推荐 

🔗

  • 改进的YOLO:AF-FPN替换金字塔模块提升目标检测精度

  • FastestDet:比yolov5更快!更强!全新设计的超实时Anchor-free目标检测算法(附源代码下载)

  • 用于吸烟行为检测的可解释特征学习框架(附论文下载)

  • 图像自适应YOLO:恶劣天气下的目标检测(附源代码)

  • 新冠状病毒自动口罩检测:方法的比较分析(附源代码)

  • NÜWA:女娲算法,多模态预训练模型,大杀四方!(附源代码下载)

  • 实用教程详解:模型部署,用DNN模块部署YOLOv5目标检测(附源代码)

  • LCCL网络:相互指导博弈来提升目标检测精度(附源代码)

  • Poly-YOLO:更快,更精确的检测(主要解决Yolov3两大问题,附源代码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35264.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源的短视频生成和编辑工具 Open Chat Video Editor

GitHub - SCUTlihaoyu/open-chat-video-editor: Open source short video automatic generation tool

Android 实现图文混排

Android 实现图文混排 需求: 在文字中间添加图片或者在文字后面添加图片;文字换行后,图片在第二行的后面;图片加点击事件,文字没有点击事件。 实现方案: 使用TextView Imageview实现,第1点…

IDEA2020 安装教程,图文教程

1、下载IDEA 首先在官网下载IDEA,官网下载地址为:IDEA下载地址 我这里选择的是Ultimate版本 IDEA各版本的区别: Community 社区版,免费,但是功能有限制,Android Studio就是基于这个版本定制的。 Ultimate …

手机剪映app图文成片功能怎么用

剪映作为一款简易的剪辑工具。很多小伙伴都在使用。近期软件更是为了让大家方便剪辑推出了图文成片功能。想知道怎么使用吗?那就千万不要错过本期内容哦~ 剪映新功能图文成片介绍 通过该功能。用户们只要输入一段文字。软件就能智能为大家匹配图片素材、添加字幕、…

剪映AI图文成片快速剪辑

NO.1点击图文成片 剪映AI,你可以拿头条和悟空问答的文章链接过来,它就能识别文字,生成视频。当然你也可以自创文案,然后生成视频,字幕都给你加好了。AI的剪辑点还是舒服的,自己只需要替换素材。

iTab浏览器插件安装教程

iTab浏览器插件 iTab是一个好看好用的自定义卡片式浏览器新标签页扩展。 安装iTab标签页扩展后,您将告别呆板无趣的原生标签页,享受iTab标签页为您带来的个性化新体验: 离线资源下载: iTab资源 安装教程 IE 浏览器 1.打开浏览器 点击 右上…

朋友四面阿里Java岗的详细流程和面试问题。

最近一个朋友跟我说,现在面试太难了,再也不是以前那种随便背几个面试题然后就能拿到offer的时候了。最近准备换工作面试了阿里,和我交流了下他遇到的一些面试题,然后我整理了一下,就分享给有需要的朋友们顺便也查漏补缺…

腾讯,百度,阿里的面试经验

小白看了此同仁的面试经久久不能平复,感叹自己菜鸟的同时,痛恶自己对于时间的浪费,大学时期的小白真的很潇洒,工作到现在的小白也是偷得浮生半日闲的小潇洒,想练就下面的同仁的水平,小白不吃不喝还需要2年&…

参加春招的小tips!字节/腾讯/华为/美团/shopee/阿里 服务端开发面经

前言 写在最前面:目前接了字节的offer,校招想来字节的可以私信我 以下面经均是以时间线排列,最好每次面试完都自我总结一下 有些问题比较少的或者没列出来的基本都是在聊项目 腾讯一面(未知部门) mysql varchar和charchar是固定长&#x…

【阿里三面】好险!本以为是场普通的阿里面试,没想到二面就迎来了P9大佬

前言 阿里,我是在BOSS上投的简历,之前也投过一次,简历都没通过筛选,后来让前辈帮我改了一下简历,重新投另一个部门,获得了面试机会。5月15日,中午HR打电话过来预约了下午4点半面试,…

听GPT 讲K8s源代码--pkg(四)

/pkg/controlplane、/pkg/credentialprovider、/pkg/kubeapiserver是Kubernetes中的三个核心包,它们分别实现了不同的功能。 /pkg/controlplane包 /pkg/controlplane是Kubernetes的一个包,它包含了控制平面组件的实现,例如API Server、Contro…

系统安全实验(伪造IP,输出重定向获取flag)

1.伪造ip https://blog.csdn.net/wu_tongtong/article/details/124630153学姐赛高 题目描述 这道题目主要考查的是如何伪造HTTP请求头中的IP信息,这里我们推荐使用firefox自带的simple-modify-headers插件来伪造IP;当然你也可以选择使用其他工具来伪造HTTP请求头中的…

制作游戏辅助/外挂违法吗?

不知道你们有没有过一个体验: 玩《绝地求生》的时候,我们辛辛苦苦开着车在跑毒,旁边“咻”的一下突然蹭上来一个人,徒步跑得竟然比车快? 然后吧他还跑到你旁边开麦问:“嘿!兄弟!挂…

【直播预告】我写的代码犯法吗?公益的 IT 人法律科普在线直播活动来袭!

我写的代码犯法吗?公益的 IT 人法律科普在线直播活动来袭! image-20201212183656959 虽然我们这些 it 搬砖人只是敲敲键盘,搬点砖,但是很有可能你吃完泡面后开开心心地在 4K 显示器面前敲着新买的机械键盘时,警察叔叔就…

用假名印名片犯法吗_用简单的javascript学习假名

用假名印名片犯法吗 Learn Hiragana and Katakana charaters with some help from plain old JavaScript. 在普通的旧JavaScript的帮助下学习平假名和片假名角色。 We are making a single html page that will display a random Kana — a random Hiragana and its Katakana …

nft在国内到底合法吗

大家都比较关注这个问题接下来我就跟大家一起聊一聊 国内允许对虚拟硬币的投机和交易以及采矿进行打击,但也鼓励和支持区块链技术的发展,包括不涉及虚拟硬币投机的NFT。 对大多数人来说,NFT这个词让每个人既陌生又有些熟悉。陌生感是因为日常…

Python版实现12306抢票功能,真的能帮你抢到春运回家的票吗?

背景 每逢佳节倍思亲,年关将近,思乡的情绪是不是愈发强烈了,筒子们是不是又要准备开始抢票了,还是在找黄牛吗?但是,今年在考虑是否能抢到票以外,还需要考虑是否能回得去,没错&#…

python爬虫音乐犯法么_Python爬虫实战之爬取QQ音乐数据!QQ音乐限制太多了

def open_url(url): pass def find_attribute(url): pass def main: pass 复制网页链接 复制网页链接将链接用列表进行保存下来。如果想要同一时间获取多个网页里面的数据,自行书写for循环遍历列表即可。以下只以一个网页进行讲解。 def main: # 用列表进行存储网页链接 url =…

Python爬虫 | 写在系列博客的第一篇,爬虫到底犯法吗?看完再开始爬虫!!!

一、 什么样的爬虫是非法的? 爬虫不能涉及个人隐私! 如果爬虫程序采集到公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息,并将之用于非法途径的,则肯定构成非法获取公民个人信息的违…

学习ChatGPT,AI绘画引入人类反馈会怎样?

来源:机器之心 本文约2400字,建议阅读5分钟本文介绍了研究人员在文本到图像模型中引入人类反馈。 NLP 领域使用的技术不断地向其他领域扩展,如 CV 和多模态,鸿沟正在被打破。本文中谷歌研究院和加州伯克利的研究人员在文本到图像模…