GPT4All 一个开源 ChatGPT

ChatGPT 正在迅速发展与传播,新的大型语言模型 (LLM) 正在以越来越快的速度开发。就在过去几个月,有了颠覆性的 ChatGPT 和现在的 GPT-4。明确定义,GPT 代表(Generative Pre-trained Transformer),是底层语言模型,而 ChatGPT是为会话设计的具体实现。比尔·盖茨 (Bill Gates) 回顾 OpenAI 的工作时说,“人工智能时代已经开始”。如果感到难以跟上快速变化的步伐,那么并不孤单。就在刚才,超过 1000 名研究人员签署了一份请愿书,要求在未来六个月内暂停训练比 GPT-4 更强大的 AI 系统。

尽管技术成就显着,但它们仍然是闭门造车。尽管它的名字,OpenAI 长期以来一直受到一些人的批评,因为它没有发布他们的模型,甚至被一些人称为 ClosedAI。研究人员和爱好者都在努力寻找开源替代品。

如果错过了最近的发展,应该看看 Meta 的 LLaMA ( GitHub ),它应该优于 GPT-3。它是在 GNU 许可下获得许可的,虽然它不是严格开源的,但可以在注册后获得权重。这种开放显然是为了 LLaMA 的利益,社区很快就继续开发它。它很快以 llama.cpp 的形式移植到 C/C++,斯坦福大学的研究人员将其扩展到一个指令跟随模型,例如 ChatGPT,并将其命名为 Alpaca。还有 GPT4All,这篇博文是关于它的。

首先,来反思一下社区在短时间内开发开放版本的速度有多快。为了了解这些技术的变革性,下面是各个 GitHub 仓库的 GitHub 星数。作为参考,流行的 PyTorch 框架在六年内收集了大约 65,000 颗星。下面的图表是大约一个月。

GPT4All

但现在,来更深入地介绍 GPT4All。这是 Nomic AI 的助手式聊天机器人,刚刚公开发布。

如何基于现有的语言模型(如 LLaMA)创建类似 ChatGPT 的助手式聊天机器人?答案可能会大吃一惊:与聊天机器人互动并尝试了解它的行为。就 gpt4all 而言,这意味着从公开可用的数据源收集各种问题和提示样本,然后将它们交给 ChatGPT(更具体地说是 GPT-3.5-Turbo)以生成 806,199 个高质量的提示生成对。接下来,整理数据并删除低多样性响应,并确保数据涵盖广泛的主题。训练数据后,发现他们的模型比同类产品表现更好。

对我来说,其中一个主要吸引力在于作者发布了模型的量化 4 位版本。这是什么意思?实际上,在模型中以降低的精度而不是全精度执行某些操作,因此可以拥有更紧凑的模型。虽然像 ChatGPT 这样的模型在 Nvidia 的 A100 等专用硬件上运行,这是一款配备高达 80 GB RAM 的硬件怪兽,价格为 15,000 美元,但对于 GPT4All,意味着可以在消费级硬件上执行该模型。

设置

运行 GPT4All 的说明很简单,只要安装了正在运行的 Python,按照 GitHub 存储库上的设置说明进行操作即可。

  • 下载量化检查点(请参阅自己尝试),大概是 4.2 Gb 的大小,完全下载需要一定的时间
  • 克隆环境
  • 将检查点复制到 chat
  • 设置环境并安装请求
  • 运行

在 M1 MacBook Pro 上对此进行了测试,这意味着只需导航到 chat- 文件夹并执行 ./gpt4all-lora-quantized-OSX-m1

设置一切应该需要几分钟,下载是最慢的部分,结果是实时返回的。

结果

现在,准备运行的 GPT4All 量化模型在基准测试时表现如何?虽然有详尽的基准测试集,但以下是可以预期的一些快速见解:

虽然有一些明显的错误(NLP -> NLU),但实际上对输出感到非常惊讶。

可以尝试一些更有创意的东西,比如诗歌:

发现这确实非常有用,同样,考虑到这是在 MacBook Pro 笔记本电脑上运行的。虽然它可能不在 GPT-3.5 甚至 GPT-4 级别,但它肯定有一些魔力。

注意事项

使用 GPT4All 时,请牢记作者的使用注意事项:

GPT4All 模型重量和数据仅用于研究目的并获得许可,禁止任何商业用途。GPT4All 基于 LLaMA,具有非商业许可。辅助数据是从 OpenAI 的 GPT-3.5-Turbo 收集的,其使用条款禁止开发与 OpenAI 进行商业竞争的模型。

此外,请注意 ChatGPT 具有多项安全功能。

总结

开源项目和社区努力在实施技术和加速创意方面非常强大。GPT4All 就是一个显着的体现。从根本上说,这为闭源模型的业务方面提供了一个有趣的视角。如果提供 AI 作为服务,那么需要多长时间才能让爱好者对 AI 进行足够长的探索以能够模仿它?对于 GPT4All 的案例,论文中有一个有趣的注释:花了四天的时间,GPU 成本 800 美元,OpenAI API 调用 500 美元,这具有足够的吸引力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7356.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PrivateGPT(如何部署及使用感受)

前言 最近在GitHub上出现了一个名为PrivateGPT的开源项目。该项目旨在为面临敏感数据、涉密信息或个人隐私问题的用户提供一种新的聊天工具。PrivateGPT具备完整的数据控制能力,使用户能够在本地环境中与强大的语言模型进行交互,无需上传数据到互联网或…

LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

前言 近期,除了研究ChatGPT背后的各种技术细节 不断看论文(至少100篇,100篇目录见此:ChatGPT相关技术必读论文100篇),还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调…

M1 Macbook Pro编译vim插件YouCompleteMe指南

M1 Macbook Pro编译vim插件YouCompleteMe指南(亲测有效!) 1.前言 (系统Monterey 12.6.5) 之前一直按照网上的教程,通过执行python3 install.py 加–clang-completer或–all等后缀来编译,但最后都失败了。后来发现是python的版本…

《微SaaS创富周刊》第3期:GPT-3\ChatGPT、Stable Diffusion等AI模型驱动的微SaaS创意盘点

大家新年好!第3期《微SaaS创富周刊》问世啦!本周刊面向独立开发者、早期创业团队,报道他们主要的产品形态——微SaaS如何变现的最新资讯和经验分享等。所谓微SaaS,就是“针对利基市场的SaaS”,特点是一般由个人或者小团…

chatgpt赋能python:Python如何在MacBook上打开shell窗口

Python如何在MacBook上打开shell窗口 作为一名有10年Python编程经验的工程师,我认为了解基本的命令行工具是非常重要的。在MacBook上,您可以使用终端打开shell窗口,执行Python代码并运行脚本。 这篇文章将介绍如何打开shell窗口,…

和ChatGPT-4聊完后,我觉得一切可能已经来不及了

了然无味,晴空万里!和ChatGPT-4开始了一场坦诚的沟通,它全程都表现出高情商,以及不断尽量安抚我的情绪,而这,恰恰令我脊背发凉。 部分文字截取 ZM:我能不能理解每次对话就是一次你的“生命” G&…

目录导航《100天精通Python丨快速入门到黑科技》

文章目录 一、100 天精通 Python 丨基础知识篇基础知识篇 —— 01、C 站最全 Python 标准库总结基础知识篇 —— 02、Python 和 Pycharm(语言特点、学习方法、工具安装)基础知识篇 —— 03、Pycharm 快捷操作和配置指南(磨刀不误砍柴工&#…

Autogpt手把手安装配置与使用超详细,使用云托管平台,轻量不会污染本地环境,10分钟带你完成傻瓜式超简单安装!!!

文章目录 AutoGPT简介一、安装流程fork项目注册登录gitpod.io平台开始配置 二、Auto-gpt的使用测试1.初始化使用重要参数讲解及扩展正确的使用Auto-GPT演示启动Auto-gpt 注意事项 总结 本文将采用超详细的步骤,即使小白也可以配置使用。 记录一下中间踩过的坑&#…

ChatGPT 速通手册——文本生成及概要提取,让 ChatGPT 自动总结中心大意

文本生成 文本生成任务,是大语言模型最基础的功能,自然也是 ChatGPT 的最基础功能。我们从这里开始,尝试第一个独立的 ChatGPT 对话。再强调一次:ChatGPT 生成的结果有随机性,每次运行未必一样。因此,本书…

百度版ChatGPT:文心一言发布会盛大召开!

今天下午2点,万众期待的百度版ChatGPT:文心一言发布会召开了。(图一) 投资者对这个发布会的反应非常直接:股价当场断崖式下跌。(图二) 和ChatGPT发布会上现场功能演示不同,百度发布会…

手把手教你本地CPU环境部署清华大模型ChatGLM-6B,利用量化模型,本地即可开始智能聊天,达到ChatGPT的80%

大家好,我是微学AI,今天教你们本地CPU环境部署清华大ChatGLM-6B模型,利用量化模型,每个人都能跑动大模型。ChatGLM-6B是一款出色的中英双语对话模型,拥有超过62亿个参数,可高效地处理日常对话场景。与GLM-1…

我也尝试了下chatGPT,效果惊艳

我也尝试了下chatGPT,效果惊艳,2023会是人工智能的元年。能根据上下文进行对话,能写作文改进作文、写代码改BUG、做题目改作业。 写作文 让它以熬夜为主题写篇100字的作文,开始时只是一段很普通的流水。让它继续改进&#xff0c…

ChatGPT 引领的 AI 革命爆发了,一起上车吧!

文章目录 1. AI 革命爆发了2. 回顾 AI 历史3. 什么是 ChatGPT?4. 为什么你应该学习 AI ?5. 我们该如何学习 AI5.1 第一点是你要多尝试运行代码和修改代码。5.2 第二点是你要多去体验各类 AI 的应用5.3 第三点做头脑风暴,创造有趣新产品 6. 我…

ChatGPT的“N宗罪”?|AI百态(上篇)

AI诞生伊始,那是人人欣喜若狂的科技曙光,深埋于哲学、想象和虚构中的古老的梦,终于成真,一个个肉眼可见的智能机器人,在复刻、模仿和服务着他们的造物主——人类。 但科技树的点亮,总会遇到一些经典的迷思…

chatGPT怎么用?AI提示词工程师是什么

近几个月来,人工智能(AI)热度空前,甚至催生了一个新职业——AI提示词工程师(PromptEngineer)。 这一职业最早出现在美国求职网站Indeed上,Anthropic这家AI初创公司在其招聘信息中明确提到“AI提…

生物科学大模型调研

生物大模型竞品调研 1 概念分类 大模型:大模型通常指的是参数量较大、层数较深的机器学习模型,例如深度神经网络。这些模型具有大量的可训练参数,通过在大规模数据集上进行训练,能够更好地捕捉数据中的复杂模式和特征。大模型在各…

ChatGPT鲁棒性分析:对抗鲁棒与分布外泛化视角

©作者 | 胡曦煦 单位 | 香港城市大学 研究方向 | 领域自适应,领域泛化 众所周知,最近聊天机器人 ChatGPT 吸引了所有人的注意力,一方面人们想要在国内复刻相同的成功,另一方面也有人焦虑于研究范式的转变,担忧现在…

王兴将出任王慧文创业公司董事/ 谷歌多年来故意推迟发布类ChatGPT/ 飞书回应齐俊元并未负责日本业务...今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 家人们早上好,今天是3月9日,疯狂星期四。 快来和日报君一起来品尝今日份的“科技早餐”吧~ 美团王兴入局中国版OpenAI创业 美团创始人王兴的一条朋友圈火了。 内容的核心爆点,归结为一句话就是——…

ChatGPT中文LLM与医疗领域相结合的开源资源汇总

文章目录 前言DoctorGLMBenTsaoBianQueHuatuoGPTMed-ChatGLMQiZhenGPTChatMedXrayGLMMeChatMedicalGPTSunsimiaoShenNong-TCM-LLMSoulChat 总结 基于开源ChatGPT大模型构建自己的知识库系统 前言 自ChatGPT为代表的大语言模型(Large Language Model, LLM&#xff0…

人工智能历史上的重要一步:ChatGPT影响到谷歌地位?

AI神器ChatGPT 火了。 能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是OpenAI刚刚推出的——ChatGPT。 有脑洞大开的网友甚至用它来设计游戏:先用ChatGPT生成游戏设定,再用Midjourney出图&am…