开箱即用的ChatGPT替代模型,还可训练自己数据

一、普遍关注是什么?

OpenAI 是第一个在该领域取得重大进展的公司,并且使围绕其服务构建抽象变得更加容易。然而,便利性带来了集中化、通过中介的成本、数据隐私和版权问题。

而数据主权和治理是这些新的LLM服务提供商如何处理商业秘密或敏感信息的首要问题,用户数据已被用于预训练以增强LLM模型能力。越来越多的人担心,大公司可能会为了既得利益而垄断此类模型,而这可能不符合你的最佳利益。

当 ChatGPT 最初推出时,这个问题是核心的中心讨论问题之一,并且仍然是。此外,对事实准确性、偏见、冒犯性反应和迷惑性的担忧,有时会困扰 ChatGPT,尽管这在版本 4 中已被最小化。虽然有问题,我相信利大于弊。

我们不能忽视 ChatGPT,LLM 之所以成为今天的样子,是因为像你我这样的用户间接提供了在各种论坛和渠道上共享的所有数据的集体智慧。

二、为什么要建立自己的模型?

我们可以将原因归结为完全的所有权和控制权。 鉴于此类语言模型的影响,必须很好地理解这些模型的构建方式、它们的功能以及如何改进它们。对于集中式服务,很难获取信息,但我们可以研究开源解决方案,了解它们是如何做到的。

熟悉可用的选项总是好的。下面的列表可以作为一个起点,看看它们是否是构建类似对话式聊天机器人(如 ChatGPT)的替代更便宜的方法。

三、开箱即用的模型,免费!

下面的一些模型可以在你的笔记本电脑上运行;你还可以选择通过 Google Colab 运行其中一些,它带有 51 GB RAM 选项。一般来说,如果目标不是与许多人的想法相反,那么训练开源模型的成本相对较低。

3.1 OpenChatKit

OpenChatKit使用经过 4300 万条指令训练的 200 亿参数聊天模型,支持推理、多轮对话、知识和生成答案。OpenChatkit 专为对话和指令而设计。通常,机器人擅长汇总和生成表格、分类和对话。

OpenChatKit 0.15 版是在 Apache-2.0 许可下发布的,该许可授予您对源代码、模型权重和训练数据集的完全访问权限,因为该计划是由社区驱动的。

OpenChatKit 开箱即用的一项值得注意的功能是用于实时更新答案的检索系统,允许聊天机器人将更新或定制的内容(例如来自维基百科、新闻提要或体育比分的信息)集成到其响应中。访问互联网是最近通过插件集成到 ChatGPT-4 中的一项功能,但它可以在旧的 GPT 模型上轻松完成。

体验地址:

https://huggingface.co/spaces/togethercomputer/OpenChatKit

我的评价:它虽然有类似GPT功能,能理解中文,但是回答全是英文。响应速度非常.
在这里插入图片描述

3.2 Vicuna

Vicuna 是一个开源聊天机器人,具有 13B 参数,通过微调 LLaMA 对从 ShareGPT.com 收集的用户对话数据进行训练,社区网站用户可以共享他们的 ChatGPT 对话。根据所做的评估,该模型具有超过 90% 的质量率,可与 OpenAI 的 ChatGPT 和谷歌的 Bard 相媲美,这使得该模型在与 ChatGPT 的功能对等方面成为顶级开源模型之一。它还能够编写在其他开源 LLM 聊天机器人中不太常见的代码,如下图所示。
在这里插入图片描述
根据公开信息,训练Vicuna-13B 的费用估计约为 300 美元。仓库地址:

https://github.com/lm-sys/FastChat

体验地址:

https://chat.lmsys.org/

在这里插入图片描述

3.3 Alpaca

Alpaca建立在 Meta 的 LLaMA 之上,其唯一目标是使 LLM 更便宜。基于斯坦福大学研究中心所做的先前研究和基准。羊驼模型可以低至 600 美元进行再训练,考虑到由此带来的好处,这很便宜。

它们也是另外两个羊驼变种模型Alpaca.cpp和Alpaca-LoRA。使用 cpp 变体,您可以使用具有 4GB 权重的 M2 Macbook Air 在笔记本电脑上本地运行类似 Fast ChatGPT 的模型,当今大多数笔记本电脑都应该能够处理。CPP 变体结合了 Facebook 的 LLaMA、Stanford Alpaca、alpaca-Lora 以及相应的权重。您可以在此处找到有关如何进行微调的数据。

体验地址:

https://huggingface.co/spaces/tloen/alpaca-lora

在这里插入图片描述

3.4 GPTall

GPT4all是一个社区驱动的项目,在大量精选的辅助交互书面文本集上进行训练,包括代码、故事、描述和多轮对话。该团队提供了数据集、模型权重、数据管理流程和训练代码来推广开源模型。还有一个量化的 4 位版本的模型可以在你的笔记本电脑上运行,因为所需的内存和计算能力更少.

仓库地址:

https://github.com/nomic-ai/gpt4all

体验地址(似乎不能用了,需要自己部署下):

https://huggingface.co/spaces/rishiraj/GPT4All

3.5 ChatRWKV

ChatRWKV是由 RWKV 驱动的开源聊天机器人,RWKV 是一种具有 Transformer 级 LLM 性能语言模型的 RNN。模型结果与 ChatGPT 的结果相当。该模型使用 RNN。模型的微调是使用 Stanford Alpaca 和其他数据集完成的。

仓库地址:

https://github.com/BlinkDL/ChatRWKV

体验地址:

https://huggingface.co/spaces/BlinkDL/ChatRWKV-gradio

在这里插入图片描述

3.6 BLOOM

BLOOM 是一个开源 LLMS,拥有超过 1760 亿个参数。相比之下,它与ChatGPT相当,能够处理46种语言和13种编程语言的任务。进入的障碍之一是它需要 350~ GB 的 RAM 才能运行。您可以在此处找到一个较轻的版本。

支持文字和图片!

BLOOM 的开发由 BigScience 协调,BigScience 是一个充满活力的开放研究合作组织,其使命是公开发布 LLM。可以通过GitHub 自述文件找到有关如何开始使用 Bloom 的更多详细信息。

仓库地址:

https://github.com/bigscience-workshop/bigscience/tree/master/train/tr11-176B-ml#readme

ipython:

https://github.com/aws/amazon-sagemaker-examples/blob/main/inference/nlp/realtime/llm/bloom_176b/djl_deepspeed_deploy.ipynb

体验地址:

https://huggingface.co/spaces/huggingface/bloom_demo

在这里插入图片描述

3.7 goppt4All

GPT4All Chat 是一个本地运行的人工智能聊天应用程序,由 GPT4All-J Apache 2 许可的聊天机器人提供支持。该模型在您的计算机 CPU 上运行,无需互联网连接即可工作,并且不会向外部服务器发送聊天数据(除非您选择使用您的聊天数据来改进未来的 GPT4All 模型)。它允许您与大型语言模型 (LLM) 进行通信,以获得有用的答案、见解和建议。GPT4All Chat 适用于 Windows、Linux 和 macOS。在您的本地计算机上运行,​​此模型不如那些 GPT 模型强大,可以通过将数据发送到功能强大的大型服务器来通过互联网与之聊天,并且不隶属于它们。

下载地址(我下载了一夜…)

https://gpt4all.io/index.html

仓库地址:

https://github.com/nomic-ai/gpt4all

总结

如果在上面的开源列表中注意到,有一个通用主题,LLM 模型的大多数变体要么源自 Meta AI 的 Llama 作为基础模型,要么源自 Bloom。如果有足够的文献可以帮助入门,那么创建自己的变体相对简单。

如果你想要自己训练,一定要预估好成本。我正在思考如何训练一个专业性的模型(虽然可能不会太好,但总想尽可能去尝试)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3350.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

玩转#ChatGPT之“用Chat GPT 做出行攻略”

到了五一假期,许多人要规划旅游行程,但却为此烦恼花费很多时间做功课。现在,您可以通过Chat GPT来安排旅游行程。只需告诉GPT您的日期和目的地,便能在30秒内生成不错的行程攻略。同时您还可以添加特定条件,例如前几天想…

Geoffrey Hinton获得时间检验奖;AI预测世界杯荷兰夺冠;Galactica不靠谱,ChatGPT又如何……...

这一周,AI业界又有哪些新鲜事? AI人物 Geoffrey Hinton:Forward-Forward新型神经网络更接近大脑运作 近日,深度学习之父、图灵奖得主 Geoffrey Hinton 在 NeurIPS 2022 会议上发表演讲。之所以获得组委会的邀约,主要在…

使用chatgpt一分钟帮你实现思维导图

前言 本篇基础篇课程,实操起来很简单,但却非常的实用。利用好这个功能,工作效率或能提升10倍! 本篇内容的主题:利用ChatGPT,一分钟帮你实现详尽的思维导图。 创作内容大纲 格式转化 结合Xmind 创作内容…

领导催我优化SQL语句,我求助了ChatGPT。这是ChatGPT给出的建议,你们觉得靠谱吗

作为一个程序员,无论在面试还是工作中,优化SQL都是绕不过去的难题。 为啥?工作之后才会明白,随着公司的业务量增多,SQL的执行效率对程系统运行效率的影响逐渐增大,相对于改造代码,优化SQL语句是…

用ChatGPT去面试简直开挂

引语:大家好我们是权知星球,开启你独特的知识星际之旅 请注意!这个男人正在进行一场新员工面试。然而,他并不知晓,与他面对面坐着的那个人所作出的回答,全都是由人工智能所生成的! 面试官提出问…

EditText 实时显示输入的字数与最大输入限制长度

废话不多说了,带来一个简单的EditText,满足一般的需求。 c editText.addTextChangedListener(new TextWatcher() {//记录输入的文字private CharSequence wordNum;private int selectionStart;private int selectionEnd;Overridepublic void beforeTextC…

QQ日志最多添加几条HTML,信息字数超出限制 qq对话框里显示字数超出限制怎么办...

短信息有字数限制的,发送一条短信最多七十个字。 用户每次能接收和发送短信的字符数,是160个英文或数字字符,或者70个中文字符。 其实你每次发短信都是发到了SIM卡运营商那里,而后是有运营商转发给你要发送的人。 QQ信息显示超出字…

textarea 输入字数限制,并显示可输入字符

效果 相关HTML <html><head><title>测试</title><meta charset"utf-8"><script type"text/javascript" src"http://code.jquery.com/jquery-latest.js"></script> <script type"text/javasc…

EditText字数限制

参考&#xff1a;http://mingkg21.iteye.com/blog/480963 EditText可以在XML和代码中设置字数限制。。 在XML中&#xff1a; Xml代码 android:maxLength“50” 代码中&#xff1a; Java代码 editText.setFilters(new InputFilter[]{new InputFilter.LengthFilter(100)});…

EditText限制输入的字符数并弹出Toast提示字数已达上限

大家对EditText这个控件并不陌生&#xff0c;它是一个可供我们输入文本内容的输入框。前些日子需要实现这样一个需求&#xff1a;限制EditText中可以输入的最大字符数为6&#xff0c;达到6时&#xff0c;用户每按一次软键盘就弹出一个Toast提示用户&#xff0c;并且无法再输入内…

关于微信小程序textarea组件 输入字数 > 限制字数 的bug

bug形成条件&#xff1a;如下图&#xff0c;当你需要给textarea组件添加一个统计输入字数的功能时&#xff0c;如果在手机上通过复制粘贴达到最大限制字数&#xff0c;这时候继续使用手机上的小键盘输入内容&#xff0c;就会出现输入字数大于限制字数的bug&#xff0c;而多出来…

GPT4限制被破解!ChatGPT实现超长文本处理的新方法

目录 前言 使用chat-gpt过程中有哪些痛点 1.无法理解人类情感和主观性 2.上下文丢失 3.约定被打断 那如何去解决这个痛点 Transformer&#xff08;RMT&#xff09;怎么去实现的 1.Transformer 模型 2.RMT模型 3.计算推理速率 4.渐进学习能力 总结 写到最后 大家好…

微信小程序-textarea字数统计与限制

第一步&#xff1a;参考官方文档《textarea小程序》 textarea多行输入框。该组件是原生组件&#xff0c;使用时请注意相关限制。 用到的属性&#xff1a; 属性说明maxlength最大输入长度&#xff0c;设置为 -1 的时候不限制最大长度minlength最小输入长度bindinput当键盘输入…

写代码调 Bug,OpenAI 发布最强 AI 对话系统 ChatGPT!

整理 | 苏宓 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; GPT-3 发布的两年后&#xff0c;我们没等来它的亲弟弟 GPT-4&#xff0c;而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT&#xff0c;也可以称之为是 GPT-3 家族里面的亲戚&a…

AI无法打败AI!ChatGPT检测器频繁冤枉无辜学生,竟有210万教师在用

【导读】被AI冤枉的你&#xff0c;还好吗&#xff1f; 当你被AI无辜扣上「作弊」的帽子&#xff0c;作何感想&#xff1f; 这件事恰恰发生在了一位高三学生Lucy Goetz身上。原本她写的一篇社会主义原创论文得了最高分。 但是&#xff0c;Turnitin公司的AI写作检测器竟说&…

如何在本地电脑上搭建AI人工智能绘画工具Stable Diffusion

目录 概述 操作环境 操作步骤 步骤一&#xff1a;安装Python。 步骤二&#xff1a;安装Git。 步骤三&#xff1a;使用git安装stable-diffusion-webui。 步骤四&#xff1a;下载面部重建插件GFPGAN。 步骤五&#xff1a;配置并运行webui-user.bat文件来自动安装所需文件。 步骤五…

AI能否识别出AI生成的内容?AI(ChatGPT)自己怎么说

关注了几天ChatGPT、New Bing等&#xff0c;我意识到将来我们所看的内容&#xff0c;必然有越来越高的比例都是AI生成的&#xff0c;而我们几乎无力分辨&#xff0c;但我有时候还是想分辨的&#xff0c;于是&#xff0c;我对如题的问题就特别好奇。 PS&#xff1a;已经有专注于…

让AI生成AI绘画提示词,OpenAI最新成果ChatGPT被网友玩坏了!还会写代码修bug作诗...

羿阁 发自 凹非寺量子位 | 公众号 QbitAI 一款新的聊天AI被网友们玩疯了。 能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住&#xff0c;它就是OpenAI刚刚推出的——ChatGPT。 有脑洞大开的网友甚至用它来设计游戏&#xff1a;先用ChatG…

关于AI和ChatGPT的使用,AI编程(AIGC),AI绘画(2)

AI绘画技术是指利用人工智能技术来创作、生成或修改图像、照片、插图、漫画等艺术品以及各种视觉效果。常见的AI绘画技术包括机器学习、深度学习和计算机视觉等领域的技术&#xff0c;通过训练神经网络模型来实现自动化地生成图像&#xff0c;其应用范围相当广泛&#xff0c;包…

ChatGPT到底有多厉害?看完你就知道了

hatGPT发布五天&#xff0c;有超过100万玩家&#xff0c;这是 Facebook花10个月才达到的里程碑&#xff0c;三个月1亿用户&#xff0c;这是Twitter花9个月创下的记录。 ChatGPT可以跟人做多轮聊天&#xff0c;能理解人&#xff0c;很可能通过图灵测试&#xff0c;他跟能创造新内…