开箱即用的ChatGPT替代模型,还可训练自己数据(转)

开箱即用的ChatGPT替代模型,还可训练自己数据

川川菜鸟

于 2023-04-23 12:02:42 发布

2063
 收藏 43
分类专栏: ChatGPT 文章标签: chatgpt 人工智能 原力计划
版权

ChatGPT
专栏收录该内容
7 篇文章7 订阅
订阅专栏
一、普遍关注是什么?
OpenAI 是第一个在该领域取得重大进展的公司,并且使围绕其服务构建抽象变得更加容易。然而,便利性带来了集中化、通过中介的成本、数据隐私和版权问题。

而数据主权和治理是这些新的LLM服务提供商如何处理商业秘密或敏感信息的首要问题,用户数据已被用于预训练以增强LLM模型能力。越来越多的人担心,大公司可能会为了既得利益而垄断此类模型,而这可能不符合你的最佳利益。

当 ChatGPT 最初推出时,这个问题是核心的中心讨论问题之一,并且仍然是。此外,对事实准确性、偏见、冒犯性反应和迷惑性的担忧,有时会困扰 ChatGPT,尽管这在版本 4 中已被最小化。虽然有问题,我相信利大于弊。

我们不能忽视 ChatGPT,LLM 之所以成为今天的样子,是因为像你我这样的用户间接提供了在各种论坛和渠道上共享的所有数据的集体智慧。

二、为什么要建立自己的模型?
我们可以将原因归结为完全的所有权和控制权。 鉴于此类语言模型的影响,必须很好地理解这些模型的构建方式、它们的功能以及如何改进它们。对于集中式服务,很难获取信息,但我们可以研究开源解决方案,了解它们是如何做到的。

熟悉可用的选项总是好的。下面的列表可以作为一个起点,看看它们是否是构建类似对话式聊天机器人(如 ChatGPT)的替代更便宜的方法。

三、开箱即用的模型,免费!
下面的一些模型可以在你的笔记本电脑上运行;你还可以选择通过 Google Colab 运行其中一些,它带有 51 GB RAM 选项。一般来说,如果目标不是与许多人的想法相反,那么训练开源模型的成本相对较低。

3.1 OpenChatKit
OpenChatKit使用经过 4300 万条指令训练的 200 亿参数聊天模型,支持推理、多轮对话、知识和生成答案。OpenChatkit 专为对话和指令而设计。通常,机器人擅长汇总和生成表格、分类和对话。

OpenChatKit 0.15 版是在 Apache-2.0 许可下发布的,该许可授予您对源代码、模型权重和训练数据集的完全访问权限,因为该计划是由社区驱动的。

OpenChatKit 开箱即用的一项值得注意的功能是用于实时更新答案的检索系统,允许聊天机器人将更新或定制的内容(例如来自维基百科、新闻提要或体育比分的信息)集成到其响应中。访问互联网是最近通过插件集成到 ChatGPT-4 中的一项功能,但它可以在旧的 GPT 模型上轻松完成。

体验地址:

https://huggingface.co/spaces/togethercomputer/OpenChatKit

我的评价:它虽然有类似GPT功能,能理解中文,但是回答全是英文。响应速度非常.


3.2 Vicuna
Vicuna 是一个开源聊天机器人,具有 13B 参数,通过微调 LLaMA 对从 ShareGPT.com 收集的用户对话数据进行训练,社区网站用户可以共享他们的 ChatGPT 对话。根据所做的评估,该模型具有超过 90% 的质量率,可与 OpenAI 的 ChatGPT 和谷歌的 Bard 相媲美,这使得该模型在与 ChatGPT 的功能对等方面成为顶级开源模型之一。它还能够编写在其他开源 LLM 聊天机器人中不太常见的代码,如下图所示。

 

根据公开信息,训练Vicuna-13B 的费用估计约为 300 美元。仓库地址:

https://github.com/lm-sys/FastChat

体验地址:

https://chat.lmsys.org/

3.3 Alpaca
Alpaca建立在 Meta 的 LLaMA 之上,其唯一目标是使 LLM 更便宜。基于斯坦福大学研究中心所做的先前研究和基准。羊驼模型可以低至 600 美元进行再训练,考虑到由此带来的好处,这很便宜。

它们也是另外两个羊驼变种模型Alpaca.cpp和Alpaca-LoRA。使用 cpp 变体,您可以使用具有 4GB 权重的 M2 Macbook Air 在笔记本电脑上本地运行类似 Fast ChatGPT 的模型,当今大多数笔记本电脑都应该能够处理。CPP 变体结合了 Facebook 的 LLaMA、Stanford Alpaca、alpaca-Lora 以及相应的权重。您可以在此处找到有关如何进行微调的数据。

体验地址:

https://huggingface.co/spaces/tloen/alpaca-lora

 

3.4 GPTall
GPT4all是一个社区驱动的项目,在大量精选的辅助交互书面文本集上进行训练,包括代码、故事、描述和多轮对话。该团队提供了数据集、模型权重、数据管理流程和训练代码来推广开源模型。还有一个量化的 4 位版本的模型可以在你的笔记本电脑上运行,因为所需的内存和计算能力更少.

仓库地址:

https://github.com/nomic-ai/gpt4all

体验地址(似乎不能用了,需要自己部署下):

https://huggingface.co/spaces/rishiraj/GPT4All

3.5 ChatRWKV
ChatRWKV是由 RWKV 驱动的开源聊天机器人,RWKV 是一种具有 Transformer 级 LLM 性能语言模型的 RNN。模型结果与 ChatGPT 的结果相当。该模型使用 RNN。模型的微调是使用 Stanford Alpaca 和其他数据集完成的。

仓库地址:

https://github.com/BlinkDL/ChatRWKV

体验地址:

https://huggingface.co/spaces/BlinkDL/ChatRWKV-gradio

3.6 BLOOM
BLOOM 是一个开源 LLMS,拥有超过 1760 亿个参数。相比之下,它与ChatGPT相当,能够处理46种语言和13种编程语言的任务。进入的障碍之一是它需要 350~ GB 的 RAM 才能运行。您可以在此处找到一个较轻的版本。

支持文字和图片!

BLOOM 的开发由 BigScience 协调,BigScience 是一个充满活力的开放研究合作组织,其使命是公开发布 LLM。可以通过GitHub 自述文件找到有关如何开始使用 Bloom 的更多详细信息。

仓库地址:

https://github.com/bigscience-workshop/bigscience/tree/master/train/tr11-176B-ml#readme

ipython:

https://github.com/aws/amazon-sagemaker-examples/blob/main/inference/nlp/realtime/llm/bloom_176b/djl_deepspeed_deploy.ipynb

体验地址:

https://huggingface.co/spaces/huggingface/bloom_demo

3.7 goppt4All
GPT4All Chat 是一个本地运行的人工智能聊天应用程序,由 GPT4All-J Apache 2 许可的聊天机器人提供支持。该模型在您的计算机 CPU 上运行,无需互联网连接即可工作,并且不会向外部服务器发送聊天数据(除非您选择使用您的聊天数据来改进未来的 GPT4All 模型)。它允许您与大型语言模型 (LLM) 进行通信,以获得有用的答案、见解和建议。GPT4All Chat 适用于 Windows、Linux 和 macOS。在您的本地计算机上运行,​​此模型不如那些 GPT 模型强大,可以通过将数据发送到功能强大的大型服务器来通过互联网与之聊天,并且不隶属于它们。

下载地址(我下载了一夜…)

https://gpt4all.io/index.html
1
仓库地址:

https://github.com/nomic-ai/gpt4all

总结
如果在上面的开源列表中注意到,有一个通用主题,LLM 模型的大多数变体要么源自 Meta AI 的 Llama 作为基础模型,要么源自 Bloom。如果有足够的文献可以帮助入门,那么创建自己的变体相对简单。

如果你想要自己训练,一定要预估好成本。我正在思考如何训练一个专业性的模型(虽然可能不会太好,但总想尽可能去尝试)
————————————————
版权声明:本文为CSDN博主「川川菜鸟」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_46211269/article/details/130313338

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40192.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL 索引 - 学习/实践

1.应用场景 主要学习索引结构,这里主要是你指Mysql索引,然后根据具体的业务场景,选择或创建合适的索引,期望达到优化数据库查询速,或者平衡查询速度与储存容量,从而开发出满足业务需求的服务。 2.介绍[多…

AIGC时代,前端低代码平台的实践与挑战 | 6月15日TF109报名

本期技术前线邀请到阿里巴巴高级前端工程师吉婉颖(翊奕)、网易杭州研究院编程语言实验室负责人张炜昕、腾讯PCG智能创作与内容平台技术专家揭光发3位专家,围绕前端低代码平台,一起分享他们的前端技术工作经历以及如何运用到具体业…

会议交流 | 大语言模型时代的知识工程(TF97)

转载公众号 | 中国计算机学会 本期会议邀请到来自360等头部企业的技术资深人士,以及来自海乂知等知识图谱创业企业的技术负责人和来自复旦大学、东南大学等高校的顶尖学者,一起深入探讨知识工程在大语言模型时代所面临的机遇和挑战,并进一步了…

​GPT-4 发布:在考试中击败 90% 的人类;谷歌开放大语言模型 PaLM API;FireFox 111 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

网络安全从业人员会被AI智能取代吗?

随着ChatGPT的火爆,很多人开始担心网络安全从业人员会被AI取代。如果说网络安全挖洞的话,AI可能真的能取代。但是网络安全不仅仅只是挖洞,所以AI只是能缓解网络安全人员不足的情况,但是是不会取代人类的作用的。 就拿最近很火的C…

网络安全从业人员2023年后真的没有活路了吗?会被AI取代吗?

​AI能缓解网络安全人员不足的情况,但是是不会取代人类的作用的。 就拿最近很火的ChatGPT来说,确实能进行恶意攻击,但是前提也是在人类的干预下。 黑莓公司曾经发布过一篇研究报告表明由人工智能驱动的ChatGPT机器人可能会对网络安全产生威…

Android版ChatGPT将于本周发;C-Eval中文大模型排名公布;我国发布首份汽车标准必要专利研究报告丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 理想汽车郎咸朋:截至7月20日,NOA辅助驾驶使用里程已突破2亿公里 7月24日消息,据悉,理想汽车自动驾驶负责人郎咸朋在其个人朋友圈发文,截至2023年7月20…

让GPT-4推理提升17倍的技巧!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考

夕小瑶科技说 分享 来源 | 新智元 由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架,让GPT-4可以自己提案、评估和决策,推理能力最高可提升1750%。 2022年,前谷歌大脑华人科学家Jason Wei在一篇思维链的开山之作中首次提出&#xff0c…

AI 工具合辑盘点(七)持续更新 之 AI 音频生成工具

AI 音频生成工具 想要不亲自录制,快速将文本转换为语音?AI 音频生成工具为你提供数千种语音选择,从“普通人”的声音到模仿演员、政治家或电影角色的合成声音,各种声音应有尽有 🗣 AI 音频生成工具可用于创建商业用途…

劳特巴赫trace32安装和使用

目录 劳特巴赫trace32安装 劳特巴赫使用 trace32调试 劳特巴赫trace32安装 安装说明:安装时需要连接上劳特巴赫调试器 默认步骤 劳特巴赫使用 打开你使用的内核调试器USB 1. SystemSetting可找到单片机型号 ,点击 CPU --> SystemSetting&#xff…

SMT工厂及PCB工程师的福音!可视化BOM交互焊接工具来了

目前电子产品已经渗透到我们生活的各个角落,其产品涵盖通信、医疗、计算机及周边视听产品、玩具、家用电器、军工用品等。关于电子产品的PCBA焊接,在试样阶段一般采用手工焊接。手工焊接的好处是成本低,一把电络铁就搞定了,如果样…

车牌识别--铆钉的去除

车牌识别中,每一步的效果直接影响整体的识别率,对车牌识别产生干扰的,不仅是车牌的污渍,还有铆钉。 一 、举例说明,铆钉干扰使得车牌识别错误 1、车辆图片 2、通过颜色HSV确认车牌大致位置 3、截取车牌图像 4、二值化…

ChatGPT最强竞品Claude-2重磅升级!知识更新到23年,代码数学显著提升,免费可用

夕小瑶科技说 分享 来源 | 机器之心 此次,Claude 2 除了一大波能力上的升级,更重要的是大家都可以用了。 今日,那个被很多网友称为「ChatGPT 最强竞品」的人工智能系统 Claude 迎来了版本大更新。 Claude 2 正式发布! 据介绍&a…

第09课:《ChatGPT提示工程》—— Introduction(引言)

ChatGPT 上线至今,在实际应用中,不少人还没真正掌握它的使用技巧。ChatGPT 的难点,在于 Prompt(提示词)的编写,OpenAI 创始人在今年 2 月时,在 Twitter 上说:「能够出色编写 Prompt …

视觉合集5~2022

发一个合集 总结一些2022年的 一些论文 视觉 Transformer(ViT)学习什么? 论文链接:https://arxiv.org/pdf/2212.06727.pdf 关于视觉的探索显示,ViT 学习的归纳偏置或特征与卷积神经网络(CNN)学…

2022年最值得关注的十篇论文,你都看了吗?来卷来学习

2023 点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 计算机视觉研究院专栏 作者:Edison_G 年关将至,威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 公众号ID|ComputerVisionGzq 学习群&#xff5…

2022年盘点:最值得关注的十篇机器学习论文

来源:机器之心 计算机视觉与机器学习 本文约4000字,建议阅读8分钟 威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 2022 年 1 月,扩散模型第一次吸引了我的眼球。当时我判断到将会有某些大事发生,然…

pycharm 黄色(黄字)高亮警告 Default argument value is mutable 原因及解决办法(mutable 可变对象与 immutable不可变对象)

示例 解决方案 按照参考文章的意思,classesread_class_names(cfg.YOLO.CLASSES)在函数调用时就会创建对象并赋初始值,如果在函数中修改了classes的值,则函数在下一次调用时,就会不会重新初始化值,而以上一…

平面设计之条幅篇

我的博客,我的原创,希望大家能够喜欢 我不是一个真正的美工,但我在社团组织干的是美工的任务; 我不是一个真正的UI,但我在实验室干的是UI的任务; 我不是一个真正的视频制作者,但我在工作室干的是…