无需GPU无需网络“本地部署chatGPT”(更新StableVicuna)

想当初图像生成从DELL到stable diffusion再到苹果的移动部署过了两三年吧
聊天bot才发展几个月就可以边缘部署了,如果苹果更新silicon,npu和运存翻倍,争取apple watch也能本地内置,最快ios18 mac、ipad、iPhone能内置吧
又是一个平民百姓都高兴的开源项目,chatGPT这种级别的模型甚至能部署到树莓派上运行,然后在操作的过程中也遇到一些问题,这篇就是记录步数的这个过程。
已经为最新版的github更新了(2023.5.23),可以放心食用,实测运行速度快了很多。
哈工大的chinese llama效果不如vicuna7b,所以我把这一块的内容给删掉了。
vicuna7b的合成需要高运行内存的电脑,如果你的电脑不足30个G,可以直接私信我要合成好的模型,只有vicuna-7b的q4.0版本。
最近很多人反应老的vicuna-7b已经没办法在新的llama.cpp上使用了(主要是q4版本),可以问我要新的。

大佬的网址:https://github.com/ggerganov/llama.cpp

下载及生成

打开命令行输入下面的指令

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make#对于Windows和CMake,使用下面的方法构建:
cd <path_to_llama_folder>
mkdir build
cd build
cmake ..
cmake --build . --config Release

在这里插入图片描述

模型下载

我觉得模型下载是最麻烦的,还好有别人给了

git clone https://huggingface.co/nyanko7/LLaMA-7B

好吧我直接给百度云
链接: https://pan.baidu.com/s/1ZC2SCG9X8jZ-GysavQl29Q 提取码: 4ret
–来自百度网盘超级会员v6的分享

在这里插入图片描述

然后安装python依赖,然后转换模型到FP16格式。然后第一个小bug会出现。

python3 -m pip install torch numpy sentencepiece# convert the 7B model to ggml FP16 format
python3 convert-pth-to-ggml.py models/7B/ 1

在这里插入图片描述

他会报找不到文件。
在这里插入图片描述
打开convert-pth-to-ggml.py文件,修改"/tokenizer.model"的路径,再运行python3 convert-pth-to-gaml.py ./models/7B 1,我顺便名字也改了。
在这里插入图片描述

文件找到了,然后出现第二个bug。。。。。
在这里插入图片描述

我一开始找不出问题,后来对比原网址和7B文件夹里的文件,才发现文件大小根本都不一样,我说几十个G的东西怎么git这么。
打开网站下图这个网址,点红色框的那两个下载。替换掉7B文件夹里的那两个文件。
在这里插入图片描述

在这里插入图片描述

将模型再转换成4位格式

# quantize the model to 4-bits
./quantize ./models/7B/ggml-model-f16.bin ./models/7B/ggml-model-q4_0.bin 2

在这里插入图片描述

推理

# run the inference
./main -m ./models/7B/ggml-model-q4_0.bin -n 128

在这里插入图片描述

想和chatGPT一样对话的话用下面这个指令,-n 控制回复生成的最大长度, --color是区分ai和人类的颜色,-i 作为参数在交互模式下运行, -r 是一种反向提示,-f 是一整段提示, --repeat_penalty 控制生成回复中对重复文本的惩罚力度,–temp 温度系数,值越低回复的随机性越小,反之越大。
更新了之后速度快了很多。

./main -m ./models/7B/ggml-model-q4_0.bin -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

让我们打开prompts/chat-with-bob.txt来看一下。
在这里插入图片描述

我们可以看到这相当于给了ai模型一个场景话题,然后你和ai之间就可以接着这个话题聊天。

我英文名叫zale,然后我把这个机器人叫作kangaroo,这样的身份和他聊天,你可以按自己的喜欢自己修改下面的代码。

./main -m ./models/7B/ggml-model-q4_0.bin -n 256 --repeat_penalty 1.0 --color -i -r "Zale:" \

写一个txt文件

"Transcript of a dialog, where the Zale interacts with an Assistant named Kangaroo. Kangaroo is helpful, kind, honest, good at writing, and never fails to answer the Zale's requests immediately and with precision.Zale: Hello, Kangaroo.
Kangaroo: Hello. How may I help you today?
Zale: Please tell me the largest city in Europe.
Kangaroo: Sure. The largest city in Europe is Moscow, the capital of Russia.
Zale:"

在这里插入图片描述

有点呆呆的,不过也算边缘部署的巨大进步了!
一个蛮有意思的发现,明明看得懂中文却跟我说不懂中文。。。。。
在这里插入图片描述
分享一段有意思的对话
在这里插入图片描述

Vicuna-7B

把原始的llama模型转换成huggleface的格式

python3 ~/anaconda3/envs/pytorch2/lib/python3.10/site-packages/transformers/models/llama/convert_llama_weights_to_hf.py \--input_dir ./llama-7b \--model_size 7B \--output_dir ./llama-7b-hf

这样生成的文件放在llama-7b-hf之中。
在这里插入图片描述

下载vicuna7b的权重文件,也可以理解为补丁。
注意融合vicuna7b模型需要30个G的内存,我特意买128G内存和4090的电脑,
如果有需要,可以私信我我看到的话直接把生成的模型发给你。
还有就是现在的模型是v1.1的版本,必须搭配使用transformers>=4.28.0 and fschat >= 0.2.0

python3 -m fastchat.model.apply_delta \--base-model-path ./llama-7b-hf/ \--target-model-path ./vicuna-7b/ \--delta-path ./vicuna-7b-delta-v1.1/

这样融合的模型就在vicuna-7b的文件夹下。
在这里插入图片描述

可以直接用fastchat用测试一下,速度好快哦!!!确实fast

python3 -m fastchat.serve.cli --model-path ./vicuna-7b

回到llama.cpp之中,老三样

python3 convert-pth-to-ggml.py models/vicuna-7b/ 1./quantize ./models/vicuna-7b/ggml-model-f16.bin ./models/vicuna-7b/ggml-model-q4_0.bin 2./main -m ./models/vicuna-7b/ggml-model-q4_0.bin -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

在这里插入图片描述

在这里插入图片描述

实测理解能力和中文水平我认为都是目前最佳的边缘部署的模型,我觉得我可以把哈工大的中文模型部分给删了。目前使用下来不错,很有chatGPT那味。
我又试了一下i9-13900KF,速度是快了一些。
在这里插入图片描述

来点好玩的例子。
在这里插入图片描述

在这里插入图片描述

多模态部署

这个需要12g的显存,没有的朋友就图个乐。
用到的是miniGPT这个库。

1.准备环境

git clone https://github.com/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

在这里插入图片描述
2.修改文件指向电脑里的vicuna-7b路径
在这里插入图片描述
3.下载pretrained MiniGPT-4 checkpoint
在这里插入图片描述
4.修改文件指向电脑里的pretrained MiniGPT-4 checkpoint路径
在这里插入图片描述
5.运行demo

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml  --gpu-id 0

在这里插入图片描述

StableVicuna

据说效果远超原版vicuna,实测直接用transformer4.8.0即可转换,然后转换的原模型是huggle face格式的llama原模型。
之后的步骤不再重复和上面一样,运行起来似乎失去了中文能力,然后数学能力等有提升,感觉像文科生变成理科生。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/868.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

说说最近的潮流ChatGPT

最近这个ChatGPT可谓是火遍全网&#xff0c;基本占据各个平台的热搜&#xff0c;如 “ChatGPT让苹果急了”“美国89%的大学生都是用ChatGPT做作业”&#xff0c;网友笑称终于有个懂我的AI了&#xff0c;再也不是“人工智障了” 这个ChatGPT到底神奇在哪里??? 官方给出的答…

苹果公司限制员工使用AI工具ChatGPT和GitHub Copilot

​关注文章下方公众号&#xff0c;即可免费获取AIGC最新学习资料 导读&#xff1a;苹果公司最近发布了一份内部备忘录&#xff0c;禁止员工使用生成式AI平台&#xff08;包括ChatGPT和GitHub的Copilot等&#xff09;用于工作任务。 本文字数&#xff1a;600&#xff0c;阅读时…

询问ChatGPT的高质量答案艺术——提示工程指南

目录 前言一、提示工程简介二、提示技巧2-1、生成法律文件2-2、添加提示技巧 三、角色扮演3-1、智能手机产品描述3-2、添加角色扮演 四、标准提示4-1、写一篇有关于新智能手机的评论4-2、添加标准提示、角色提示、种子词提示等等 五、示例很少、或者没有示例5-1、生成一个手机配…

视界 | ChatGPT横空出世,谷歌苹果都“急”了

最近ChatGPT简直火出圈了。 这是一款人工智能聊天机器人&#xff0c;网络上传得神乎其神。在传说中&#xff0c;ChatGPT会写诗、改论文、编程序、写文章、看病......&#xff0c;甚至还会写券商的行业分析报告&#xff0c;简直无所不能。 据说许多打工人已经在担心自己的饭碗…

chatGPT对经济的影响

公众号文章&#xff1a;chatGPT对经济的影响 问答 chatGPT对经济的影响是什么 请你扮演一位大学生&#xff0c;要做一场关于“chatGPT对经济的影响“的报告&#xff0c;请你详细讲述PPT制作构思以及开场白 好的&#xff0c;作为一位大学生&#xff0c;我非常荣幸能够在这里向…

把ChatGPT的所有插件整理成中文后!真要说卧槽了..

大家好&#xff0c;我是五竹。 ChatGPT如约向用户开放了联网功能和众多插件&#xff0c;五竹从上周开始满怀着热情等待着&#xff0c;看别人的测评效果都快把我羡慕哭了。最终等来的却是Plus账号给封了&#xff0c;而且至今也没有续上&#xff0c;只能说非常无奈。算了&#x…

ChatGPT的申请之路(2)

https://chat.openai.com/ 1、账号已经申请成功&#xff0c;选择Login 2、选择Continue with Apple 3、输入苹果ID 4、输入密码 5、继续 6、ChatGPT的画面终于出来了&#xff0c;红框为输入信息框 7、聊天示例 8、换中文试试

【ChatGPT 实践 1】Mac、Iphone、Ipad 集成 ChatGPT

环境准备 1 个 ChatGPT 账号 步骤概述 这里以 Mac 为例&#xff1a; 1、点击下面链接&#xff0c;添加 爱玩 快捷指令 https://www.icloud.com/shortcuts/2f6afbd6660e48e18a587bc90ede3932 &#xff08;可能出现打不开的情况&#xff0c;比如 部分 Iphone 设备&#xff…

接入ChatGPT应用被苹果阻止更新,要求改成17限

萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT开放API消息才出来&#xff0c;就有应用安排上了。 然而&#xff0c;苹果却把这次更新阻止了&#xff01; 理由是人工智能可能会产生不适合所有受众的内容&#xff1a; 要么增加内容过滤功能&#xff0c;要么把APP适用人群改到1…

ChatGPT开源系列

目录 进化树 从GPT-4 可以看出未来 LLM 的哪些趋势&#xff1f;未来的研发方向和优化策略是什么&#xff1f; 模型 Stanford Alpaca 可以借鉴的点 llama.cpp 验证阶段已完成 nebullvm-chatllama&#xff08;待定&#xff09; 可以借鉴的点 OpenChatKit 可以借鉴的点&a…

ChatGPT飙升苹果商店榜首,每周订阅需7.99美元,结果是个假的???

衡宇 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT出App版了&#xff0c;苹果商店下载就能使用&#xff1f;&#xff1f; 打开美国Apple Store搜索&#xff0c;下载后软件内每周付费7.99美元&#xff0c;即可享受与它无次数限制畅聊。 不过别忙着付费&#xff01; 这个ChatGPT C…

OpenAI推出iOS版ChatGPT,支持语音输入

北京时间5月19日凌晨&#xff0c;OpenAI重磅推出iOS版ChatGPT。 据介绍&#xff0c;iOS版ChatGPT供免费使用&#xff0c;并在不同设备上同步聊天历史。 同时&#xff0c;它还集成了开源语音识别系统Whisper&#xff0c;可以实现语音输入。 另外&#xff0c;ChatGPT Plus用户在i…

AI在狂飙,ChatGPT-4可直接在iPhone上使用啦

今天凌晨&#xff0c;OpenAI 正式在 App Store 推出了 ChatGPT 的 iOS app&#xff0c;瞬间冲上苹果商店免费榜第二名&#xff0c;效率榜第一名。 于是兴致勃勃的去下载体验了一番。整体不错&#xff0c;以后手机使用官方的 ChatGPT 更方便啦&#xff01;而且使用 GPT4 不再麻…

“我在 iPhone 上,创建了个 ChatGPT 快捷方式,这也太万能了……”

【CSDN 编者按】由 ChatGPT 提供支持的神奇快捷方式 S-GPT。 原文链接&#xff1a;https://medium.com/macoclock/heres-a-chatgpt-powered-shortcut-for-ios-that-will-blow-your-mind-c6aeebb77e00 未经允许&#xff0c;禁止转载&#xff01; 作者 | Nikhil Vemu 译者 | 弯月…

ChatGPT为一位英语女教师做了这件事

文 / 高扬&#xff08;微信公众号&#xff1a;量子论&#xff09; 今天有位网友加我微信&#xff0c;是某中学的英语老师&#xff0c;通过“量子论”公众号知晓了ChatGPT的一些有趣玩法&#xff0c;询问是否有办法帮她做个提示词&#xff0c;依据一个单词生成配套学习资料。 即…

ChatGPT专业应用:英文语法纠错

正文共 381 字&#xff0c;阅读大约需要 1 分钟 英语学习者必备技巧&#xff0c;您将在1分钟后获得以下超能力&#xff1a; 英文语法纠错 Beezy评级 &#xff1a;B级 *经过简单的寻找&#xff0c; 大部分人能立刻掌握。主要节省时间。 推荐人 | Linda 编辑者 | Yolanda ●此图…

更好地提问ChatGPT_常用prompt表

对常见的用途&#xff0c;记录该表以便获得ChatGPT更高质量的回复。 类别目的提问方式要点文案写作周报、日报、年终总结本周我做了以下几件事情&#xff1a;出差客户办事处、交流演示、初步数据分析。请帮我写一份周报要点形式列举工作内容。可以说明职位&#xff0c;以便工作…

​使用ChatGPT进行文章降重​

#ChatGPTTOC 使用ChatGPT进行文章降重 在ChatGPT引领的技术爆炸时期&#xff0c;如何使用它对文章进行降重&#xff1f; 推荐一个实测简单有效的方法&#xff0c;只需两步&#xff1a; 简单来说就是先进行关键点提取再进行关键点扩写。 关键点提取 提炼出这段话的关键点和结论…

通过ChatGPT快速学习英语

我一直想提高自己的英语水平&#xff0c;这样看youtobe的时候也不至于经常要看字幕。现在借助ChatGPT&#xff0c;我们是不是可以让它生成一个专属的英语私教教练呢&#xff1f;事实上&#xff0c;还真可以。 具体方法如下&#xff1a; 设置单词库 设置场景&#xff0c;生成对…

chatGPT学英语,真香!!!

文章目录 学习目标学习内容目标方式过程 学习时间学习产出 学习目标 能够在三个月的练习后&#xff0c;和真人外教比较流畅的沟通&#xff01; 最近chatGPT实在是太火了&#xff0c;各种事情都能干&#xff0c;能改论文、写代码和翻译。 看到B站很多教程教我们直接用chatGPT…