部署运行ai智障写作记录【ChatRWKV】

文章目录

  • 前言
  • 一、环境安装
    • 1.python环境:Python 3.10。
    • 2.安装一些 pip 库numpy 、tokenizers 、prompt_toolkit
    • 3.安装pytorch 1.13.1+CUDA 11.7
  • 二、运行记录
    • 1、下载代码
    • 2、下载训练参数
    • 3、编辑代码运行
  • 总结


前言

看到知乎一篇教程,
大佬自己弄得ai小说续写,用我的18年老笔记本居然也跑起来了,1.5b模型续写效果:

在这里插入图片描述

以下只是记录,正文请跳转知乎原文查看:https://zhuanlan.zhihu.com/p/609154637


一、环境安装

【建议先把pip源切换为国内清华源】

1.python环境:Python 3.10。

使用anaconda创建环境,选择3.10.x

在这里插入图片描述

2.安装一些 pip 库numpy 、tokenizers 、prompt_toolkit

不要安装错了环境

两种方式:
1、cmd 命令行切换到刚刚新建的python3.10环境,执行下面安装命令

conda activate python310
pip install numpy tokenizers prompt_toolkit

2、在anaconda ui界面安装
选择对应环境,右上角输入需要的包安装,打勾是已经安装的

在这里插入图片描述

3.安装pytorch 1.13.1+CUDA 11.7

我笔记本是1050,虽然拉,不过也有几百个cuda核心

安装pytorch,应该也可以使用上面的方式安装,但是怕版本不对,或者其他原因,还是建议使用下面命令行安装

pip install torch --extra-index-url https://download.pytorch.org/whl/cu117 --upgrade

我装的时候2.4Gb左右,还好下载速度快一般10分钟左右就安装好了

二、运行记录

1、下载代码

环境安装完成后把代码拉下来:

git clone https://github.com/BlinkDL/ChatRWKV

如果本地装了git,进入你想要存放代码的文件夹,地址栏输入cmd,回车
然后在命令行界面输入上面代码拉取就好了,代码本身并不大

2、下载训练参数

根据你的显存下载对应的训练参数,我的1050网上查是2g,但是这里看又有4g,不是很清楚为什么
在这里插入图片描述
不同显存下载不同规模参数,4g刚好可以下载1.5B 参数,后面我也不自量力的下载了中模型,改了下参数后确实运行起来了,但是生成速度太感人了,10个汉字能跑1分钟……
只有4g的话还是跑跑小模型就好了

模型链接里面有许多链接,不用全部下载,下载【其中的 EngChn-testNovel 模型】

下载小说模型(这些链接里面有很多模型,选其中的 EngChn-testNovel 模型):

大模型:7B 参数,效果最佳,推荐 14G
显存,小显存也可以跑,显存越少越慢:https://huggingface.co/BlinkDL/rwkv-4-pile-7b/tree/main
(炼了40%,炼完会更强)

中模型:3B 参数,效果中上,推荐 6G 显存,小显存也可以跑,显存越少越慢:
https://huggingface.co/BlinkDL/rwkv-4-pile-3b/tree/main

小模型:1.5B 参数,效果中等,推荐 3G 显存: https://huggingface.co/BlinkDL/

比如小模型1.5B,下载这个就好了,
令人惊喜的是下载速度嘎嘎快,给作者好评!!要是放github,把模型拉下来都要好久

在这里插入图片描述

3、编辑代码运行

下载好之后,使用vs打开源代码v2文件夹里面的chat.py,按照下面更新(作者难得良心的写了这么多中文注释……)

设置 CHAT_LANG = 'Chinese'设置 args.MODEL_NAME = 'C:/xxx/xxx/RWKV-4-Pile-7B-EngChn-testNovel-xxx-ctx2048-20230xxx'
这个 MODEL_NAME 改成你下载的模型文件的路径和名字(不需要 .pth 扩展名),注意路径用 /(不要用 \)。默认的 args.strategy = 'cuda fp16' 代表模型全部加载进显卡。如果显存报错说不够,改成 args.strategy = 'cuda fp16 *12+' 试试(注意数字后面有个加号!)。
然后尽量调大12(只要不报错,这个数字越大,模型运行越快)。
但不要太极限(如果太极限,有可能生成时显存不够),建议试到极限,然后减1或2。
用这个方法,3G显存也能跑7B模型(不过会挺慢,以后会更快)。还可以试试 'cuda fp16 *12 -> cpu fp32' 也是尽量调大12。可以比较哪种的速度快。

实测:
cuda fp16 就只会使用显卡,显卡gpu会占满,速度很快,但是容量只有4g,大于4g模型会报错
cuda fp16 *12+ 会使用显卡和内存一起,可以运行大于4g的模型,但是速度奇慢

上面都弄好了就可以跑起来了,下面是他跑起来的样子:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

作者还有个api_demo.py,不过没写注释,看不懂……,如果跑起来应该就能想chatgpt一样对外提供api了吧,那倒是蛮实用的


总结

参考链接:
https://zhuanlan.zhihu.com/p/609154637

https://huggingface.co/BlinkDL/rwkv-4-pile-1b5/tree/main

https://github.com/BlinkDL/ChatRWKV

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21606.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT: 深入解读OpenAI的语言模型技术

ChatGPT: 深入解读OpenAI的语言模型技术 引言 引言部分旨在介绍ChatGPT是什么,为什么它是近年来最受欢迎的语言模型之一,并概述本文的主要内容。 1.1 简介 ChatGPT是由OpenAI开发的一种基于深度学习技术的对话生成模型。它采用了最先进的自然语言处理技…

【人工智能】ChatGPT 技术架构与相关技术栈清单

ChatGPT 技术架构 ChatGPT是一种基于自然语言处理的神经网络模型,它使用了大量的未标注文本数据进行训练,并通过预测文本中下一个词的方式来自我监督。 文章目录 ChatGPT 技术架构自监督预训练模块预训练模型深度学习Transformer模型生成式模型微调模块注意力机制多头自注意…

百度正式推出文心一言及百家号文章代发 已可使用

百度正式推出文心一言及百家号文章代发 已可使用,会成为中国版ChatGPT吗?#文心一言 #chatgpt #热点 不久之前,百度在万众期待之下发布了自己的新一代大语言模型闻心一言,不知道大家对这样发布会怎么评价,反正我一位行业…

仿QQ聊天软件及源码java版

一直以来,很多java的同志们都没有一个完整资料来参考。把源码贴出来,大家共享! import java.awt.BorderLayout; import java.awt.Component; import java.awt.Dialog; import java.awt.Dimension; import java.awt.FlowLayout; import java.a…

java 网络编程五 (仿QQ聊天程序)

学完了socket通讯后,在老师的要求下,写了一个仿qq的聊天程序&#xff1a; 最终调试程序结果如下图: 有bug希望提出来,我们一起解决。 设计思路: 在服务器端 用一个HashMap<userName,socket> 维护所有用户相关的信息&#xff0c;从而能够保证和所有的用户进行通讯。 …

Chatgpt论文笔记——GPT1详细解读与可运行的代码

前言 论文&#xff1a;https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf 时间&#xff1a;2018年6月 贡献&#xff1a; 提出了大规模数据上无监督预训练然后在目标任务上有监督finetune的范式。 具体实现 当时由于NLP领域不存…

生成式AI管理规则落地 大模型后时代到来

国家网信办等七部门联合颁布的《生成式人工智能服务管理暂行办法》&#xff0c;给中国生成式AI产业树立了发展规范。 这份监管文件的用意并不止于管控&#xff0c;还用大量的笔墨传递出推动产业发展的原则&#xff0c;尤其强调“鼓励生成式人工智能技术在各行业、各领域的创新…

摄影师没了?!生成式人工智能即将降维打击摄影行业

本文是Mixlab无界社区成员的投稿&#xff1a; 滚石 deepfacelab和deepfacelive项目组成员 摄影师失业了&#xff1f;&#xff1f;怎么说&#xff1f; # # 你还以为AI绘画影响的只是插画师行业吗&#xff1f;错了&#xff0c;摄影行业也即将面临技术洗牌。话不多说&#xff0c;先…

AIGC绘就无限可能的元宇宙

随着科技的飞速发展&#xff0c;我们正逐渐步入一个由虚拟和现实交织构成的全新时代。元宇宙&#xff08;Metaverse&#xff09;作为这个新时代的象征&#xff0c;正在成为一个重要的热点。而人工智能生成内容&#xff08;AIGC&#xff09;技术的结合&#xff0c;将无疑会推动元…

开发者出海合规手册;@levelsio独立开发月入20万解析;MJ+AR设计珠宝;SD算法原理-通俗版 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 独立开发者必看&#xff0c;出海应用开发者合规手册 这是 JourneymanChina 多年出海经验教训的总结&#xff0c;适用于Google Play 以…

ChatGPT唤醒AI游戏?

配图来自Canva可画 “七天制作新游戏”、“AI全自动完成所有游戏&#xff01;”......继各种AI绘画、AI合成照片、视频之后&#xff0c;AI在游戏领域开启了新一场狂欢。 长久以来&#xff0c;游戏和AI一直有着“相互扶持”的亲密关系——一边是游戏充当AI科研基地&#xff0c…

网易的“草长莺飞二月天”:增长稳健,加码研发,逐浪AI

2月23日&#xff0c;网易发布了2022年第四季度财报。 这是网易与暴雪分道扬镳后的首份财报&#xff0c;加上近期AIGC热度扩散至游戏、教育等各个领域&#xff0c;网易第四季度业绩及其对于GPT等热门技术的探索受到市场关注。 根据财报&#xff0c;第四季度&#xff0c;网易营…

「经济理财」32堂你能听懂的理财课

之前学了一下基金投资课程&#xff0c;作为以后财富管理的积累&#xff0c;可以出门右转看「银行螺丝钉的基金投资课」。但还是觉得应该系统了解一下理财&#xff0c;从小白到理财达人&#xff0c;我需要半年来学习和实践&#xff0c;比较好的是接触到简七理财&#xff0c;结合…

[AI医学] 医学领域几个微调预训练大模型的项目

关键词&#xff1a;AI医学&#xff0c;医学大模型&#xff0c;指令微调&#xff0c;PubMed 文章目录 医学微调大模型1. MedicalGPT-zh2. DoctorGLM3. Huatuo-Llama-Med-Chinese & ChatGLM-Med 医学预训练语言模型1. BioMedLM (2.7B)2. PMC-LLaMA (7B)3. BioMedGPT (1.6B) 总…

程序员专属对联

请欣赏“程序猿春节对联集锦”&#xff1a; 对联一 上联&#xff1a;上拜图灵只佑服务可用 下联&#xff1a; 下跪关公但求永不宕机 横批&#xff1a;风调码顺 风调雨顺 上拜图灵只佑服务可用 下跪关公但求永不宕机 对联二 上联&#xff1a;屏中创造繁华世 下联&#xff1a;指尖…

Node接入ChatGPT 的最强对手Claude

由于个人的chatGPT免费版本即将到期, Claude 很火&#xff0c;在网上被说成是 ChatGPT 的最强对手&#xff0c;是 ChatGPT 的替代品。本文我将介绍下 Claude 是什么&#xff0c;以及如何免费使用 Claude. 什么是Claude 看一下它是如何自我介绍的 Slack Slack 是一款流行的团…

读《EMOQ-TTS: EMOTION INTENSITY QUANTIZATION FOR FINE-GRAINED CONTROLLABLE EMOTIONAL TEXT-TO-SPEECH》

0 Abstract 虽然近年来文本到语音(TTS)的研究取得了显著进展&#xff0c;但仍局限于情感语音合成。为了产生情感话语&#xff0c;大多数作品都利用了从情感标签或参考音频中提取的情感信息。然而&#xff0c;由于话语层面的情绪条件&#xff0c;它们导致了单调的情绪表达。在本…

专家担心 ChatGPT 很快会被用于毁灭性的网络攻击

听到这个新闻&#xff0c;我是挺震惊的&#xff0c;​ChatGPT 近几个月来风靡全球&#xff0c;但就在它以其技术能力让人们惊叹的同时&#xff0c;也有人对其潜在的滥用提出了担忧。 现在&#xff0c;似乎一些 IT 领导者担心它将很快被用于重大网络攻击&#xff0c;并有可能在未…

英文润色网站-英文质量改写改进软件

英文改写软件 英文改写软件是一种全新的工具&#xff0c;它可以方便快捷地对不同语种的图文内容进行批量改写和转换&#xff0c;包括但不限于英语、法语、德语、中文等。无论用户需要将哪种语言的文章进行改写和转换&#xff0c;都可以轻松实现。该软件支持任何文档格式和文本…

OpenAI Translator Bob Plugin Bob上一款翻译、润色、语法修改插件

OpenAI Translator Bob Plugin 一款可以在Bob进行即时翻译的插件。它基于 OpenAI 的 GPT 系列模型&#xff0c;能够提供高质量、准确的翻译服务。该插件支持多种语言的翻译&#xff0c;包括中文、英文、法语、德语、日语等。用户只需在页面中选中需要翻译的文本&#xff0c;然…