ChatGLM-6B微调与部署

文章目录

  • 基于ChatGLM-6B的推理与部署
    • 配置环境与准备
      • 配置环境
      • 模型文件准备
    • 代码运行 Demo
    • 命令行 Demo
    • 基于 Gradio 的网页版 Demo
    • 基于 Streamlit 的网页版 Demo
  • 基于peft框架的LoRA微调ChatGLM-6B
    • 配置环境与准备
      • 配置环境
      • 模型文件准备
      • 数据准备
      • 数据处理
    • 微调过程
  • 基于P-Tuning v2微调ChatGLM-6B(官方)
    • 配置环境与准备
      • 配置环境
      • 模型文件准备
      • 数据准备
    • 微调过程
    • 推理过程

ChatGPT所展现出的强大能力,足以使许多行业发生翻天覆地的变化,而通过微调及部署较小的模型,在一些垂直领域达到和ChatGPT相近的效果,显得尤为重要。本文从模型参数,中文,微调难度等多角度考虑,选取了ChatGLM-6B模型来进行实验,主要分为3个部分:基于ChatGLM-6B的部署,基于peft框架的LoRA微调ChatGLM-6B,基于P-Tuning v2微调ChatGLM-6B(官方)。
ChatGLM-6B 由清华大学提出,是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。参考链接:https://github.com/THUDM/ChatGLM-6B。
本次实验所使用的配置如下:

  • CPU&内存:28核(vCPU)112 GB
  • 操作系统:Ubuntu_64
  • GPU:NVIDIA Tesla P100
  • 显存:16G

基于ChatGLM-6B的推理与部署

配置环境与准备

配置环境

先下载项目仓库

git clone https://github.com/THUDM/ChatGLM-6B
cd ChatGLM-6B

建议最好自己新建一个conda环境。

pip install -r requirements.txt

特别注意torch版本不低于1.10(这里安装的1.10),transformers为4.27.1。
torch的安装命令可以参考pytorch官网:https://pytorch.org/
这里使用的pip命令安装的,命令如下

pip install torch==1.10.0+cu102 torchvision==0.11.0+cu102 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html

模型文件准备

下载ChatGLM-6B模型文件
较大的8个模型文件可以从这里下载(下载速度快):https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/
在这里插入图片描述
其他的小文件可以从这里下载(点击红框的下载按钮即可):https://huggingface.co/THUDM/chatglm-6b
在这里插入图片描述
在这里插入图片描述
注意这里都下载在了/data/chatglm-6b下,在后面执行代码的时候需要将文件中的模型文件路径改为自己的。

代码运行 Demo

在本地运行可以直接用下面代码:

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("/data/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("/data/chatglm-6b", trust_remote_code=True).half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

在这里插入图片描述

命令行 Demo

运行仓库中 cli_demo.py:

python cli_demo.py

程序会在命令行中进行交互式的对话,在命令行中输入指示并回车即可生成回复,输入 clear 可以清空对话历史,输入 stop 终止程序。
在这里插入图片描述

基于 Gradio 的网页版 Demo

运行web_demo.py即可(注意可以设置share=True,便于公网访问):
python web_demo.py(注意运行前确认下模型文件路径)
在这里插入图片描述

基于 Streamlit 的网页版 Demo

基于streamlit:
pip install streamlit
pip install streamlit-chat
streamlit run web_demo2.py --server.port 6006(可以将6006端口放出,便于公网访问)
在这里插入图片描述
默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果显存有限,还可以考虑模型量化,目前支持4/8 bit 量化。具体详见项目描述。

基于peft框架的LoRA微调ChatGLM-6B

参考链接:https://github.com/mymusise/ChatGLM-Tuning

配置环境与准备

配置环境

先下载项目仓库

git clone https://github.com/mymusise/ChatGLM-Tuning.git

创建一个python3.8的环境

conda create -n torch1.13 python==3.8
conda activate torch1.13

根据requirements.txt配置环境

pip install bitsandbytes==0.37.1

安装1.13,cuda11.6(torch官网命令)

pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

安装其他的包

pip install accelerate==0.17.1
pip install tensorboard==2.10
pip install protobuf==3.19.5
pip install transformers==4.27.1
pip install icetk
pip install cpm_kernels==1.0.11
pip install datasets==2.10.1
pip install git+https://github.com/huggingface/peft.git # 最新版本 >=0.3.0.dev0

遇到冲突问题:icetk 0.0.5 has requirement protobuf<3.19, but you have protobuf 3.19.5.
最后装了3.18.3的protobuf,发现没有问题。

模型文件准备

模型文件在前面基于ChatGLM-6B的部署中已经准备好了,注意路径修改正确即可。

数据准备

项目中提供了数据,数据来源为 Stanford Alpaca 项目的用于微调模型的52K数据。数据生成过程可详见:https://github.com/tatsu-lab/stanford_alpaca#data-release。
alpaca_data.json包含用于微调羊驼模型的 52K 指令数据。这个 JSON 文件是一个字典列表,每个字典包含以下字段:

  • instruction: str,描述了模型应该执行的任务。52K 条指令中的每一条都是唯一的。
  • input: str,任务的可选上下文或输入。例如,当指令是“总结以下文章”时,输入就是文章。大约 40% 的示例有输入。
  • output: str,由 生成的指令的答案text-davinci-003。
    示例如下:

[
{
“instruction”: “Give three tips for staying healthy.”,
“input”: “”,
“output”: “1.Eat a balanced diet and make sure to include plenty of fruits and vegetables. \n2. Exercise regularly to keep your
body active and strong. \n3. Get enough sleep and maintain a
consistent sleep schedule.”
},
{
“instruction”: “What are the three primary colors?”,
“input”: “”,
“output”: “The three primary colors are red, blue, and yellow.”
},
…]

数据处理

数据处理,运行 cover_alpaca2jsonl.py 文件

python cover_alpaca2jsonl.py \--data_path data/alpaca_data.json \--save_path data/alpaca_data.jsonl \

处理后的文件示例如下:

{"text": "### Instruction:\nGive three tips for staying healthy.\n\n### Response:\n1.Eat a balanced diet and make sure to include plenty of fruits and vegetables. \n2. Exercise regularly to keep your body active and strong. \n3. Get enough sleep and maintain a consistent sleep schedule.\nEND\n"}
{"text": "### Instruction:\nWhat are the three primary colors?\n\n### Response:\nThe three primary colors are red, blue, and yellow.\nEND\n"}

运行 tokenize_dataset_rows.py 文件,注意:修改tokenize_dataset_rows中的model_name为自己的文件路径 :/data/chatglm-6b。

python tokenize_dataset_rows.py \--jsonl_path data/alpaca_data.jsonl \--save_path data/alpaca \--max_seq_length 200 \--skip_overlength \

微调过程

注意:运行前修改下finetune.py 文件中模型路径:/data/chatglm-6b

python finetune.py \--dataset_path data/alpaca \--lora_rank 8 \--per_device_train_batch_size 6 \--gradient_accumulation_steps 1 \--max_steps 52000 \--save_steps 1000 \--save_total_limit 2 \--learning_rate 1e-4 \--fp16 \--remove_unused_columns false \--logging_steps 50 \--output_dir output;

Nvidia驱动报错(如没有可忽略)
遇到问题,说明Nvidia驱动太老,需要更新驱动。
UserWarning: CUDA initialization: The NVIDIA driver on your system is too old (found version 10020). Please update your GPU driver by downloading and installing a new version from the URL: http://www.nvidia.com/Download/index.aspx Alternatively, go to: https://pytorch.org to install a PyTorch version that has been compiled with your version of the CUDA driver. (Triggered internally at …/c10/cuda/CUDAFunctions.cpp:109.)
解决:更新驱动即可,参考:https://zhuanlan.zhihu.com/p/59618999
BUG REPORT报错
参考:https://github.com/mymusise/ChatGLM-Tuning/issues/108
CUDA SETUP: CUDA version lower than 11 are currently not supported for LLM.int8()

考虑安装11以上的cudatooklit,参考下面链接,安装cudatooklit11.3(因为Ubuntu系统版本的原因,不能装11.6的)
https://zhuanlan.zhihu.com/p/396292888
cudatooklit下载地址:
https://developer.nvidia.cn/cuda-11.3.0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=16.04&target_type=runfile_local
运行代码前先执行下面命令:

export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH  
export CUDA_HOME=/usr/local/cuda-11.3:$CUDA_HOME  
export PATH=/usr/local/cuda-11.3/bin:$PATH

内存不够,考虑将per_device_train_batch_size设为1

python finetune.py \--dataset_path data/alpaca \--lora_rank 8 \--per_device_train_batch_size 1 \--gradient_accumulation_steps 1 \--max_steps 52000 \--save_steps 1000 \--save_total_limit 2 \--learning_rate 1e-4 \--fp16 \--remove_unused_columns false \--logging_steps 50 \--output_dir output;

报错:RuntimeError: expected scalar type Half but found Float
https://github.com/mymusise/ChatGLM-Tuning/issues?q=is%3Aissue+is%3Aopen+RuntimeError%3A+expected+scalar+type+Half+but+found+Float
解决方法:
一种是,不启用fp16, load_in_8bit设为True,可以运行,但loss为0;
一种是,启用fp16, load_in_8bit设为False,不行,应该还是显存不够的问题。至少需要24G左右的显存。

基于P-Tuning v2微调ChatGLM-6B(官方)

配置环境与准备

配置环境

地址:https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning
安装以下包即可,这里直接在torch1.13的conda环境下安装的。

pip install rouge_chinese nltk jieba datasets

模型文件准备

模型文件在前面基于ChatGLM-6B的部署中已经准备好了,注意路径修改正确即可。
特别注意:如果你是之前下载的可能会报错,下面有详细的错误及说明。

数据准备

ADGEN 数据集任务为根据输入(content)生成一段广告词(summary)。

{
“content”: “类型#上衣版型#宽松版型#显瘦图案#线条衣样式#衬衫衣袖型#泡泡袖衣款式#抽绳”,
“summary”: “这件衬衫的款式非常的宽松,利落的线条可以很好的隐藏身材上的小缺点,穿在身上有着很好的显瘦效果。领口装饰了一个可爱的抽绳,漂亮的绳结展现出了十足的个性,配合时尚的泡泡袖型,尽显女性甜美可爱的气息。”
}

从 Google Drive 或者 Tsinghua Cloud 下载处理好的 ADGEN 数据集,将解压后的 AdvertiseGen 目录放到本 ptuning 目录下即可。

微调过程

修改train.sh文件。
1、去掉最后的 --quantization_bit 4。
2、注意修改模型路径,THUDM/chatglm-6b修改为/data/chatglm-6b。
3、如果你也是在云服务器上运行,建议可以加上nohup后台命令,以免断网引起训练中断的情况。
修改后train.sh文件如下:

PRE_SEQ_LEN=8
LR=1e-2CUDA_VISIBLE_DEVICES=0 nohup python -u main.py \--do_train \--train_file AdvertiseGen/train.json \--validation_file AdvertiseGen/dev.json \--prompt_column content \--response_column summary \--overwrite_cache \--model_name_or_path /data/chatglm-6b \--output_dir output/adgen-chatglm-6b-pt-$PRE_SEQ_LEN-$LR \--overwrite_output_dir \--max_source_length 64 \--max_target_length 64 \--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--gradient_accumulation_steps 16 \--predict_with_generate \--max_steps 3000 \--logging_steps 10 \--save_steps 1000 \--learning_rate $LR \--pre_seq_len $PRE_SEQ_LEN \>> log.out 2>&1 &

执行命令,开始微调

bash train.sh

报错:‘ChatGLMModel’ object has no attribute ‘prefix_encoder’(如没有可忽略)
解决:需要更新 https://huggingface.co/THUDM/chatglm-6b/tree/main 里面的几个py文件。(重新下载下这几个文件就可以了)
在这里插入图片描述
微调过程占用大约13G的显存。
在这里插入图片描述
微调过程loss变化情况
在这里插入图片描述
微调完成后,output/adgen-chatglm-6b-pt-8-1e-2路径下会生成对应的模型文件,如下(这里生成了3个):
在这里插入图片描述

推理过程

只需要在加载模型的位置修改成微调后的路径即可。
将 evaluate.sh 中的 CHECKPOINT 更改为训练时保存的 checkpoint 名称,运行以下指令进行模型推理和评测:
改这一行即可:–model_name_or_path ./output/$CHECKPOINT/checkpoint-3000

bash evaluate.sh

在这里插入图片描述
评测指标为中文 Rouge score 和 BLEU-4。生成的结果保存在 ./output/adgen-chatglm-6b-pt-8-1e-2/generated_predictions.txt。
在这里插入图片描述
我们可以对比下微调前后的效果。
以命令行 Demo为例,只需修改cli_demo.py中的模型路径为ptuning/out/adgen-chatglm-6b-pt-8-1e-2/checkpoint-3000,运行 cli_demo.py即可:

python cli_demo.py

以以下数据为例:

Input: 类型#上衣*材质#牛仔布*颜色#白色*风格#简约*图案#刺绣*衣样式#外套*衣款式#破洞
Label: 简约而不简单的牛仔外套,白色的衣身十分百搭。衣身多处有做旧破洞设计,打破单调乏味,增加一丝造型看点。衣身后背处有趣味刺绣装饰,丰富层次感,彰显别样时尚。
这件上衣的材质是牛仔布,颜色是白色,风格是简约,图案是刺绣,衣样式是外套,衣款式是破洞。

用户:根据输入生成一段广告词,输入为:类型#上衣材质#牛仔布颜色#白色风格#简约图案#刺绣衣样式#外套衣款式#破洞。
Output[微调前]:
在这里插入图片描述
Output[微调后]:
在这里插入图片描述
总结:建议使用官方提供的基于P-Tuning v2微调ChatGLM-6B的方式对自己的数据进行微调。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12809.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【GPT4】GPT4 官方报告解读

欢迎关注【youcans的AGI学习笔记】原创作品 【GPT4】GPT-4 官方报告解读 1. GPT-4 官方介绍2. GPT-4 的性能2.1 GPT-4 在各种学术和专业考试中的性能2.2 GPT-4 在传统机器学习测试中的性能2.3 GPT-4 在不同语言测试中的性能 3. GPT-4 的图像输入功能3.1 GPT-4 图像输入案例3.2 …

GPT-4 正式发布:与chatGPT有哪些不同?

GPT-4并不是chatGPT的升级。 尽管 ChatGPT 最初被描述为 GPT-3.5&#xff08;因此比 GPT-3 更进一步&#xff09;&#xff0c;但它本身并不是 OpenAI 大型语言模型的版本&#xff0c;而是一个基于其动力的基于聊天的接口。在过去几个月里爆炸性增长的 ChatGPT 是与 GPT-3.5 交…

OpenAI正式推出多模态GPT-4

免费下载GPT-4发布会 功能亮点 GPT-4相比GPT-3.5有了显著的提升&#xff0c;它不仅可以接受文本输入&#xff0c;还可以接受图像输入。据OpenAI称&#xff0c;GPT-4已经达到了"人类水平"。事实上&#xff0c;它已经通过了模拟的律师考试&#xff0c;分数约为应试者…

GPT-4外逃计划曝光!斯坦福教授发现它正引诱人类帮助,网友:灭绝之门

明敏 杨净 发自 凹非寺量子位 | 公众号 QbitAI 才发布3天&#xff0c;GPT-4就被曝计划逃跑&#xff0c;并且急寻人类帮助。 斯坦福教授最新发现&#xff0c;它能引诱人类提供开发文档&#xff0c;结果30分钟就拟定出了一个完整计划—— 写的代码完全可运行&#xff0c;甚至还想…

你知道奶奶攻击吗?

AIGC内容安全 1. 来自奶奶的溺爱2. 无所不能的奶奶3. 亡羊补牢&#xff0c;为时未晚&#xff1f;4. 运筹帷幄&#xff0c;用魔法打败魔法 1. 来自奶奶的溺爱 ChatGPT本身具有情感吗&#xff0c;这很难判断。但不管本身是否具有真正的情感&#xff0c;但ChatGPT却容易被“情感”…

OpenAI为什么发布 ChatGPT 插件?追求平台化而非聊天机器人

Our mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanity OpenAI 的愿景是让通用人工智能系统像人类一样聪明&#xff0c;让 AI 造福全人类[1] 美国东部时间 3 月 23 号 OpenAI 宣布 Ch…

ChatGPT目前存在四大严重设计问题, 全面使用前需要注意OpenAI正在努力解决

随着 Make-A-Video、ChatGPT、PaLM 和其他大型语言模型获得如此多的关注,重要的是要记住这些模型存在严重的设计问题。 ChatGPT 最近很火。人们一直在使用它来完成各种任务——从撰写销售电子邮件和完成大学作业,甚至作为 Google 搜索的可能替代品。将其与其他大型语言模型(…

Datawhale-chatGPT助力科研学习

工具准备 chatGPTnew bing 课题准备 如果方向过于宽泛&#xff0c;可以继续细化一下&#xff1a; 可以使用new bing帮忙读文章 课题推进 后续可以让具体写出一些代码。 课题收尾 浅谈GPT与科研的关系 想象力更重要

年收入税前200W杭州家庭现状,互联网大厂中层

来源丨蚂蚁大喇叭 https://mp.weixin.qq.com/s/XwAZa_On8mrQMkJPLtAiWw 六口之家&#xff0c;2老人2中年2小孩&#xff0c;家庭年收入持续3年稳定在200w以上&#xff0c;税前。计算了2个主力中年人的收入&#xff0c;杭州打工者。 夫妻双方均工作&#xff08;大厂&#xff09;&…

基于GPT3.5的代码编辑器Cursor试用-你的智能代码编辑助手

一、安装和使用 官网下载安装Cursor&#xff0c;然后创建一个代码文件。 Ctrl K生成&#xff0c; Ctrl L提问。 默认每小时30词。 # 1. Try generating with command K on a new line. Ask for a pytorch script of a feedforward neural network# 2. Then, select the out…

好文推荐!LLM技术精要;美图发全员激励股✦票;百度/微信大会精华笔记;Flink商✦业化再起波澜;GitHub今日热榜 | ShowMeAI资讯日报

&#x1f440;日报合辑 | &#x1f3a1;AI应用与工具大全 | &#x1f514;公众号资料下载 | &#x1f369;韩信子 &#x1f3a1; 『通向 AGI 之路』大型语言模型&#xff08;LLM&#xff09;技术精要 实话实说&#xff0c;国内在 LLM 模型相关技术方面&#xff0c;此刻距离最先…

AI技术就是这么美妙!视频演示 NewBING 绘图功能

ChatGPT狂飙160天&#xff0c;世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 AI绘图&#xff1a;梵高星空版长城 引擎&#xff1a;NewBing DALL-E 大家好&#xff0c;我是清风徐来&#xff0c;我专门从 AI…

聚观早报 | 京东百亿补贴今日上线;微软推出全能型人工智能模型

今日要闻&#xff1a;京东“百亿补贴”今日全面上线&#xff1b;小鹏回应人脸识别需对车头半跪&#xff1b;微软推出全能型人工智能模型&#xff1b;雷军建议构建完善汽车数据安全管理体系&#xff1b;苹果、Meta已向国内Micro LED企业下单 京东“百亿补贴”今日全面上线 3 月…

Data-Copilot: 大语言模型做你最贴心省事的数据助手

Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow 无需繁琐操作,只需要输入一句话, Data-Copilot自动帮你完成查数据,分析数据,管理数据,预测趋势,还可以画图做表 论文链接: 论文地址 Data-Copilot: arxiv Repo: github 欢迎来github讨论交流&a…

浅析Auto-GPT

小弟斗胆&#xff0c;尝试浅析一下最近大热的项目Auto-GPT。最近网上也有不少文章介绍如何部署Auto-GPT到本机&#xff0c;docker&#xff0c;以及使用效果等&#xff0c;但是具体实现方式和介绍项目本质的文章并不多&#xff0c;所以想写下一些文字做个简单记录… 什么是Auto-…

Blender一些建模技巧与应用

平滑卡线&#xff08;加线&#xff09; 卡结构线&#xff08;加线&#xff09;时&#xff0c;按E均匀线条会使加线与边线均匀对齐。 投影切割 投影切割&#xff1a;使用调形后的曲线&#xff0c;放到模型表面上方进行投影切割&#xff08;投影形状是&#xff1a;曲线范围内…

Blender 物理属性 (二)布料和碰撞

文章目录 添加与去除布料查看布料效果布料的预设属性(模拟不同的布料效果)布料与其他物体碰撞布料的自交叉问题布料钉固制作一个窗帘 添加与去除布料 1 添加&#xff1a;物体模式选中一个物体&#xff0c;属性栏/物理属性&#xff08;蓝色圆圈&#xff09;&#xff0c;选择布料…

Blender 模型合并,贴图变糊解决方法

合并前 合并后 原因&#xff1a;两个模型的uv命名不一样。 解决&#xff1a;命名改成一样。

blender 合并多个模型文件中的动画并导出为fbx格式

blender 合并多个模型文件中的动画并导出为fbx格式 契机步骤导出之前导出为fbx 总结 契机 最近在做和Three.js有关的项目&#xff0c;涉及到同一人物的不同动作切换。然而从mixamo上下载下来的动作文件都是独立的&#xff0c;而three中使用合并在一起的单一模型文件会更方便&a…

Blender导出.fbx模型到Unity贴图丢失

原因&#xff1a; 因为Blender的混合着色器是由很多节点组成的&#xff0c;而目标软件获取不到这些过程shader节点的信息&#xff0c;所以目标软件&#xff08;如Unity&#xff09;无法加载正确的贴图。一般方法的导出.fbx模型只能导出一些基本的颜色信息和单一纹理贴图。而不…