训练自己的ChatGPT(ChatGLM微调 )

目录

准备

操作

上传数据数据

训练进度

推理

验证

异常处理

总结

参考资料


ChatGLM微调 ptuning

准备

接上文https://blog.csdn.net/dingsai88/article/details/130639365

部署好ChatGLM以后,对它进行微调

操作

如果已经使用过 API 或者web模式的应该已经下载过,不用再下载

​
pwd/mnt/workspace/git clone https://github.com/THUDM/ChatGLM-6B​

上传数据数据

pwd

/mnt/workspace/ChatGLM-6B/ptuning

方法1自己的数据:

mkdir AdvertiseGen

cd AdvertiseGen

上传 dev.json 和 train.json  到

/mnt/workspace/dev.json /mnt/workspace/ChatGLM-6B/ptuning/AdvertiseGen/

数据内容都是:数据量太多训练太慢

{"content": "你是谁", "summary": "你好,我是赛赛的朋友晨晨,江湖人称细哥。"}

{"content": "晨晨", "summary": "帅的一批"}

方法2:官网提供的方法:

准备训练的数据:下载地址会变

从 Google Drive 或者 Tsinghua Cloud 下载处理好的 ADGEN 数据集,将解压后的 AdvertiseGen 目录放到本目录下。

https://github.com/THUDM/ChatGLM-6B/blob/main/ptuning/README.md

https://cloud.tsinghua.edu.cn/f/b3f119a008264b1cabd1/?dl=1

 

https://cloud.tsinghua.edu.cn/f/b3f119a008264b1cabd1/?dl=1curl   -O https://cloud.tsinghua.edu.cn/seafhttp/files/xxxxxx/AdvertiseGen.tar.gztar -zxvf AdvertiseGen.tar.gz

训练
P-Tuning v2

pwd/mnt/workspace/ChatGLM-6B/ptuning安装依赖pip install fastapi uvicornvi train.sh删除(走128默认值)   --quantization_bit 4开始训练bash train.sh

训练进度

查看GPU使用

watch -n 0.5 nvidia-smi

 

查看进度

 

推理

pwd

/mnt/workspace/ChatGLM-6B/ptuning

vi evaluate.sh删除(走128默认值)   --quantization_bit 4bash evaluate.sh

验证

pwd

/mnt/workspace/ChatGLM-6B/ptuning

路径:

/mnt/workspace/ChatGLM-6B/ptuning/output/adgen-chatglm-6b-pt-128-2e-2/checkpoint-3000

Python


import os
import torch
from transformers import AutoConfig, AutoModel, AutoTokenizer
CHECKPOINT_PATH = "./output/adgen-chatglm-6b-pt-128-2e-2/checkpoint-3000"
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)config = AutoConfig.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, pre_seq_len=128)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", config=config, trust_remote_code=True).cuda()
prefix_state_dict = torch.load(os.path.join(CHECKPOINT_PATH, "pytorch_model.bin"))
new_prefix_state_dict = {}
for k, v in prefix_state_dict.items():if k.startswith("transformer.prefix_encoder."):new_prefix_state_dict[k[len("transformer.prefix_encoder."):]] = v
model.transformer.prefix_encoder.load_state_dict(new_prefix_state_dict)print(f"Quantized to 128 bit")
model = model.quantize(128)
model = model.half().cuda()
model.transformer.prefix_encoder.float()
model = model.eval()
response, history = model.chat(tokenizer, "你是谁", history=[])
print("ChatGLM-6B:\n",response)

问题:你是谁

标准答案:

我是一个名为 ChatGLM 的人工智能助手,是清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型。我的任务是针对用户的问题和要求提供适当的答复和支持。

 

微调后的答案

你好,我是赛赛的朋友晨晨,江湖人称细哥。

 

异常处理

异常1:

RuntimeError: CUDA Error: no kernel image is available for execution on the device

RuntimeError: CUDA Error: no kernel image is available for execution on the device>>> model = model.quantize()╭─────────────────────────────── Traceback (most recent call last) ────────────────────────────────╮│ in <module>:1                                                                                    │╰──────────────────────────────────────────────────────────────────────────────────────────────────╯TypeError: quantize() missing 1 required positional argument: 'bits'model = model.quantize(4)改成model = model.quantize(128)

异常2:

root@eais-bjtryzm9xivr28qvprxr-7c8cfdfd44-2j4rx:/mnt/workspace/ChatGLM-6B/ptuning# bash train.sh

Traceback (most recent call last):

  File "main.py", line 29, in <module>

    from rouge_chinese import Rouge

ModuleNotFoundError: No module named 'rouge_chinese'

 安装依赖解决 : pip install rouge_chinese nltk jieba datasets

异常3:

 RuntimeError: CUDA Error: no kernel image is available for execution on the device

“调整 quantization_bit 来被原始模型的量化等级,不加此选项则为 FP16 精度加载”

bash train.shcp   train.sh train_bak.shvi train.sh删除   --quantization_bit 4

异常4:

pip install cpm_kernels

ImportError: This modeling file requires the following packages that were not found in your environment: cpm_kernels. Run `pip install cpm_kernels`

pip install cpm_kernels

总结

  1. 官网写的都很清楚了。
  2. GPU特别影响计算时间,算力不够的小伙伴先训练几条看看流程是否通畅。

参考资料

ChatGLM-6B/README.md at main · THUDM/ChatGLM-6B · GitHub

https://blog.csdn.net/dingsai88/article/details/130639365

https://betheme.net/dashuju/127318.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9289.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

试用ChatGPT一段时间后

最近半年&#xff0c;互联网一款现象级的应用诞生&#xff1a;「ChatGPT」&#xff1b; 其火爆的程度&#xff0c;不输前面的羊了个羊&#xff1b; 最初了解到ChatGPT还是春节的时候&#xff0c;但那时网上的测评还没引起足够的好奇心&#xff1b; 对于纯文本式的聊天&#…

写博客一个月,我收获了什么?送你 3 条为什么要坚持写技术博客的理由!

写博客一个月&#xff0c;我收获了什么&#xff1f;给你 3 条为什么要坚持写技术博客的理由&#xff01; 前言 大家好&#xff0c;我是「周三不Coding」。 工作休息之余&#xff0c;翻了翻博客&#xff0c;发现自己已经坚持写博客一个月了&#xff0c;输出了 20 篇左右的技术…

2023.3.6-3.12 AI行业周刊(第140期):AI视觉算法开发平台

17年的时候&#xff0c;开始业余时间探索互联网方向。比如淘宝、自媒体、微信公众号等。 当时偶然之间关注到一个苏州90后的小伙&#xff0c;网名叫刘大猫&#xff0c;开始在博客上分享自己互联网创业的过程。 从上大学开始&#xff0c;通过SEO、网站等方式&#xff0c;获取海…

这是什么神仙操作!为了自证清白,车主竟安装刹车记录仪

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近年来&#xff0c;新能源汽车赛道的发展速度明显加快。作为新能源汽车巨头的特斯拉也总是处于风口浪尖&#xff0c;特斯拉汽车事故层出不穷&#xff0c;不少车主也因此走上漫漫维权之路。 电商平台上线特斯拉脚部专用记录仪…

python怎么自学

其实0基础选择python学习入行的不在少数&#xff0c;Python近段时间一直涨势迅猛&#xff0c;在各大编程排行榜中崭露头角&#xff0c;得益于它多功能性和简单易上手的特性&#xff0c;让它可以在很多不同的工作中发挥重大作用。 正因如此&#xff0c;目前几乎所有大中型互联网…

ChatGPT带火了一个新职业,年薪200W+

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID&#xff1a;jishulingdaoli) 吃着火锅聊着天就把钱赚了&#xff0c;年薪还能高达33万美刀&#xff0c;你敢信吗&#xff1f;不用怀疑&#xff0c;除了“吃着火锅”这四个字是玩梗&#xff0c;其它全是真的。这个负责“聊天”的活儿…

又来一个神器!如何用ChatGPT帮你自动对excel数据进行分析和挖掘!

&#xff08;永久免费&#xff0c;扫码加入&#xff09; 大家好&#xff0c;我是菜哥&#xff01;欢迎关注我的频道。 前面我们介绍过很多chatgpt的插件&#xff0c;有兴趣的同学可以翻一翻我们的历史文章。我们会员群里面也详细整理了45篇干货。今天我们来介绍一款神器&#x…

分红十亿?!羊了个羊公司清仓式分红,程序员做游戏到底有多赚钱?

昨日&#xff0c;羊了个羊小游戏又再度登上了热搜&#xff0c;此次却和其难度没有关系&#xff0c;而是因其背后公司的分红有关。 在26日晚间&#xff0c;吉比特&#xff08;603444&#xff09;发布三季报&#xff0c;公司前三季度实现营业收入38.3亿元&#xff0c;同比增长9.8…

腾讯员工平均月薪高达8.5万元,过来人教你普通人如何进大厂

互联网大厂又又又上热搜了&#xff01; 昨日#腾讯员工平均月薪达8.54万元#的词条登上了热搜第一&#xff0c;点进去看发现&#xff0c;是腾讯发布了 2022 年度第二季度财报。 财报中&#xff0c;除了腾讯的整体数据外&#xff0c;还有一个数据让广大网友吃惊&#xff0c;虽然…

提示工程师最全秘籍来了!论文工具用例应有尽有,GitHub星标破万,年入百万不是梦...

白交 发自 凹非寺量子位 | 公众号 QbitAI 提示工程师的最强辅助来了&#xff01; 这不&#xff0c;Meta前工程师搞了份全面指南&#xff0c;星标飙升破万。 最新论文、工具、常见用例、讲座数据集应有尽有~还包括一些最新提示技术总结&#xff0c;比如主动提示、定向刺激提示等…

老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用

上一篇&#xff1a;30岁硕士拿100万在云南开启“吃利息躺平式养老” 现在年轻人在怎样规划养老&#xff1f; 做Excel表&#xff0c;真就动动嘴就够了&#xff01; 看&#xff0c;输入想要干的事&#xff1a;给学生成绩排个名吧。 简单敲个回车&#xff0c;表格唰一下就列好了&a…

机会来了!小白想搞自动驾驶不要错过这个平台

人工智能不断进步&#xff0c;经常有新的技术进展登上头条&#xff0c;比如最近大火的扩散模型、ChatGPT等&#xff0c;但最让人兴奋且将深刻改变世界的&#xff0c;无疑还是自动驾驶。 相信很多搞技术开发的也很兴奋&#xff0c;毕竟每一个新的趋势&#xff0c;也都代表着新的…

AI在劳动节淘汰7800打工人,永久的

&#x1f447;&#x1f447;关注后回复 “进群” &#xff0c;拉你进程序员交流群&#x1f447;&#x1f447; 来源丨量子位&#xff08;ID&#xff1a;QbitAI&#xff09; 丰色 萧箫 发自 凹非寺 https://mp.weixin.qq.com/s/crPVttsbyYWhBdRyWYSNDA “这不是演习&#xff0c;…

微信:有零钱的微信号不会被系统注销;拼多多旗下 Temu 在美起诉 Shein;Rust 1.71.0 发布|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

一周 AIGC 丨国内掀起大模型军备竞赛,第一季度推出超 150 个 AI 聊天机器人

国内互联网圈好久没有这么热闹了&#xff0c;要感谢漂洋过海的 ChatGPT。它让互联网大厂意识到&#xff0c;除了和小区门口卖菜的大妈争夺流量&#xff0c;原来还有更有意义的事情可做&#xff0c;于是一股脑扎进来掀起大模型军备竞赛。它还让隐退的互联网大佬重新出山&#xf…

ShowMeAI周刊 | AI独立开发者:帆船旅行但月入万刀;创业吧!新黄金时代来了;资本看好哪些创业方向;被AI震麻的一周again

这是ShowMeAI周刊的第8期。聚焦AI领域本周热点&#xff0c;及其在各圈层泛起的涟漪&#xff1b;拆解AI独立开发者的盈利案例&#xff0c;关注中美AIGC的创业者们&#xff0c;并提供我们的商业洞察。欢迎关注与订阅&#xff01; | &#x1f440;日报&周刊合辑 ⌛ 『Danielle…

互联网晚报 | 三星超过苹果成手机市场份额第一;特斯拉回应中国内地市场降价传闻;ChatGPT或会暴露企业机密信息...

苹果手机失去市场份额第一&#xff0c;2023年第一季度被三星反超 调研机构Canalys发布了2023年第一季度的全球智能手机市场报告&#xff0c;该季度同比继续下跌12%&#xff0c;是连续第五个季度出现下跌。三星是头部厂商中唯一实现环比增长的厂商&#xff0c;以22%的市场份额重…

亚马逊云科技re:Invent:实现数据普惠,让数据服务更好用

数字经济时代&#xff0c;数据普惠是一大未来的方向。让数据助力实现创新价值&#xff0c;而这些价值不止于企业&#xff0c;更在于整个行业甚至是社会。 亚马逊云科技预计到2029年&#xff0c;人工智能劳动力将增加100万个工作岗位&#xff0c;但培养合适的技能和人选来填补这…

何恺明被曝回归学术界!网友:要成为MIT引用最高的人了...

点击下方卡片&#xff0c;关注“CVer”公众号 AI/CV重磅干货&#xff0c;第一时间送达 点击进入—>【计算机视觉】微信技术交流群 梦晨 Alex 发自 凹非寺 转载自&#xff1a;量子位&#xff08;QbitAI&#xff09; AI大牛何恺明有了最新动向&#xff0c;而且是回归学术界。 …

李开复:迎战ChatGPT,这20种“金饭碗”工作最能打!

作者&#xff1a;李开复老师 我的上一篇文章“ChatGPT引发失业恐慌&#xff1f;这20种工作要避开&#xff01;”谈到了或被AI取代的20种工作&#xff0c;包括了电话销售、客户服务、仓库搬运、电话接线等简单重复的流程性工作。 这份“后ChatGPT时代”的人类职业消亡清单里&…