大模型微调实战项目总结(非常详细)零基础入门到精通,收藏这一篇就够了

写在前面

不知不觉之间,距开源ChatGLM-Finetuning项目已经过去了8个月。大模型也在飞速的发展,开源社区也是越来越活跃,开源模型越来越多。

中间更新过一次,将代码重构让大家更容易理解,本次更新主要增加ChatGLM3模型和增加模型预测代码。

Github: https://github.com/liucongg/ChatGLM-Finetuning

为什么要再次更新呢?

  • 支持ChatGLM3模型是为了让这个项目有一个更好的延续,如果后面有ChatGLM4的话,还会继续更新。

  • 细心的朋友应该可以发现本项目的训练数据构造代码,是参考每个模型在chat部分数据构造进行编写的。所以用本项目训练完的模型,预测阶段用model.chat即可。这也是为什么上一次更新没有提供predict代码的原因。

本项目的宗旨,还是带领大家入门学习,带领大家用不同方式的微调(Freeze方法、Lora方法、P-Tuning方法和全量参数)来进行大模型微调实验,欢迎大家Star。

PS:本项目应该不会增加其他系列模型了,如果做的话也是重开一个新的项目,后面争取在该项目上补充增加一些注释内容,帮助更多的初学者或者非专业人员理解代码吧。

项目介绍

本项目主要针对ChatGLM、ChatGLM2和ChatGLM3模型进行不同方式的微调(Freeze方法、Lora方法、P-Tuning方法、全量参数等),并对比大模型在不同微调方法上的效果,主要针对信息抽取任务、生成任务、分类任务等。

本项目支持单卡训练&多卡训练,由于采用单指令集方式微调,模型微调之后并没有出现严重的灾难性遗忘。

由于官方代码和模型一直在更新,目前ChatGLM1和2的代码和模型的为20230806版本(注意如果发现代码运行有误,可将ChatGLM相关源码替换文件中的py文件,因为可能你下的模型版本与本项目代码版本不一致),ChatGLM3是版本20231212。

PS:没有用Trainer(虽然Trainer代码简单,但不易修改,大模型时代算法工程师本就成为了数据工程师,因此更需了解训练流程)

更新简介

  • update-2023.12.12 增加ChatGLM3代码支持,通过model_type完成模型切换,并增加推理代码。

  • update-2023.08.06 代码和模型已经更新到最新,支持单卡&多卡训练,支持ChatGLM2模型训练、支持全量参数训练,所有代码进行了结构增加可读性。

  • update-2023.06.12 增加流水线并行训练方法,请看v0.1 Tag

  • update-2023.04.18 增加文本生成任务评测,请看v0.1 Tag

  • update-2023.04.05 增加信息抽取任务评测,请看v0.1 Tag

微调方法

Freeze方法-ChatGLM3单卡训练

CUDA_VISIBLE_DEVICES=0 deepspeed --master_port 520 train.py \  --train_path data/spo_0.json \  --model_name_or_path ChatGLM3-6B/ \  --per_device_train_batch_size 1 \  --max_len 1560 \  --max_src_len 1024 \  --learning_rate 1e-4 \  --weight_decay 0.1 \  --num_train_epochs 2 \  --gradient_accumulation_steps 4 \  --warmup_ratio 0.1 \  --mode glm3 \  --train_type freeze \  --freeze_module_name "layers.27.,layers.26.,layers.25.,layers.24." \  --seed 1234 \  --ds_file ds_zero2_no_offload.json \  --gradient_checkpointing \  --show_loss_step 10 \  --output_dir ./output-glm3  

Ptuning方法-ChatGLM3单卡训练

CUDA_VISIBLE_DEVICES=0 deepspeed --master_port 520 train.py \  --train_path data/spo_0.json \  --model_name_or_path ChatGLM3-6B/ \  --per_device_train_batch_size 1 \  --max_len 1560 \  --max_src_len 1024 \  --learning_rate 1e-4 \  --weight_decay 0.1 \  --num_train_epochs 2 \  --gradient_accumulation_steps 4 \  --warmup_ratio 0.1 \  --mode glm3 \  --train_type ptuning \  --seed 1234 \  --ds_file ds_zero2_no_offload.json \  --gradient_checkpointing \  --show_loss_step 10 \  --pre_seq_len 16 \  --prefix_projection True \  --output_dir ./output-glm3  

Lora方法-ChatGLM3单卡训练

CUDA_VISIBLE_DEVICES=0 deepspeed --master_port 520 train.py \  --train_path data/spo_0.json \  --model_name_or_path ChatGLM3-6B/ \  --per_device_train_batch_size 1 \  --max_len 1560 \  --max_src_len 1024 \  --learning_rate 1e-4 \  --weight_decay 0.1 \  --num_train_epochs 2 \  --gradient_accumulation_steps 4 \  --warmup_ratio 0.1 \  --mode glm3 \  --lora_dim 16 \  --lora_alpha 64 \  --lora_dropout 0.1 \  --lora_module_name "query_key_value,dense_h_to_4h,dense_4h_to_h,dense" \  --seed 1234 \  --ds_file ds_zero2_no_offload.json \  --gradient_checkpointing \  --show_loss_step 10 \  --output_dir ./output-glm3  

全参方法-ChatGLM3四卡训练,通过CUDA_VISIBLE_DEVICES控制具体哪几块卡进行训练,如果不加该参数,表示使用运行机器上所有卡进行训练

CCUDA_VISIBLE_DEVICES=0,1,2,3 deepspeed --master_port 520 train.py \  --train_path data/spo_0.json \  --model_name_or_path ChatGLM3-6B \  --per_device_train_batch_size 1 \  --max_len 1560 \  --max_src_len 1024 \  --learning_rate 1e-4 \  --weight_decay 0.1 \  --num_train_epochs 2 \  --gradient_accumulation_steps 4 \  --warmup_ratio 0.1 \  --mode glm3 \  --train_type all \  --seed 1234 \  --ds_file ds_zero3_no_offload.json \  --gradient_checkpointing \  --show_loss_step 10 \  --output_dir ./output-glm3  

更多内容,请看Github。

AI大模型学习福利

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

四、AI大模型商业化落地方案

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/388960.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript (十)——JavaScript 比较 和 逻辑运算符

目录 JavaScript 比较 和 逻辑运算符 比较运算符 如何使用 逻辑运算符 条件运算符 语法 JavaScript 比较 和 逻辑运算符 比较和逻辑运算符用于测试 true 或者 false 比较运算符 比较运算符在逻辑语句中使用,以测定变量或值是否相等。 如何使用 可以在条件语…

【C++】模拟实现list

🦄个人主页:修修修也 🎏所属专栏:数据结构 ⚙️操作环境:Visual Studio 2022 目录 一.了解项目及其功能 📌了解list官方标准 了解模拟实现list 📌了解更底层的list实现 二.list迭代器和vector迭代器的异同 📌迭代…

tomcat配置(java环境配置)

继昨天上线商城系统 [rootstaticserver eleme_web]# cd /usr/local/nginx/conf [rootstaticserver conf]# ls fastcgi.conf koi-utf nginx.conf scgi_params.default fastcgi.conf.default koi-win nginx.conf.bak uwsgi…

采用GDAL批量波段运算计算植被指数0基础教程

采用GDAL批量波段运算计算植被指数0基础教程 1. 引言 在传统的遥感数据处理方法中,通常使用ArcGis或ENVI软件进行波段运算。然而,这些软件在处理大量数据时往往效率低下。有没有一种方法可以批量进行波段运算,一下子计算几十个植被指数&…

计算word文件打印页数 VBA实现

目录 场景复现环境说明实现原理计算当前文件夹下所有word文件页数总和利用递归计算当前文件夹所有work文件页面数量几个BUG计算结果软件报价后话 场景复现 最近需要帮我弟打印高考资料,搜集完资料去网上打印,商家发出了这个计算页数的界面。我就好奇怎么…

如何把视频语音转文字?交给这4款工具就完事

这两天巴黎奥运会的盛大开幕,世界各地的记者们纷纷涌入这个体育盛事的现场,带着他们的镜头和麦克风,捕捉每一个激动人心的瞬间。 然而,随着采访的深入,如何快速准确地将这些珍贵的视频内容转化为文字记录,…

C语言 | Leetcode C语言题解之第309题买卖股票的最佳时机含冷冻期

题目&#xff1a; 题解&#xff1a; int maxProfit(int* prices, int pricesSize) {if (pricesSize 0) {return 0;}int f0 -prices[0];int f1 0;int f2 0;for (int i 1; i < pricesSize; i) {int newf0 fmax(f0, f2 - prices[i]);int newf1 f0 prices[i];int newf2…

Linux 和 Unix 的关系

Linux 和 Unix 的关系 2.2.1unix 是怎么来的 2.2.2Linux 是怎么来的 GNU计划的另一个目的是构建自由的软件文化&#xff0c;以支持以无条件自由软件和开放源码程序这种文化理念为核心的一整套系统&#xff0c;来推动软件在世界范围内的普及及发展。其中包括支持点&#xff08;推…

海思Hi35XX系列(一)环境搭建与挂载

小白一个&#xff0c;新的开发板刚到手有点懵&#xff0c;之前没弄过没有经验&#xff0c;简单记录一下吧 一般买开发板都会给带一个已经配置好的虚拟机文件&#xff0c;直接使用就可以 一、下载安装虚拟机与镜像文件 VMware-workstation16.1.0 我的镜像文件是官方文档资料…

路径规划——广度优先搜索与深度优先搜索

路径规划——广度优先搜索与深度优先搜索 https://www.hello-algo.com/chapter_graph/graph_traversal/ 1.广度优先搜索 Breath-First-Search 在图论中也称为广度优先遍历&#xff0c;类似于树的层序遍历。 算法原理 从起始节点出发&#xff0c;首先访问它的邻近节点&…

Typora2024最新版破解方法(亲测可用)

此方法非常简单&#xff0c;无需安装dll补丁&#xff0c;无需修改注册表&#xff0c;无需使用老版本。仅需修改部分文件内容即可 方法步骤 步骤一 下载并安装Typora 安装Typora 打开官网 下载并安装最新版即可 点击访问Typora官网 https://typoraio.cn/ 步骤二 修改文件 …

C#编写多导联扫描式的波形图Demo

本代码调用ZedGraph绘图框架&#xff0c;自己先安装好ZedGraph环境&#xff0c;然后拖一个zedGraphControl控件就行了&#xff0c;直接黏贴下面代码 基本代码显示 using System; using System.Windows.Forms; using ZedGraph; using System.Timers;namespace ECGPlot {public…

Bugku-ctf-web

Simple_SSTI_1 1.启动场景&#xff0c;http://114.67.175.224:12592 2.页面提示传入参数flag&#xff0c;F12查看源码得到第二个提示 3.SECRET_KEY(秘钥)是Flask中重要的一个配置值&#xff0c;在这题&#xff0c;构造语句查看它&#xff0c;得到flag&#xff0c;也可以构造?…

python+selenium+unittest自动化测试框架

前言 关于自动化测试的介绍&#xff0c;网上已有很多资料&#xff0c;这里不再赘述&#xff0c;UI自动化测试是自动化测试的一种&#xff0c;也是测试金字塔最上面的一层&#xff0c;selenium是应用于web的自动化测试工具&#xff0c;支持多平台、多浏览器、多语言来实现自动化…

AGV系统设计解析:布局-车体-对接-数量计算-路径规划

AGV AGV是实现柔性制造、装配及自动化物流的关键设备之一&#xff0c;近几年来&#xff0c;随着各国智能制造政策的不断实施&#xff0c;促进了AGV产业的快速发展。 目前&#xff0c;AGV系统广泛应用于各个行业之中&#xff0c;比如物流行业、新能源行业、汽车行业、制药行业等…

Python爬虫入门02:Fiddler下载使用教程

文章目录 手机抓包全攻略&#xff1a;Fiddler 工具深度解析引言Fiddler 工具简介为什么选择 Fiddler&#xff1f; 安装与配置 Fiddler步骤一&#xff1a;下载与安装步骤二&#xff1a;配置浏览器代理步骤三&#xff1a;安装 HTTPS 证书 配置手机以使用 Fiddler步骤一&#xff1…

堆的创建和说明

文章目录 目录 文章目录 前言 小堆&#xff1a; 大堆&#xff1a; 二、使用步骤 1.创建二叉树 2.修改为堆 3.向上调整 结果实现 总结 前言 我们已经知道了二叉树的样子&#xff0c;但是一般的二叉树是没有什么意义的&#xff0c;所以我们会使用一些特殊的二叉树来进行实现&a…

码农职场:一本专为IT行业求职者量身定制的指南

目录 写在前面 推荐图书 推荐理由 写在后面 写在前面 本期博主给大家推荐一本专为IT行业求职者量身定制的指南&#xff1a;《码农职场》。 推荐图书 https://item.jd.com/14716160.html 内容简介 这是一本专为广大IT 行业求职者量身定制的指南&#xff0c;提供了从职前…

Netty 必知必会(四)—— Channel-Pipeline 责任链

一、责任链模式 适用场景: 对于一个请求来说&#xff0c;如果每个对象都有机会处理它&#xff0c;而且不明确到底是哪个对象会处理请求时&#xff0c;我们可以考虑使用责任链模式实现它&#xff0c;让请求从链的头部往后移动&#xff0c;直到链上的一个节点成功处理了它为止 …

python爬虫初识

一、什么互联网 互联网&#xff08;Internet&#xff09;是全球范围内最大的计算机网络&#xff0c;它将数以百万计的私人、公共、学术、商业和政府网络通过一系列标准通信协议&#xff08;如TCP/IP&#xff09;连接起来形成的一个庞大的国际网络。 互联网的起源可以追溯到196…