LLaMA Factory多卡微调的实战教程（持续更新）

LLaMA Factory多卡微调的实战教程（持续更新）

news/2024/12/24 20:39:31/文章来源:https://blog.csdn.net/herosunly/article/details/139633709

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

本文主要介绍了LLaMA Factory多卡微调的实战教程（持续更新），希望对学习大语言模型的同学们有所帮助。需要说明的是，本篇是LLaMA Factory发生重大更新后的迭代版本，所以会持续进行更新。

文章目录

1. 前言
2. 配置环境
- 2.1 安装虚拟环境
- 2.2 安装依赖库
- 2.3 模型选型与下载
- 2.4 配置多卡环境
3. 运行代码
- 3.1 构建训练数据
- 3.2 修改配置文件
- 3.3 微调
- - 3.3.1 zero3微调
  - 3.3.2 启动API
  - 3.3.3 模型测试

1. 前言

在之前博客中介绍了LLaMA Factory单机微调的实战教程，但模型参数量大了以后，必须就要使用多卡进行微调和训练了。尤其最近新出了几个效果很不错的开源大模型，比如Qwen 2-72B-Chat、Qwen1.5-72B-Chat、Command R+(104B)，所以即使是A100 80G，也需要多卡进行微调。

一般来说，是使用deepspeed进行多卡微调的。但是配置环境却并不是那么一帆风顺的。为了帮助同学们加快多卡微调的进度，最终将逐步的操作过程总结如下。希望能对遇到同样需求的同学们有所帮助。

在这里插入图片描述

2. 配置环境

需要说明的是以下两点：

本文是在Centos 7+C

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/352886.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

多协议接入/GB28181/GAT1400协议/安防综合管理系统EasyCVR报错version`GLIBCXX_3.4.19‘not found如何处理？

多协议接入/GB28181/GAT1400协议/安防综合管理系统EasyCVR报错version`GLIBCXX_3.4.19‘not found如何处理？

多协议接入/GB28181/GAT1400协议/安防综合管理系统EasyCVR视频汇聚平台能在复杂的网络环境中，将前端设备统一集中接入与汇聚管理。智慧安防/视频存储/视频监控/视频汇聚EasyCVR平台可以提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、…

阅读更多...

树莓派4B学习笔记7：(Python)_TTL串口收发数据_

树莓派4B学习笔记7：(Python)_TTL串口收发数据_

今日继续学习树莓派4B 4G：（Raspberry Pi，简称RPi或RasPi） 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1： 今日尝试使用树莓派的TTL串口进行收发数据： …

阅读更多...

吴恩达2022机器学习专项课程C2W3：2.25 理解方差和偏差（诊断方差偏差正则化偏差方案搭建性能学习曲线）

吴恩达2022机器学习专项课程C2W3：2.25 理解方差和偏差（诊断方差偏差正则化偏差方案搭建性能学习曲线）

目录引言名词替代影响模型偏差和方差的因素1.多项式阶数2.正则化参数判断是否有高偏差或高方差1.方法一：建立性能基准水平2.方法二：建立学习曲线解决线性回归高偏差或高方差解决神经网络的高偏差或高方差1.回顾机器学习问题2.神经网络高方差和高偏差3…

阅读更多...

【数据结构】第十六弹---C语言实现希尔排序

【数据结构】第十六弹---C语言实现希尔排序

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】【C详解】目录 1、希尔排序( 缩小增量排序 ) 1.1、预排序实现 1.2、希尔排序代码实现 1.3、代码测试 1.4、时空复杂度分析 1.5、性能比较总结上一弹我们…

阅读更多...

【达梦数据库】typeorm+node.js+达梦数据库返回自增列值

【达梦数据库】typeorm+node.js+达梦数据库返回自增列值

1.配置环境，下载依赖包 typeorm init --name test22 --database mysql typeorm-dm，uuid,typeorm2,修改连接信息修改src/ data-source.ts 文件连接dm，可参考刚刚安装typeorm-dm 模块中的 README.md 3.修改自增信息 /* 修改前*/PrimaryGen…

阅读更多...

后端常见问题解答-位运算实际场景讲解

后端常见问题解答-位运算实际场景讲解

位运算在计算机存储的世界中，一切都是二进制的，位运算就是对二进制位进行操作的一种运算。位运算是计算机中的一种常见运算，可以用来提高性能和提升代码的可读性。位运算有很多种，比如与、或、非、异或等，这些运算…

阅读更多...

Docker中部署Jenkins+Pipline流水线基础语法入门

Docker中部署Jenkins+Pipline流水线基础语法入门

场景 DockerCompose中部署Jenkins（Docker Desktop在windows上数据卷映射）： DockerCompose中部署Jenkins（Docker Desktop在windows上数据卷映射）-CSDN博客 DockerComposeJenkinsPipeline流水线打包SpringBoot项目(解…

阅读更多...

Linux时间子系统6：NTP原理和Linux NTP校时机制

Linux时间子系统6：NTP原理和Linux NTP校时机制

一、前言上篇介绍了时间同步的基本概念和常见的时间同步协议NTP、PTP，本篇将详细介绍NTP的原理以及NTP在Linux上如何实现校时。二、NTP原理介绍 1. 什么是NTP 网络时间协议（英语：Network Time Protocol，缩写：NTP&a…

阅读更多...

【docker入门】

【docker入门】

在软件开发过程中，环境配置是一个至关重要的步骤，它不仅影响开发效率，也直接关联到软件的最终质量。正确的环境配置可以极大地减少开发中的潜在问题，提升软件发布的流畅度和稳定性。以下是几个关键方面，以及如何优化环…

阅读更多...

编写一个简单的Mybatis插件

编写一个简单的Mybatis插件

1.编写一个类，实现Intercepter这个接口 2.完成这个类的方法，并通过注解Intercepts来告诉Mybatis这个插件拦截哪个类和哪个方法 3.在Mybatis的全局配置文件里注册这个插件，让插件生效 4.玩一个实际功能的插件

阅读更多...

MySQL 示例数据库大全

MySQL 示例数据库大全

前言： 我们练习 SQL 时，总会自己创造一些测试数据或者网上找些案例来学习，其实 MySQL 官方提供了好几个示例数据库，在 MySQL 的学习、开发和实践中具有非常重要的作用，能够帮助初学者更好地理解和应用 MySQL 的各种功…

阅读更多...

树莓派4B学习笔记8：开机自启动Python脚本_kill关闭后台脚本

树莓派4B学习笔记8：开机自启动Python脚本_kill关闭后台脚本

今日继续学习树莓派4B 4G：（Raspberry Pi，简称RPi或RasPi） 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1： 紧接着上篇文章学习的串口通信,今日学习如何让树莓派开机…

阅读更多...

使用MyBatisPlus让数据库和实体类字段自动映射

使用MyBatisPlus让数据库和实体类字段自动映射

文章目录使用MyBatisPlus让数据库和实体类字段自动映射需求场景假如没有映射把映射放到sql语句中使用MyBatisPlus提供的注解简化映射使用MyBatisPlus让数据库和实体类字段自动映射需求场景数据库表中的字段名字，与实体类中的属性名字不一致，我们想…

阅读更多...

【Linux】进程间通信2——命名管道

【Linux】进程间通信2——命名管道

1. 命名管道(FIFO) 1.1. 基本概念简单，给匿名管道起个名字就变成了命名管道那么如何给匿名管道起名字呢？ 结合文件系统，给匿名管道这个纯纯的内存文件分配 inode，将文件名与之构建联系，关键点在于不给它分配 D…

阅读更多...

618数码好物清单，这些好物你不容错过

618数码好物清单，这些好物你不容错过

每次的618大促中，有各类数码产品纷纷亮相，让人眼花缭乱，而且打折的力度都很高，那么在这个充满诱惑的购物季里，哪些电子数码好物值得你入手呢？今天，我就一起给题主盘点那些实用至上、绝对不吃灰的…

阅读更多...

RT-Thread-Nano使能动态内存Heap后，程序无法运行

RT-Thread-Nano使能动态内存Heap后，程序无法运行

RT-Thread-Nano移植 1. 动态内存堆1.1 问题1.2 解决 3. 问题根源 1. 动态内存堆 1.1 问题按照官方文档：在 RT-Thread Studio 上使用 RT-Thread Nano，新建nano工程后，可以正常运行。但是开启内存管理后，系统无法正常启动&…

阅读更多...

Docker高级篇之轻量化可视化工具Portainer

Docker高级篇之轻量化可视化工具Portainer

文章目录 1. 简介2. Portainer安装 1. 简介 Portianer是一款轻量级的应用，它提供了图形化界面，用于方便管理Docker环境，包括单机环境和集成环境。 2. Portainer安装官网：https://www.portainer.io 这里我们使用docker命令安装&…

阅读更多...

三分钟了解链动3+1模式

三分钟了解链动3+1模式

在电商领域的营销策略中，链动31模式以其独特的魅力和优势，吸引了众多商家的目光。下面，我们将对这一模式进行深度剖析，并探讨其相较于链动21模式的优势所在。一、身份设置与奖励机制链动31模式在身份设置上分为三种&#xff1…

阅读更多...

C#观察者模式应用

C#观察者模式应用

目录一、什么是观察者模式二、C#中观察者模式的实现三、两种实现的用法 1、事件与委托 2、IObserver和IObservable 四、参考文献一、什么是观察者模式观察者（Observer）模式的定义：指多个对象间存在一对多的依赖关系，当…

阅读更多...

C++: shared_ptr是线程安全的吗

C++: shared_ptr是线程安全的吗

导读 C面试中有时会有这样一个问题，shared_ptr是线程安全的吗？对此问题，我们需要从三个并发场景进行考虑，拷贝shared_ptr的安全性、对shared_ptr赋值的安全性和读写shared_ptr指向内存区域的安全性。对于以上问题，首…

阅读更多...

最新文章

推荐文章