【极速版 -- 大模型入门到进阶】LORA：大模型轻量级微调

【极速版 -- 大模型入门到进阶】LORA：大模型轻量级微调

news/2025/4/1 7:16:55/文章来源:https://blog.csdn.net/CODE_RabbitV/article/details/146610839

文章目录

- 🌊 有没有低成本的方法微调大模型？
- 🌊 LoRA 的核心思想
- 🌊 LoRA 的初始化和 $r$ 的值设定
- 🌊 LoRA 实战：LoraConfig参数详解

论文指路：LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

🌊 有没有低成本的方法微调大模型？

2021年微软提出 LORA ：LOW-RANK ADAPTATION 低秩适配
- 【什么是秩？】一个矩阵的秩是指矩阵中线性独立的行或列的最大数目；也就是说 一个矩阵的秩越大，它包含的有效信息就越多

🌊 LoRA 的核心思想

LoRA通过优化在适应过程中 FC 层权重变化 ( $\Delta w \in \mathbb{R}^{m\times n}$ ) 的秩分解矩阵 ( $\in \mathbb{R}^{m\times r} \times B\in \mathbb{R}^{r\times n}$ )，来间接调整神经网络中部分层的权重 ( $w$ ) 。不修改预先训练好的权重，而是通过引入一个低秩的矩阵来实现对这些层的适应调整
- $\min(m,n)$

用更小的参数空间存储模型参数变化量 $\Delta w$
- $\Delta w$ ：模型参数变化量，也就是对原参数 $w$ 变化 $\Delta w$ 可以适配新任务。LoRA 用 A 和 B 计算获得模型参数变化量 $\Delta w$ ，叠加到原参数 $w$ 上

🌊 LoRA 的初始化和 $r$ 的值设定

用随机高斯分布初始化 $A$ ，用 0 矩阵初始化 $B$ , 保证训练的开始此旁路矩阵依然是 0 矩阵

对于一般的任务， $r = 1, 2, 4, ...$ 就足够了。而一些领域差距比较大的任务可能需要更大的 $r$

🌊 LoRA 实战：LoraConfig参数详解

目前 LORA 已经被 HuggingFace 集成在了 PEFT（Parameter-Efficient Fine-Tuning）代码库里
所以，使用也非常简单

from peft import get_peft_config, get_peft_model, LoraConfig, TaskType# preModel = ....from_pretrained(".. bert-base-uncased ..")  # 加载你的预训练模型peft_config = LoraConfig(r=4,  # LoRA 维数lora_alpha=8,  # ΔW 按 α / r 缩放target_modules=["", "", ...],  # 对哪些模块进行微调lora_dropout=0.1  # 默认值为 0
)
model = get_peft_model(preModel, peft_config)  # 预训练模型 -> 加好了 LoRA 之后的模型

参考资料: 【LoRA&CN全解析】, 【知乎高赞-大模型轻量级微调】

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/42789.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

初识MySQl · 内置函数

初识MySQl · 内置函数

目录前言： 日期类函数字符串函数数学类函数其他函数前言： 在前文的学习我们已经简单了解了部分函数，比如count()函数什么的，今天我们主要是笼统的学习一下MySQL中的函数，仅仅从使用的角度来学习&#xff0c…

阅读更多...

Python每日一题(7)

Python每日一题(7)

Python每日一题 2025.3.27 一、题目二、分析三、自己源代码四、deepseek答案五、源代码与ai分析一、题目 question["""编写程序,生成包含20个随机数的列表,然后将前十个元素升序排列,后10个元素降序排列,并输出结果""" ]二、分析今天本来写了…

阅读更多...

一些需要学习的C++库：CGAL和Eysshot

一些需要学习的C++库：CGAL和Eysshot

写在前面： 从开始工作到现在，去过多家公司，多个行业， 虽然大部分时间在通信业，但也有其它的行业的工作没有做完，但也很感兴趣。每次想要研究一下时，总是想不起来。这里写一些信息，…

阅读更多...

嵌入式linux系统中对应的文件锁详细实现方法

嵌入式linux系统中对应的文件锁详细实现方法

//文件锁：flock用于对文件加锁或者解锁但是只能产生建议性锁，并且同一个文件不会同时具有共享锁和互斥锁。第一：flock函数对应的要素头文件： #include <sys/file.h> 函数原型：int flock(int fd,int operation) 参数： fd:表示需要加锁文件的文件描述符 operati…

阅读更多...

WEB或移动端常用交互元素及组件 | Axure / 元件类型介绍（表单元件、菜单和表格、流程元件、标记元件）

WEB或移动端常用交互元素及组件 | Axure / 元件类型介绍（表单元件、菜单和表格、流程元件、标记元件）

文章目录引言I Axure / 元件类型介绍基本元件表单元件菜单和表格流程元件标记元件II Axure 基础Axure / 常用功能介绍Axure / 常用元素实例Axure / 动态交互实例Axure / 常用设计分辨率推荐III Axure / 创建自己的元件库元件库作用元件库的创建及使用引言 I Axure / 元件类型介…

阅读更多...

如何排查C++程序的CPU占用过高的问题

如何排查C++程序的CPU占用过高的问题

文章目录可能的原因程序设计的BUG系统资源问题恶意软件硬件问题通常步骤一个简单的问题代码在windows平台上如何排查Windows Process ExplorerWinDBG 在Linux平台如何排查使用TOP GDBPerf 可能的原因程序设计的BUG 有死循环低效算法与数据结构滥用自旋锁频繁的系统调用&a…

阅读更多...

19726 星际旅行

19726 星际旅行

19726 星际旅行 ⭐️难度：困难 🌟考点：Dijkstra、省赛、最短路问题、期望、2024 📖 📚 import java.util.*;public class Main {static int N 1005;static ArrayList<Integer>[] g new ArrayList[N]; // …

阅读更多...

vue3 + ant-design-vue4实现Select既可以当输入框也可以实现下拉选择

vue3 + ant-design-vue4实现Select既可以当输入框也可以实现下拉选择

近日工作中，遇到一个需求，就是select的有一个前置切换条件，有些条件需要时输入，有些条件需要时下拉选择，但是在切换的时候，后面的这个输入或者选择组件不能闪烁，于是也就只能采用select去实现&a…

阅读更多...

Unity UGUI - 六大基础组件

Unity UGUI - 六大基础组件

目录一、Canvas上 1. Canvas：复制渲染子UI控件 2. ✨Canvas Scaler✨：画布分辨率自适应 3. Graphics Raycaster：射线事件响应 4. ✨Rect Transform✨：UI位置锚点对齐二、Event System上 5. Event System 6. Standalone …

阅读更多...

VSCode中使用Markdown以及Mermaid实现流程图和甘特图等效果

VSCode中使用Markdown以及Mermaid实现流程图和甘特图等效果

前言 Markdown（简称md）这种文件格式，渐渐盛行起来。有点类似html格式的意思。特别是内嵌的对Marmaid的支持，对流程图、甘特图等的绘制，都非常的方便。一、安装Markdown的插件二、创建.md文件新建一个Markdown文件&…

阅读更多...

如何让 history 记录命令执行时间？Linux/macOS 终端时间戳设置指南

如何让 history 记录命令执行时间？Linux/macOS 终端时间戳设置指南

引言：你真的会用 history 吗？有没有遇到过这样的情况：你想回顾某个重要命令的执行记录，却发现 history 只列出了命令序号和内容，根本没有时间戳？这在运维排查、故障分析、甚至审计时都会带来极大的不便。想象一下，你在服务器上误删了某个文件，但不知道具体是几点执…

阅读更多...

css—— object-fit 属性

css—— object-fit 属性

一，属性值 object-fit: fill | contain | cover | none | scale-down;原本的图片： 属性值效果： <!DOCTYPE html> <html> <head><style>.container {display: flex;flex-wrap: wrap;gap: 20px;}.box {width: 200px…

阅读更多...

端游熊猫脚本游戏精灵助手2025游戏办公脚本工具！游戏脚本软件免费使用

端游熊猫脚本游戏精灵助手2025游戏办公脚本工具！游戏脚本软件免费使用

在当下这个崇尚高效与便捷的时代，自动化工具已然成为诸多开发者与企业提升工作效率的关键选择。熊猫精灵脚本助手作为一款极具实力的自动化工具，凭借其多样的功能以及广泛的应用场景，逐步成为众多用户的首要之选。熊猫精灵脚本助手整合了丰…

阅读更多...

Docker安装MySql 8.0

Docker安装MySql 8.0

1、验证环境 docker -v使用上面的命令检查一下本机的docker的运行环境。执行完成之后，会输出docker的版本号我本地输出以下内容: Docker version 27.5.1, build 9f9e4052、拉取镜像 docker pull mysql:8.0拉取mysql8.0版本对的镜像。正常情况如下: 如果报下面的…

阅读更多...

Jmeter-负载测试

Jmeter-负载测试

目录一. 基础负载测试场景：固定并发用户数 1、线程组配置 2、HTTP请求配置 3、添加定时器 4、添加监听器 4.1 聚合报告 4.2 响应时间图 4.3 查看结果树 5、结果分析指标二. 阶梯式加压场景（逐步增加并发） 1、插件安装 2、阶梯配…

阅读更多...

【新手初学】读取数据库数据

【新手初学】读取数据库数据

利用注入点让SQL注入语句执行读取数据库数据相关的操作！ 以下均以pikachu靶场的字符型注入为例进行介绍说明一、读取用户名，数据库版本信息在原URL后面添加如下代码： union select user(),version(）-- 效果： 补…

阅读更多...

Ubuntu与Windows之间相互复制粘贴的方法

Ubuntu与Windows之间相互复制粘贴的方法

一、打开Ubuntu终端二、卸载已有的工具 sudo apt-get autoremove open-vm-tools 三、安装工具 sudo apt-get install open-vm-tools-desktop 四、重启直接输入reboot 注：有任何问题欢迎评论区交流讨论或者私信！

阅读更多...

免去繁琐的手动埋点，Gin 框架可观测性最佳实践

免去繁琐的手动埋点，Gin 框架可观测性最佳实践

作者：牧思背景在云原生时代的今天，Golang 编程语言越来越成为开发者们的首选，而对于 Golang 开发者来说，最著名的 Golang Web 框架莫过于 Gin [ 1] 框架了，Gin 框架作为 Golang 编程语言官方的推荐框架 [ 2] &…

阅读更多...

【QT】新建QT工程(详细步骤)

【QT】新建QT工程(详细步骤)

新建QT工程 1.方法(1)点击new project按钮，弹出对话框，新建即可，步骤如下：(2) 点击文件菜单，选择新建文件或者工程，后续步骤如上 2.QT工程文件介绍(1).pro文件 --》QT工程配置文件(2)main.cpp --》QT工程主…

阅读更多...

优化MyBatis-Plus批量插入策略

优化MyBatis-Plus批量插入策略

优化MyBatis-Plus批量插入策略优化MyBatis-Plus批量插入策略一、用Mybatis-plus中的saveBatch方法二、InsertBatchSomeColumn插件1.使用前配置2.代码示例1.配置类 MybatisPlusConfig2).实体类 User3).Mapper 接口 UserMapper4).测试类 InsertBatchTest 优化MyBatis-Plus批量插…

阅读更多...

最新文章

推荐文章