LoRA 是如何工作的？

LoRA 是如何工作的？

news/2025/1/8 10:13:24/文章来源:https://blog.csdn.net/u013066244/article/details/133848521

概述

纯笔记

LoRA的原理

LoRA其实是对稳定扩散模型最关键的部分进行了微小的改变。
这个关键的部分叫：cross-attention layers – 交叉注意力层。

研究人员发现，对这关键部分进行微调就足以实现良好的训练。

在这里插入图片描述
上面黄色部分，QKV 部分就是：交叉注意力层。

交叉注意力层里排列着权重，这些权重成矩阵的形式排列。就像Excel表格一样。

LoRA模型通过将权重添加到这些矩阵中来微调模型。

LoRA模型文件如何才能更小？

LoRA 的技巧是将矩阵分解为两个较小的（低秩）矩阵。通过这样做，它可以存储更少的数字。让我们用下面的例子来说明这一点：

假设该模型有一个包含 1000 行和 2000 列的矩阵。模型文件中需要存储 2,000,000 个数字 (1000 x 2000)。 LoRA 将矩阵分解为 1000×2 矩阵和 2×2000 矩阵。这只有 6,000 个数字 (1000 x 2 + 2 x 000)，少了 333 倍。这就是 LoRA 文件小得多的原因。

在这里插入图片描述

LoRA 将一个大矩阵分解为两个小的低秩矩阵。

在这个例子中，矩阵的秩为2。它比原始维度低得多，因此称为低秩矩阵。秩可以低至为1。

但这样的做有什么害处吗？研究人员发现，在交叉注意力层中这样做并不会影响微调的能力。所以没问题。

参考地址：

https://stable-diffusion-art.com/lora/#What_are_LoRA_models

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/159330.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

K8S：Rancher管理 Kubernetes 集群

K8S：Rancher管理 Kubernetes 集群

文章目录一.Rancher 简介1.Rancher概念2.Rancher 和 k8s 的区别二.Rancher 安装及配置1.安装 rancher2.登录 Rancher 平台3.Rancher 管理已存在的 k8s 集群4.Rancher 部署监控系统5.使用 Rancher 仪表盘管理 k8s 集群三.拓展1.Rancher和kubesphere相比较2.K3S和K8S相比较一…

阅读更多...

Opencv——颜色模型+通道分离与合并

Opencv——颜色模型+通道分离与合并

视频加载/摄像头调用 VideoCapture允许一开始定义一个空的对象 VideoCapture video VideoCapture(const String &filename,int apiPreferenceCAP_ANY) filename:读取的视频文件或者图像序列名称 apiPreference:读取数据时设置的属性，例如编码格式、是否调用Op…

阅读更多...

转化限制+分析变量变化引起的答案变化：Gym - 104065D

转化限制+分析变量变化引起的答案变化：Gym - 104065D

https://vjudge.net/contest/587311#problem/H 先转化一波条件： p i ≥ 1 X p_i\ge \frac 1 X pi≥X1 p i ≤ 1 1 − Y p_i\le \frac 1 {1-Y} pi≤1−Y1 所以我们按 p p p 排序， s u m x sum_x sumx 必然是后缀， s u m y sum_y …

阅读更多...

线性回归原理

线性回归原理

1、线性回归的原理 1.1 线性回归应用场景房价预测销售额度预测金融：贷款额度预测、利用线性回归以及系数分析因子1.2 什么是线性回归 1.2.1定义与公式线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的…

阅读更多...

VMware和Debian下载

VMware和Debian下载

文章目录 ⭐️写在前面的话⭐️一、VMware二、Debain三、建立虚拟机🚀 先看后赞，养成习惯！🚀🚀 先看后赞，养成习惯！🚀 ⭐️写在前面的话⭐️ CSDN主页：程序员好冰目前在…

阅读更多...

模型UV纹理设置工具

模型UV纹理设置工具

1、什么是模型UV纹理？ 模型的UV纹理是将二维纹理图映射到三维模型表面的过程。UV纹理可以为模型赋予颜色、纹理、细节和其他效果，使其看起来更加逼真。 2、UV纹理的原理下面是模型UV纹理的详细原理介绍： UV坐标系统：UV坐标系统…

阅读更多...

乐器经营商城小程序的作用是什么

乐器经营商城小程序的作用是什么

乐器产品覆盖的人群非常广，小学生、老年人都有不小需求，也因此市场中的从业商家相对较多，产品丰富可供消费者选购，然而在实际经营中，线上线下面临痛点不少。通过【雨科】平台搭建乐器小程序商城，将所有产品…

阅读更多...

DarkGate恶意软件通过消息服务传播

DarkGate恶意软件通过消息服务传播

导语近日，一种名为DarkGate的恶意软件通过消息服务平台如Skype和Microsoft Teams进行传播。它冒充PDF文件，利用用户的好奇心诱使其打开，进而下载并执行恶意代码。这种攻击手段使用了Visual Basic for Applications（VBA&#xff0…

阅读更多...

JavaSE学习值之--认识异常

JavaSE学习值之--认识异常

💕"有效知识的前提是承认知识边界，承认我们对边界那边的一切无可奉告。"💕 作者：Mylvzi 文章主要内容：JavaSE学习值之--认识异常一.什么是异常？ 异常就是程序在运行的时候产生的不正常的行为 …

阅读更多...

多机器人三角形编队的实现

多机器人三角形编队的实现

文章目录前言一、机器人编队前的准备二、配置仿真环境2.编写机器人编队.cpp文件三、三角形编队测试前言前阵子一直想要实现多机器人编队，找到了很多开源的编队代码，经过好几天的思索，终于实现了在gazebo环境中的TB3三角形机器人编队。一…

阅读更多...

SQL Server远程登录失败

SQL Server远程登录失败

SQL Server远程登录失败检查SQL SERVER 是否允许远程访问. 具体步骤: 1)在远端SQL Server主机上,打开SSMS并连接数据库 2)在相应”数据库”上单击右键,选择”属性” 3)选择”连接”选项卡,检查”远程服务器连接”下,RPC服务是否选择. 设置SQL Server相关TCP连接 1.打开SQL Se…

阅读更多...

Netty 入门 — 亘古不变的Hello World

Netty 入门 — 亘古不变的Hello World

这篇文章我们正式开始学习 Netty，在入门之前我们还是需要了解什么是 Netty。什么是 Netty 为什么很多人都推崇 Java boy 去研究 Netty？Netty 这么高大上，它到底是何方神圣？ 用官方的话说：Netty 是一款异步的、基于事…

阅读更多...

KMP 算法 + 详细笔记

给两个字符串，T"AAAAAAAAB"，P"AAAAB"; 可以暴力匹配，但是太费时和效率不太好。于是KMP问世，我们一起来探究一下吧！！！ （一）最长公共前后缀 D[i] p[…

阅读更多...

Java架构师缓存性能优化

Java架构师缓存性能优化

目录 1 缓存的负载策略2 缓存的序列化问题3 缓存命中率低4 缓存对数据库高并发访问5 缓存数据刷新的策略5.1. 实时策略5.2. 异步策略5.3. 定时策略6 何时写缓存7 批量数据来更新缓存8 缓存数据过期的策略9 缓存数据如何恢复10 缓存数据如何迁移11 缓存冷启动和缓存预热想学习架…

阅读更多...

解决react样式组合时css module动态样式失效的问题

解决react样式组合时css module动态样式失效的问题

现象： <button disabled{invalid} className{ "btn btn-primary btn-lg" invalid ? styles.btnDisabled : "" } > 注册 </button> 上面采用字符串拼接的方式，组合class，但是css module的动态样式style…

阅读更多...

【Java零基础入门到就业】第一天：java简介和cmd窗口的一些常见命令

【Java零基础入门到就业】第一天：java简介和cmd窗口的一些常见命令

1、java简介 Java是一种基于类的、面向对象的编程语言，它被设计成具有尽可能少的实现依赖。它旨在让应用程序开发人员编写一次，并在任何地方运行(WORA)，这意味着编译后的Java代码可以在所有支持Java的平台上运行，而无需重新编译。…

阅读更多...

【具身智能模型1】PaLM-E: An Embodied Multimodal Language Model

【具身智能模型1】PaLM-E: An Embodied Multimodal Language Model

论文标题：PaLM-E: An Embodied Multimodal Language Model 论文作者：Danny Driess, Fei Xia, Mehdi S. M. Sajjadi, Corey Lynch, Aakanksha Chowdhery, Brian Ichter, Ayzaan Wahid, Jonathan Tompson, Quan Vuong, Tianhe Yu, Wenlong Huang, Yevgen C…

阅读更多...

Vue鼠标右键画矩形和Ctrl按键多选组件

Vue鼠标右键画矩形和Ctrl按键多选组件

效果图说明下面会贴出组件代码以及一个Demo，上面的效果图即为Demo的效果，建议直接将两份代码拷贝到自己的开发环境直接运行调试。组件代码 <template><div class"objects" ref"objectsR…

阅读更多...

bash一行输入，多行回显demo脚本

bash一行输入，多行回显demo脚本

效果图： 脚本： #!/bin/bash # 定义一个变量，用来存储输入的内容 input"" # 定义一个变量，用来存储输入的字符 char""# 为了让read能读到空格键 IFS_store$IFS IFS# 提示内容，在while循环中也有&a…

阅读更多...

CSS 滚动驱动动画 animation-range

CSS 滚动驱动动画 animation-range

animation-range 语法 normallength-percentagetimeline-range-name 具名时间线范围 named timeline rangecovercontainentry 和 entry-crossingexit 和 exit-crossing 兼容性 animation-range 这个属性可同时对 scroll progress timeline 和 view progress timeline 这两种不…

阅读更多...

最新文章

推荐文章