LoRA，DoRA，RSLoRA，LoRA+ 是什么

LoRA，DoRA，RSLoRA，LoRA+ 是什么

news/2025/3/13 8:00:13/文章来源:https://blog.csdn.net/qq_38998213/article/details/146216196

LoRA，DoRA，RSLoRA，LoRA+ 是什么

在这里插入图片描述

一、LoRA（Low-Rank Adaptation，低秩适应）

核心原理：冻结预训练模型参数，仅在每层插入两个低秩矩阵（A∈R^{r×d}, B∈R^{d×r}），通过分解权重增量ΔW=BA近似全秩更新，参数量仅为全量微调的0.01%-1%。
举例：在GPT-2（774M参数）的注意力层，原权重矩阵W_q∈R^{768×768}。LoRA设置秩r=8，仅训练A（768×8）和B（8×768），参数量从768²=589k→768×8×2=12k（压缩49倍）。训练时，实际计算为xW_q + xAB（即ΔW=AB），推理时合并AB为ΔW与原W_q相加，无额外计算开销。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/32225.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

HTTP发送POST请求的两种方式

HTTP发送POST请求的两种方式

1、json String json HttpRequest.post(getUrl(method, "v1", url, userId, appKey)).header("Content-type", "application/json") // 设置请求头为 JSON 格式.body(JSONUtil.toJsonStr(params)) // 请求体为 JSON 字符串.execute().body(); …

阅读更多...

TCP并发服务器

TCP并发服务器

单循环服务器：服务器在同一时刻只能响应一个客户端的需求。并发服务器：服务器在同一时刻可以响应多个客户端的需求。构建TCP服务器的方法： IO多路复用的函数接口[select() poll() epoll()] 1.多进程实现TCP并发服务器 #include <s…

阅读更多...

【大模型统一集成项目】如何封装多个大模型 API 调用

【大模型统一集成项目】如何封装多个大模型 API 调用

🌟 在这系列文章中，我们将一起探索如何搭建一个支持大模型集成项目 NexLM 的开发过程，从架构设计到代码实战，逐步搭建一个支持多种大模型（GPT-4、DeepSeek 等） 的一站式大模型集成与管理平台&#xff…

阅读更多...

Linux基础开发工具—vim

Linux基础开发工具—vim

目录 1、vim的概念 2、vim的常见模式 2.1 演示切换vim模式 3、vim命令模式常用操作 3.1 移动光标 3.2 删除文字 3.3 复制 3.4 替换 4、vim底行模式常用命令 4.1 查找字符 5、vim的配置文件 1、vim的概念 Vim全称是Vi IMproved，即说明它是Vi编辑器的增强…

阅读更多...

数据结构与算法效率分析：时间复杂度与空间复杂度详解（C语言）

数据结构与算法效率分析：时间复杂度与空间复杂度详解（C语言）

1. 算法效率 1.1 如何衡量一个算法的好坏？ 在计算机程序设计中，衡量算法优劣的核心标准是效率。但效率不仅指运行速度，还需要综合以下因素： 时间因素：算法执行所需时间空间因素：算法运行占用的内存空间…

阅读更多...

使用arm嵌入式编译器+makefile编译管理keil项目

使用arm嵌入式编译器+makefile编译管理keil项目

目录 # arm嵌入式编译器-知识 # arm嵌入式编译器-知识 --- arm嵌入式编译器（百度云盘）下载：arm嵌入式编译器 keil， 链接提取码: 8a6c arm官方使用教程： Arm Compiler 6 User Guide linux 安装完了有个非常重要的一步…

阅读更多...

SwiftUI学习笔记day1---Stanford lecture1

SwiftUI学习笔记day1---Stanford lecture1

SwiftUI学习笔记day1—Stanford lecture1 课程链接：Lecture 1 | Stanford CS193p 2023课程大纲：代码仓库：github/iOS 文章目录 SwiftUI学习笔记day1---Stanford lecture11.在Xcode中创建一个swiftUI的工程2.简单认识Xcode这个IDE3.尝试理解示…

阅读更多...

vanna+deepseekV3+streamlit本地化部署

vanna+deepseekV3+streamlit本地化部署

文章目录 1、vanna介绍1.1、基本介绍1.2、工作原理1.3、优点 2、vannadeepseekV3mysqlstreamlit本地化部署2.1、创建conda环境，安装依赖2.2、Mysql数据准备2.3、新建pycharm项目2.4、封装deepseek大模型2.5、定义MyVanna2.6、构建streamlit的app2.7、app演示 1、van…

阅读更多...

【LangChain接入阿里云百炼deepseek】

【LangChain接入阿里云百炼deepseek】

这是目录前言阿里云百炼注册账号使用代码执行结果前言大模型爆火，现在很多教程在教怎么使用大模型来训练Agent智能体，但是大部分教程都是使用的OpenAI。最近阿里云推出DeepSeek-R1满血版，新用户可享100万免费Token额度。今天就教大家怎…

阅读更多...

【优选算法】二分法（总结套路模板）

【优选算法】二分法（总结套路模板）

目录 1. 题目一 ：二分查找解题思路： 模板总结（简单版，不适用所有情况） 代码实现： 2. 题目二解题思路： 模板总结（几乎万能） 代码实现： 3. 题目…

阅读更多...

Qt开源控件库（qt-material-widgets）的编译及使用

Qt开源控件库（qt-material-widgets）的编译及使用

项目简介 qt-material-widgets是一个基于 Qt 小部件的 Material Design 规范实现。项目地址项目地址：qt-material-widgets 本地构建环境 Win11 家庭中文版 VS2019 Qt5.15.2 (MSVC2019) 本地构建流程克隆后的目录结构如图： 直接使用Qt Crea…

阅读更多...

游戏引擎学习第147天

游戏引擎学习第147天

仓库:https://gitee.com/mrxiao_com/2d_game_3 上一集回顾具体来说，我们通过隐式计算来解决问题，而不是像数字微分分析器那样逐步增加数据。我们已经涵盖了这个部分，并计划继续处理音量问题。不过，实际上我们现在不需要继续处理…

阅读更多...

uni-app打包成H5使用相对路径

uni-app打包成H5使用相对路径

网上找了一圈，没用，各种试，终于给试出来了，主要是网络上的没有第二步，只有第一步，导致打包之后请求的路径没有带上域名运行的基础路径设置为./ config.js文件里面的baseUrl路径改成空字符，千万…

阅读更多...

知识社区：打破传统知识传播的壁垒

知识社区：打破传统知识传播的壁垒

知识社区的诞生当今，知识库的上传与下载已无法满足现代用户对知识获取的多样化需求。随着信息量的爆炸式增长和用户需求的日益复杂化，传统的、静态的知识库显得力不从心。用户渴望能够实时互动、即时反馈、多维度探索知识的平台。正是在这样的背景下&am…

阅读更多...

洛谷 P5534 【XR-3】等差数列 python

洛谷 P5534 【XR-3】等差数列 python

这题不用向下取整//就会错，不太能理解为什么...感觉对结果好像没什么影响啊 a1, a2, n map(int,input().split()) d a2 - a1 an a1 d * (n-1) s (a1an)*n//2 print(s)

阅读更多...

机器人路径规划、轨迹优化系列课程

机器人路径规划、轨迹优化系列课程

机器人路径规划、轨迹优化课程-第一讲-轨迹规划导论_哔哩哔哩_bilibili 机器人路径规划、轨迹优化课程-第二讲-Dijkstra算法原理讲解_哔哩哔哩_bilibili 机器人路径规划、轨迹优化课程-第四讲-A*算法原理和代码讲解_哔哩哔哩_bilibili 机器人路径规划、轨迹优化课程-第五讲-…

阅读更多...

qemu-kvm源码解析-内存虚拟化

qemu-kvm源码解析-内存虚拟化

内存虚拟化介绍宿主机上的程序地址转换时为 HVA（宿主机虚拟地址）--MMU-->HPA(宿主机物理地址) 而宿主机上的虚拟机面临两层转化需求: GVP(虚拟机虚拟地址)--MMU-->GPA(虚拟机物理地址) GPA(虚拟机物理地址)--VMM-->HPA(宿主机物理地址) 虚…

阅读更多...

WireShark自动抓包

WireShark自动抓包

背景异常流量检测是当前保护网络空间安全的重要检测方法。对流量的研究，首先需要在系统中进行抓包，并对包进行分析。这里对WireShark自动抓包进行简要介绍。操作步骤 1、选择“捕获”>“选项”。 2、在Input下，选择要抓包的网络接…

阅读更多...

【CSS3】练气篇

【CSS3】练气篇

目录 CSS 基本概念CSS 的定义CSS 的作用CSS 语法 CSS 引入方式内部样式表外部样式表行内样式表选择器基础选择器标签选择器类选择器id 选择器通配符选择器画盒子文字控制属性字体大小字体粗细字体倾斜行高字体族font 复合属性文本缩进文本对齐文本修饰线文字颜色 CSS 基本概念…

阅读更多...

Trae AI IDEA安装与使用

Trae AI IDEA安装与使用

文章目录背景第一步、下载安装第二步、登录与使用优势异常处理背景最近比较热的 Trae 开发工具，在本地下载使用，记录下来。第一步、下载安装下载地址：【Trae中文版下载地址】，下载的安装文件名为：【Trae CN-Se…

阅读更多...

最新文章

推荐文章