Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

综述阅读笔记
仅记录个人比较感兴趣的部分

基本知识

  1. PEFT的三种分类:additive, selective, reparameterized, and hybrid fine-tuning
    selective fine-tuning 不需要任何额外的参数,它从主干模型中选择一小部分参数,并且仅使它们可调,同时保持大多数参数在对下游任务进行微调期间保持不变。
    在这里插入图片描述

  2. LLM Evaluation的下游任务
    (1) the first type is the General Language Understanding Evaluation (GLUE) benchmark
    (2) the other type of dataset that has been used in recent LLM papers is common sense reasoning which integrated into our study caters to a variety of research facets: OpenBookQA, PIQA, Social IQA, HellaSwag, BoolQ, WinoGrande, ARC-easy, ARC-challenges

  3. PEFT的评估基准
    based on criteria such as performance, convergence, efficiency, combinability, scalability, and transferability.
    ShareGPT & Microsoft Azure Function Trace & Gamma process

PEFT的分类

  1. Additive PEFT
    (1) adapters
    比较感兴趣的的是CoDA
    【CoDA采用稀疏激活机制来提高推理效率。具体而言,CoDA使用软top-k选择过程,识别每层中的k个重要token,这些令牌将由冻结的预训练Transformer层和适配器分支处理,以保持模型准确性。相比之下,那些不重要的token只由适配器分支处理,而跳过繁重的预训练层,因此在不影响整体性能的情况下优化推理效率。】
    ✘没代码
    (2) soft prompt

  2. Selective PEFT
    (1)unstructured mask
    Diff pruning 将可学习的掩码应用于模型权重
    PaFi 选择具有最小绝对值大小的权重作为可训练的
    FishMask 使用Fisher信息近似决定参数的重要性
    Fish-Dip 相比于增加了每个训练周期的动态重计算
    LTSFT 引入Lottery Ticket Hypothesis确定参数重要性
    SAM使用二阶逼近确定掩码
    (2)structured mask
    SPT 使用一阶泰勒展开计算敏感参数

  3. Reparameterized PEFT
    LoRA
    NOAH --> NAS

PEFT的设计

  1. KV缓存
    SLoRA在统一内存池中采用统一分页机制,以分页的方式动态分配和管理内存

  2. 内存高效的PEFT方法

PEFT的系统设计挑战

PEFT的系统设计

  1. PEFT serving systems的系统性能的评价指标:
    System throughout
    Memory footprint :内存利用率来自于模型参数与kv cache
    Accuracy performance
    Quality of services
  2. PEFT training systems的有效性的评估指标:
    Accuracy performance :微调模型对下游任务的性能
    Compute cost :云服务器和边缘设备上前向和反向传播操作期间的计算成本
    Communication cost :指在云服务器和边缘设备之间传输中间数据过程中涉及的数据量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/451262.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机毕业设计Hadoop+Hive+Spark+Flink广告推荐系统 广告预测 广告数据分析可视化 广告爬虫 大数据毕业设计 深度学习 机器学习

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 专业 小四号宋体 班级 小…

《环境感知方案:探索未来智能世界的关键技术》

《环境感知方案:探索未来智能世界的关键技术》 一、环境感知方案的研究现状(一)机器人领域的环境感知(二)农业领域的环境感知(三)智能网联汽车领域的环境感知 二、先进的环境感知技术&#xff0…

A Multi-Head Reconstruction Network For Image Anomaly Detection创新点总结

创新点解析:Multi-Head Reconstruction Network (MRN) 与 Multi-Feature Aggregation (MFA) 1. Multi-Head Reconstruction Network (MRN) 传统重建方法的过程: 训练自动编码器或生成模型来重建正常样本的图像。通过比较原始图像和重建图像来检测异常…

数据结构与算法 - 树 #数的概念 #二叉树 #堆 - 堆的实现/堆排序/TOP-K问题

文章目录 前言 一、树 (一)、概念 1、树的定义 (二)、树的定义 1、树为什么是递归定义的? 2、如何定义树(如何表达一棵树) 解决方案一:假设我们得知该树的度 解决方案二:顺序表 解决方案三:左孩子右兄弟表示法 二、二叉…

Linux Ubuntu dbus CAPI ---- #include<dbus.h>出现“无法打开源文件dbus/xxx.h“的问题

一、确保已安装dbus库和CAPI sudo apt-get install libdbus-1-dev 二、在c_cpp_properties.json的includePath中是否配置了dbus库依赖文件所在的路径 三、编译一个简单的dbus代码,在编译过程中只要出现.h文件找不到的情况,就使用下列命令找到.h文件路径…

Java集合常见知识总结(中)

Set Comparable 和 Comparator 的区别 Comparable 接口和 Comparator 接口都是 Java 中用于排序的接口,它们在实现类对象之间比较大小、排序等方面发挥了重要作用: Comparable 接口实际上是出自java.lang包 它有一个 compareTo(Object obj)方法用来排序…

【web】JDBC

项目连接数据库 右侧导航栏找到databsae 如果没有驱动,先下载驱动 填写数据库用户名密码 勾选对应的表即可 JDBC代码流程 1,配置信息 2,加载驱动 从MySQL Connector/J 5.1版本开始,推荐使用com.mysql.cj.jdbc.Driver这个新的驱动类。 3,链接数据库…

初识Linux · 重定向和缓冲区

目录 前言: 预备知识 缓冲区 重定向 前言: 其实有了文件2的预备知识,我们已经初步了解了文件描述符fd是什么,底层是如何运作的了,那么本文,我们通过文件描述符对重定向和缓冲区有一个更深层次的理解&a…

JVM(HotSpot):GC之垃圾标记阶段

文章目录 前言一、标记阶段算法1、引用计数法2、可达性分析算法(JVM使用) 二、4种引用1、 强引用2、软引用(SoftReference)3、弱引用(WeakHashMap)4、虚引用(PhantomReference) 三、代码案例1、 强引用2、软引用(SoftReference)3、弱引用(WeakHashMap) 前…

AI-Talk开发板之shell_xtts

一、说明 运行duomotai_ap sdk下的shell_xtts例程,测试语音合成以及SPK功能。 操作说明:开发指南 | 聆思文档中心 (listenai.com) 与处理器的信号连接: 二、工程 1、设备树 由于AI-Talk开发板与CSK6-MIX开发板有些管脚不一样,所…

主机加固是什么?又该如何实施呢?

MCK主机加固:企业数据安全的守护神 内核级安全加固:MCK主机加固采用基于操作系统内核级的安全加固技术,从根本上阻断了病毒和恶意软件的入侵路径,确保企业核心数据的安全。 智能防御机制:智能识别并预警潜在的安全威胁…

纯血鸿蒙!

纯血鸿蒙,这是哪个营销大师给起的名字啊! 纯血!象征着高贵、自信、自主、血性、英雄气概,都融入这纯血鸿蒙了! 鸿蒙本就是开天辟地,加上纯血,真是荡气回肠! 鸿蒙的推出背景 我们前…

数据结构(JAVA)包装类泛型

文章目录 包装类基本数据类型和对应的包装类装箱和拆箱面试题 泛型什么是泛型泛型的语法泛型类的使用泛型的使用裸类型(Raw Type) (仅需了解)擦除机制泛型的上界泛型方法 包装类 基本数据类型和对应的包装类 注意,除了int基本数据类型的包装…

机器学习核心:监督学习与无监督学习

个人主页:chian-ocean 文章专栏 监督学习与无监督学习:深度解析 机器学习是现代人工智能的核心支柱,已广泛应用于从数据挖掘到计算机视觉再到自然语言处理的诸多领域。作为机器学习最主要的两大类型,监督学习(Super…

LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 视频微调(LoRA) 教程(3)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142882496 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 SWIFT …

【Neo4j】- 轻松入门图数据库

文章目录 前言-场景一、Neo4j概述二、软件安装部署1.软件下载2.软件部署3.软件使用4.语法学习 总结 前言-场景 这里用大家都了解的关系数据与图数据据库对比着说,更加方便大家理解图数据库的作用 图形数据库和关系数据库均存储信息并表示数据之间的关系。但是,关系…

【Golang】Go语言web框架Gin响应客户端有哪些方式

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

Navigation2 算法流程

转自 https://zhuanlan.zhihu.com/p/405670882 此文仅作学习笔记 启动流程 在仿真环境中启动导航包的示例程序,执行nav2_bringup/bringup/launch/tb3_simulation_launch.py文件。ROS2的launch文件支持采用python语言来编写以支持更加复杂的功能,本文件…

个人用操作系统笔记(待补充)

文章目录 一、绪论二、Linux操作系统进程线程(进程内的基本调度单位)文件与设备文件权限文件系统文件连接(共享) 地址空间缺页中断 用户超级用户root(用户标识与组标识都是0) 重定向系统启动常用命令 OS研究…

【优选算法篇】踏入算法的深邃乐章:滑动窗口的极致探秘

文章目录 C 滑动窗口详解:进阶题解与思维分析前言第二章:进阶挑战2.1 水果成篮解法一:滑动窗口解法二:滑动窗口 数组模拟哈希表复杂度分析:图解分析:示例:滑动窗口执行过程图解: 详…