【大模型】7 天 AI 大模型学习

7 天 AI 大模型学习 Day 3

今天,我们要一起学习大模型微调了 ~ 包括:大模型微调领域概览、Lora微调 等 ~


文章目录

  • 7 天 AI 大模型学习 Day 3
  • 大模型微调概览
    • 大模型项目 pipeline
    • 提示词工程 Prompt Engineering
      • In-context Learning
    • Fine-tune
      • 数据构造
      • 训练 验证 测试集
      • Fine-tune 导致的问题
      • 解决遗忘的思路
    • PEFT
  • Lora 微调
    • Adaptor Tuning
    • Prefix Tuning
    • Lora 核心思想
  • 从0实现Lora
    • RoBERTa
    • 如何应用 Lora 做 Fine-tune
    • Brute-force 方法


大模型微调概览

大模型项目 pipeline

  • 定义问题 提前准备一些测试集(benchwork) 看那个模型效果好
  • 选择模型底座
  • 提示词工程 、 微调 、 对齐
  • 评估
  • 上线
  • 推理(模型压缩,降低成本)
  • RAG

提示词工程 Prompt Engineering

In-context Learning

  • Zero-shot
  • Few-shot
    在这里插入图片描述
    持续的加入 Example ,看模型的效果
    问题:
  • 成本提高(input token 变长)
  • 泛化性不好
  • Example 占用空间过多

Fine-tune

Few-shot 不行,考虑 Fine-tune
理解:Fine-tune 把知识嵌入在模型内部,Fine-tune 可以实现多任务 Multi-tasking

数据构造

原始的监督数据 Instruction Data (Diversity) —— 改造

  1. Human-Generated => (问题,答案) 成本高
  2. Existing Supervised Train Data
  3. AI-generated(with human)人工过滤
  4. Human-Generate Instruction Data - AI Generate Instruction Data - Human Evaluate

训练 验证 测试集

Fine-tune 导致的问题

Fine-tune 之后,模型之前的能力消失了 —— 遗忘
在这里插入图片描述
—— Trade-off 减少遗忘

解决遗忘的思路

  1. 加入通用数据
  • 其他类型 哪些我们所需要的能力下降了
  1. 减少对模型的改动
  • regularization 正则化
  • 改动部分参数 Lora 的核心思想
  • 新加入模块
  • 训练时调learn rate
  1. 使用更大的模型 - 模型越小,forgetting越大
  2. 多任务学习 - 数据合并在一起做 Fine-tune
  3. 什么都不需要做 - 只需要某个能力
  4. 识别诊断模型的哪些参数导致模型能力降低

PEFT

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
—— 推荐阅读

  1. 论文1
  2. 论文2

Lora 微调

  • 全参 fine-tune ,和 pre-train 没有区别

Adaptor Tuning

在这里插入图片描述
在原有模型上加入 插件 。
推理时增加了时间成本 。

Prefix Tuning

在这里插入图片描述
难优化,随着 token 增加,性能不会持续提高,占用窗口

Lora 核心思想

前提,不改变模型结构,推理不改变 。将原有参数,通过一种方式,变为其他参数。
在这里插入图片描述
原则:改变不要太大,从而避免遗忘,提高泛化能力。

—— low rank
在这里插入图片描述

rank 参数可以表示矩阵所含的信息量

在这里插入图片描述
解决思路 ——

在这里插入图片描述

  • B 和 A 是 Lora 的参数
  • B 初始化为0, A 初始化为 normalization

在这里插入图片描述
矩阵W 作用:做线性转换

在这里插入图片描述

  • Full / Lora Fine 区别
    在这里插入图片描述
    lora 中冻结某些参数

在这里插入图片描述

  • 只需要 A * B 就行,不需要再加入更多的矩阵
    在这里插入图片描述
    占用空间 ——
    全量微调 :
  • model weight N
  • gradient N
  • optimizer 2N
    Lora:
    N + …
    在这里插入图片描述
  • 只改变 Q V 效果好

在这里插入图片描述

  • rank = 8 效果好

在这里插入图片描述
放大模型的一些能力

在这里插入图片描述

从0实现Lora

RoBERTa

在这里插入图片描述

如何应用 Lora 做 Fine-tune

  • 哪些矩阵参与 Lora 的 Fine-tune
  • 哪些函数会受到影响
    在这里插入图片描述

Brute-force 方法

在这里插入图片描述
在这里插入图片描述

  • 将所有的与 query value 相关的(调用的位置) ,修改为 lora_query , lora_value
    在这里插入图片描述
    缺点:
  • 定制化的,对每个模型都需要重新做 dirty work
  • 考虑一种其他方法,无论什么模型,只要是 transformer 结构的,都可以通过这个方法改为 lora 模型
    在这里插入图片描述

如何从根源进行改造,从而不需要修改 self-attention,self-attention 还是比较高层的

—— 最小单元
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
核心思想:继承 Liner 函数,重写,然后做替换

Lora 微调代码 ——
在这里插入图片描述
参数解释

  • r _ rank
  • alpha
    在这里插入图片描述
  • modules _ 那个矩阵需要学习
  • bias _ 是否训练 bias

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/502467.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

密码学精简版

密码学是数学上的一个分支,同时也是计算机安全方向上很重要的基础原理,设置密码的目的是保证信息的机密性、完整性和不可抵赖性,安全方向上另外的功能——可用性则无法保证,可用性有两种方案保证,冗余和备份&#xff0…

DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。 简介 DeepSeek-V3是一个强大的混合专家 (MoE) 语言模型,总共有 671B 个参数,…

图像超分辨新SOTA!南洋理工提出InvSR,利用大型预训练扩散模型图像先验来提高 SR 性能, 登上Huggingface热门项目。

南洋理工大学的研究者们提出了一种基于扩散反演的新型图像超分辨率 (SR) 技术,可以利用大型预训练扩散模型中蕴含的丰富图像先验来提高 SR 性能。 该方法的核心是一个深度噪声预测器,用于估计前向扩散过程的最佳噪声图。一旦训练完成,这个噪…

MySQL低版本没有函数row_number() over的解决方案

最近在维护老项目时,需要对历史数据做分析取出分区数据中的第一条,无奈因为MySQL版本过低,无法使用函数row_number() over,苍了个天~ 不过这点小事怎么可能难倒我们这群考古专家呢,在此分享一下解决方案。 主要原因是问…

贵州省贵安新区地图+全域数据arcgis格式shp数据矢量路网地名+卫星影像底图下载后内容测评

贵州省贵安新区地图全域数据arcgis格式shp数据矢量路网地名卫星影像底图 贵安新区地图是一款基于ArcGIS格式的地理信息系统数据集,包含2022年3月更新的详尽矢量路网、地名信息以及卫星影像底图。这款数据集是针对贵安新区这一特定区域设计的,对于规划、…

npm install --global windows-build-tools --save 失败

注意以下点 为啥下载windows-build-tools,是因为node-sass4.14.1 一直下载不成功,提示python2 没有安装,最终要安装这个,但是安装这个又失败,主要有以下几个要注意的 1、node 版本 14.21.3 不能太高 2、管理员运行 …

音视频入门基础:MPEG2-PS专题(5)——FFmpeg源码中,解析PS流中的PES流的实现

一、引言 从《音视频入门基础:MPEG2-PS专题(3)——MPEG2-PS格式简介》中可以知道,PS流由一个个pack(包装)组成。一个pack 一个pack_header 一个或多个PES_packet。pack_header中还可能存在system header…

记一次k8s下容器启动失败,容器无日志问题排查

问题 背景 本地开发时&#xff0c;某应用增加logback-spring.xml配置文件&#xff0c;加入必要的依赖&#xff1a; <dependency><groupId>net.logstash.logback</groupId><artifactId>logstash-logback-encoder</artifactId><version>8…

【问题记录】npm create vue@latest报错

1&#xff0c;错误日志 npm error code EPERM npm error syscall mkdir npm error path D:\Program Files\nodejs\node_cache\_cacache npm error errno EPERM npm error FetchError: Invalid response body while trying to fetch https://registry.npmjs.org/create-vue: EP…

JavaWeb开发(六)XML介绍

1. XML介绍 1.1. 什么是XML &#xff08;1&#xff09;XML 指可扩展标记语言(EXtensible Markup Language)XML 是一种很像HTML的标记语言。   &#xff08;2&#xff09;XML 的设计宗旨是传输数据(目前主要是作为配置文件)&#xff0c;而不是显示数据。   &#xff08;3&a…

Vue3实现PDF在线预览功能

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;Vue篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来Vue篇专栏内容:Vue3现PDF在线预览功能 前言 在开发中&#xff0c;PDF预览和交互功能是一个常见的需求。无论是管理…

win32汇编环境,在窗口程序中画简单图形

;运行效果 ;win32汇编环境&#xff0c;在窗口程序中画简单图形 ;展示点、直线、圆、椭圆、正方形、矩形、圆角矩形的画法 ;将代码复制进radasm软件里&#xff0c;直接编译可运行.重要部分加备注。 ;>>>>>>>>>>>>>>>>>>&…

[7种方法] 如何修复iPad无法连接到App Store

“现在已经 3 天了&#xff0c;我无法从 iPad 连接到 App Store。起初&#xff0c;我以为这是服务器问题&#xff0c;但已经过去 3 天了&#xff0c;问题仍然存在。请帮助我&#xff01;” 如果您的iPad 无法连接到 App Store&#xff0c;可能有多种原因。即使是日期和时间设置…

weblogic安装 12.2.1.4.0 单机

fmw_12.2.1.4.0_wls.jar和jdk-8u341-linux-x64.tar.gz&#xff0c;安装weblogic 安装JDK 8 # 1. 创建Java安装目录 mkdir -p /usr/java cd /usr/java# 2. 解压JDK tar -zxvf jdk-8u341-linux-x64.tar.gz# 3. 配置环境变量 cat >> /etc/profile << EOF export JAV…

vue elementUI Plus实现拖拽流程图,不引入插件,纯手写实现。

vue elementUI Plus实现拖拽流程图&#xff0c;不引入插件&#xff0c;纯手写实现。 1.设计思路&#xff1a;2.设计细节3.详细代码实现 1.设计思路&#xff1a; 左侧button列表是要拖拽的组件。中间是拖拽后的流程图。右侧是拖拽后的数据列表。 我们拖动左侧组件放入中间的流…

SpringBoot+Vue养老院管理系统设计与实现【开题报告+程序+安装部署+售后讲解】

【1】系统介绍 一、研究背景 随着中国人口老龄化的加剧&#xff0c;养老问题已成为社会关注的热点话题。传统的养老服务模式难以满足日益增长的老年人群体的需求&#xff0c;尤其是在信息化和智能化方面存在明显不足。为了提高养老服务效率&#xff0c;改善老年人生活质量&am…

【网络安全 | 漏洞挖掘】通过模拟功能实现提权(Bugcrowd)

未经许可,不得转载。 我将与大家分享我在 Bugcrowd 的某个项目中发现的一个漏洞,该项目中有一个“用户模拟”功能。 什么是用户模拟? 用户模拟允许管理员在不知晓用户凭据的情况下“以用户身份登录”。这种功能常见于管理员需要调试问题、审查用户权限或解决投诉的平台中。…

ValuesRAG:以检索增强情境学习强化文化对齐

随着大型语言模型&#xff08;LLMs&#xff09;的迅猛发展&#xff0c;其在各个领域展现出强大的能力。然而&#xff0c;训练数据中西方中心主义的倾向&#xff0c;使得 LLMs 在文化价值观一致性方面面临严峻挑战&#xff0c;这一问题在跨文化场景中尤为突出&#xff0c;可能导…

【CSS】第二天 画盒子、文字控制属性

【CSS】第二天 1. 画盒子2. 文字控制属性2.1 字体大小2.2 字体粗细2.3 字体样式是否倾斜2.4 行高2.5 行高-垂直居中2.6 字体族2.7 字体复合属性 font 1. 画盒子 目标&#xff1a;使用合适的选择器画盒子。 新属性 <!DOCTYPE html> <html> <head><meta …

东京大学联合Adobe提出基于指令的图像编辑模型InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。

东京大学联合Adobe提出的InstructMove是一种基于指令的图像编辑模型&#xff0c;使用多模态 LLM 生成的指令对视频中的帧对进行训练。该模型擅长非刚性编辑&#xff0c;例如调整主体姿势、表情和改变视点&#xff0c;同时保持内容一致性。此外&#xff0c;该方法通过集成蒙版、…