什么是LoRA模型,如何使用和训练LoRA模型?你想要的都在这!

什么是LoRA模型

LoRA的全称是LoRA: Low-Rank Adaptation of Large Language Models,可以理解为stable diffusion(SD)模型的一种插件,和hyper-network,controlNet一样,都是在不修改SD模型的前提下,利用少量数据训练出一种画风/IP/人物,实现定制化需求,所需的训练资源比训练SD模要小很多,非常适合社区使用者和个人开发者。LoRA最初应用于NLP领域,用于微调GPT-3等模型(也就是ChatGPT的前生)。由于GPT参数量超过千亿,训练成本太高,因此LoRA采用了一个办法,仅训练低秩矩阵(low rank matrics),使用时将LoRA模型的参数注入(inject)SD模型,从而改变SD模型的生成风格,或者为SD模型添加新的人物/IP。用数据公式表达如下,其中 W0 是初始SD模型的参数(Weights), BA 为低秩矩阵也就是LoRA模型的参数, W 代表被LORA模型影响后的最终SD模型参数。整个过程是一个简单的线性关系,可以认为是原SD模型叠加LORA模型后,得到一个全新效果的模型。

W=W0+BA

在著名的模型分享网站https://civitai.com/上,有大量的SD模型和LoRA模型,其中SD模型仅有2000个,剩下4万个基本都是LoRA等小模型。例如下图,水墨画和原神八重神子就是LoRA模型来实现特定的画风和人物IP。

在模型分享网站civitai上,左上角标注了CHECKPOINT的代表的是SD模型,标注了LORA的就是LORA模型了

以下是一个LoRA模型详解分析,从下图可以看到,该模型只有144MB,相比SD模型至少2GB起步,LORA确实算得上是小模型,非常适合硬件资源受限的用户。值得注意的是,LORA是SD模型的插件网络,所以必须配合SD一起使用。图中标注了Base Model: SD 1.5,意味着该模型是基于SD 1.5训练的,并且在使用时必须配合SD 1.5才能生成想要的效果。

由于目前civaitai已经屏蔽了中国用户的访问,所以需要科学上网。推荐下我们的civitai模型镜像网站https://aigccafe.com/,国内用户可以顺畅访问,无需百度网盘下载,飞一般的下载速度。

https://aigccafe.com/​aigccafe.com/

如何使用LORA模型

目前社区使用者绝大部分都是基于stable-diffusion-webui这个开源项目,一些相关的整合包(例如秋叶,星空)也是在此基础上进行的简化。因此在这里仅基于这个webui这个项目介绍。

https://github.com/AUTOMATIC1111/stable-diffusion-webui​github.com/AUTOMATIC1111/stable-diffusion-webui

假设你已经完成了webui的安装,将下载的LORA模型放置在文件夹下 "stable-diffusion-webui/models/Lora"文件夹下,以下以水墨画风格的LoRA为例

只需要在生成的时候,prompt增加关键词<lora:filename:multiplier>即可,以上述下载的LoRA模型Moxin_10为例,需要在prompt中增加以下关键字,0.5代表LoRA的强度,可自由调节

<lora:Moxin_10:0.5>

以下是实战效果,在输入好prompt后,在最后增加<lora:Moxin_10:0.7> ,生成如下图片:

Prompt: ((shuimobysim, traditional chinese ink painting)), masterpiece, best quality, fullbody, 1girl, dancing, dynamic pose, wearing white techwear jacket, modelshoot style, posing for a picture, long legs, (standing in a chinese garden)  <lora:Moxin_10:0.7>

如何训练LoRA模型 - 定制你的专属模型

假设你想将自己形象加入模型中,那你需要首先进行数据收集,将自己的照片作为训练数据,训练新的模型并保存。

数据准备;首先收集图片,可以通过爬虫或者直接从搜索引擎下载,这里我们选择直接从百度图片搜索下载。注意,数据准备的质量决定了你最终模型的效果,如果你喂给模型的图是低质量的图,那么模型给你生成的图也是低质量的图,所以尽量保证图片清晰,分辨率较高,无遮挡。这里我们选择下载蔡徐坤的若干张图片,训练一个人物模型。

训练模型;这里推荐使用带GUI的工程kohya_ss,适合没有程序经验的读者使用。按照安装说明完成安装后,打开GUI为以下界面,选择Dreambooth LoRA界面。

为图片打上标签(caption),输入图片的位置,选择Basic Caption,在Prefix项加上你的关键词,例如我们这里关键词命名为caixukun,可以给图片增加更详细的表述,例如a asian man, star。注意,这个关键词和描述非常重要,在生成图片的时候输入这个关键词,才能生成我们想要的效果。

将文件重命名,加上前缀200_,意味着图片要重复200遍,整个训练过程的总steps数为200 * 图片数量

将文件夹重命名为200_caixukun,放置在文件夹下data/lora_train下

开始训练,切换到如下页面,输入图像的路径data/lora_train,模型命名,点击开始训练。注意200_caixukun文件夹是lora_train的子文件夹,这里路径不要写错了

将训练生成好的模型caixukun.safetensors移动到stable-diffusion-webui/models/Lora文件夹下,输入以下prompt,测试一下效果

caixukun, a aisan man, star, <lora:caixukun:1.0>

因为这里只随便选用了7张照片,因此效果不算很好,只能说有一点神似。如果要训练一个高质量的模型,建议准备50张以上的图片。

---------------------------------05.12更新----------------------------------------

这次获取了更多图片,又训练了一个画风LoRA模型。训练集包含2000张高质量图片,由小红书@mimilulu 提供,质量非常之高。

训练采用V100,总共训练20000步,花费4个小时,以下是由该模型生成的一些图片

转自知乎  作者ZOOZOO 侵权必删

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/49781.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JDBC

JDBC背景知识&#xff1a;JDBC的使用1&#xff1a;驱动包的下载2&#xff1a;驱动包引入3&#xff1b;代码实现1&#xff1a;创建数据源2&#xff1a;和数据库创建网络连接3&#xff1a;构造sql语句4&#xff1a;执行sql5&#xff1a;释放资源sql语句的构建细节 查找操作&#…

计算机专业博士未来的方向,清华学霸、UCLA计算机博士专业导师手把手教你申请...

原标题:清华学霸、UCLA计算机博士专业导师手把手教你申请 封面插图来源:Behance 专业导师 Charles 硕士毕业于清华大学 UCLA 计算机博士在读 研究方向:人工智能、机器学习、自然语言处理 要不要考虑申请CS博士? 我一直坚定想去美国读 CS Ph.D,但是身边有人会问我 CS为什么…

UCLA Stata FAQ:Stata常见问题详解

Stata 现场班报名中…… Stata连享会 精品专题 || 精彩推文 文章目录 [Stata 现场班报名中……](https://gitee.com/arlionn/stata_training/blob/master/README.md) Stata Frequently Asked QuestionsTransferring data to/from StataStata to HLM Stata Graphical User Inte…

心理学博士vs计算机博士,UCLA心理学博士排名,地表最客观干货

原标题&#xff1a;UCLA心理学博士排名&#xff0c;地表最客观干货 加州大学洛杉矶分校是一间位于美国加利福尼亚州洛杉矶的公立学校。UCLA是美国商业金融、高科技产业、电影艺术等专业人才的摇篮。UCLA是加利福尼亚大学系统中的第二所大学&#xff0c;与柏克莱加利福尼亚大学(…

ucla ai_UCLA的可持续性:用户体验案例研究

ucla ai Role: UX Researcher / UX Designer / Critical-thinker 角色&#xff1a; UX研究人员/ UX设计人员/批判性思维者 Scope: 4 weeks, March — March 2020 范围&#xff1a; 4周&#xff0c;2020年3月至2020年3月 What I Did: UX Research, Speculative Design, Produc…

UCLA-(R Graphics: Intro to ggplot2)笔记

目录 原文请见R Graphics: Introduction to ggplot2 (12) (ucla.edu)https://stats.oarc.ucla.edu/stat/data/intro_ggplot2_int/ggplot2_intro_interactive.html#(12) 由于CSDN有时候图会看不见&#xff0c;本文将不放置图片 图形的语法元素 Sitka数据集(这一部分其实就是…

医学图像公开数据集

1. 前列腺数据集 ​ 包含六个center的前列腺分割数据集&#xff08;可以用来做multi-domain相关的分割任务&#xff09;&#xff0c;详细情况可以查看下表&#xff0c;可以从这条 github链接下载和预处理数据集

UCLA ECE M199 Winter 2021 Midterm Review 笔记整理

UCLA 2021 M199 嵌入式课程中期复习笔记整理 原视频连接&#xff1a;点击

火爆的图机器学习,2020年将有哪些研究趋势?

2020-02-05 23:41 导语&#xff1a;ICLR 2020 图机器学习全面分析 2019年绝对是图机器学习&#xff08;GML&#xff09;大火的一年&#xff0c;凡是学术会议&#xff0c;图神经网络的会场总会爆满。 图机器学习的研究之所以在2019年突然变得火热&#xff0c;原因在于&#x…

ucla研究生计算机科学,详解UCLA研究生录取数据,达到什么标准才能稳被录?

原标题&#xff1a;详解UCLA研究生录取数据&#xff0c;达到什么标准才能稳被录&#xff1f; 加州大学洛杉矶分校(UCLA)成立于1919年。它是继加州大学伯克利分校和加州大学戴维斯分校之后的第三所加州大学。 UCLA经常被评为世界顶尖大学之一。它在2019年USNews上评为美国排名第…

ucla研究生计算机科学,揭秘UCLA研究生录取数据,达到什么标准才能稳被录?

原标题&#xff1a;揭秘UCLA研究生录取数据&#xff0c;达到什么标准才能稳被录&#xff1f; 加州大学洛杉矶分校(UCLA)成立于1919年。它是继加州大学伯克利分校和加州大学戴维斯分校之后的第三所加州大学。 UCLA经常被评为世界顶尖大学之一。它在2019年USNews上评为美国排名第…

2018 ucla计算机排名,2018福布斯最具价值美国大学排名:加州UCLA位列榜首!

对于美国留学的申请来说&#xff0c;也许大家在选校过程中都会比较倾向于USNEWS的院校排名榜。但是&#xff0c;怎样从多方面更多的了解你想要选择的学校呢&#xff1f;美国著名的权威财经杂志《福布斯》根据净价格、净债务、校友收入、按时毕业、学校质量等指标进行排名&#…

加州ucla 计算机学校,美国加州大学洛杉矶分校UCLA计算机硕士CS录取

原标题&#xff1a;美国加州大学洛杉矶分校UCLA计算机硕士CS录取 【背景介绍】 H同学&#xff0c;美国本科&#xff0c;CS; GPA 3.79/4.0&#xff0c;GRE 332&#xff0c;免TOEFL; University of California-Los Angeles&#xff0c;MS in Computer Science 加州大学洛杉矶分校…

ucla 计算机网络,2020年UCLA计算机工程排名珍贵干货专业讲解

原标题&#xff1a;2020年UCLA计算机工程排名珍贵干货专业讲解 UCLA著名的理由很多&#xff0c;当中包含它拥有800万册以上藏书的图书馆&#xff0c;得奖连连的体育团体(UCLA的篮球队在美国NCAA大学联赛中获得冠军最多&#xff0c;号称篮球大学);直到去年为止UCLA获得99次美国全…

吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入

微软Azure平台的语音合成(TTS)技术确实神乎其技&#xff0c;这一点在之前的一篇&#xff1a;含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)&#xff0c;已经做过详细介绍&#xff0c;然则Azure平台需要信用卡验证&#xff0c;有一定门槛&…

关于讯飞科大语音识别SDK导入的10407问题

一、问题 使用科大讯飞SDK做在线语音识别&#xff0c;参考别人项目在Java中实现在线语音识别实现的时候&#xff0c; 因为导入了别人SDK中的.so文件&#xff0c;所以使用别人Appid的时候项目可以正常运行&#xff0c;但是采用自己的Appid就会出错&#xff0c;出现错误如下&am…

科大讯飞语音合成实例

代码地址如下&#xff1a;http://www.demodashi.com/demo/13209.html 前言 今天讲讲科大讯飞的语音合成功能吧 涉及以下内容&#xff1a; 1. 在科大讯飞平台上创建应用 2. 在androidstudio中的配置 3. 语音合成相关代码 4. 语音合成工具类SpeechHelper的调用 5. 使用过程…

Android 科大讯飞离线语音识别

最近Boss让我开发一个离线语音听写功能 , 可是我发现科大讯飞的离线版本下架了 , 也看了很多地方如百度语音....... 都没发现有离线版本 , 然而今天突然发现科大讯飞的离线听写又上架了 这就让我很开心 . 我就立马把它下载了下来,集成到我的项目中去 . 然后经过一个小时的努力…

Python调用科大讯飞语音合成离线SDK

Python调用科大讯飞语音合成离线SDK 科大讯飞语音合成技术代码展示总结 科大讯飞语音合成技术 科大讯飞语音合成技术在国内是领先的&#xff0c;如果单纯想要Python语言对其进行编写&#xff0c;是不支持的。故我们可以采用对其离线C语言的SDK进行调用&#xff0c;从而达到我们…