Stable Diffusion stable-diffusion-webui ControlNet Lora

Stable Diffusion

Stable Diffusion用来文字生成图片，ControlNet就是用来控制构图的，LoRA就是用来控制风格的。

stable-diffusion-webui

国内加速官网：

mirrors / AUTOMATIC1111 / stable-diffusion-webui · GitCode

安装参考：

Stable Diffusion安装与常见错误（+Lora使用）2023年最新安装教程_cycyc123的博客-CSDN博客

ComfyUI

保姆级教程：从0到1搭建Stable Diffusion XL完整工作流进行AI绘画_WeThinkIn的博客-CSDN博客

StableDiffusion模型资源探索食用指南 - 知乎

大模型

大模型特指标准的latent-diffusion模型。拥有完整的TextEncoder、U-Net、VAE。

由于想要训练一个大模型非常困难，需要极高的显卡算力，所以绝大多数人不会训练大模型。

CKPT

经过训练的图片合集，被称作模型，也就是chekpoint

CKPT的全称为CheckPoint（检查点），完整模型的常见格式，模型体积较大，一般真人版的单个模型的大小在7GB左右，动漫版的在2-5个G之间。

早期的CKPT后缀名是ckpt，如今新的CKPT后缀名都是safetensors

VAE

全称：VAE全称Variational autoencoder。变分自编码器，负责将潜空间的数据转换为正常图像。

后缀格式：后缀一般为.pt格式。

Lora

是一种体积较小的绘画模型，是对大模型的微调。与每次作画只能选择一个大模型不同，lora模型可以在已选择大模型的基础上添加一个甚至多个。一般体积在几十到几百兆左右。

Lora的后缀名也是safetensors，对于小白来说，容易和ckpt造成误解，所以讲一下如何安装。

CKPT和lora的安装

对于绝大部分用户来说，主要用得到的模型文件就两种，一种是CKPT，一种是lora。

最好的模型下载网站，是传说中的C站，http://civitai.com（需科学上网）。

CKPT的安装路径是models\stable-diffusion 拷贝过来即可使用（只需刷新，无需重启服务）。

./stable-diffusion-webui/models/Stable-diffusion

Loar的安装路径容易搞错，Stable Diffusion的安装目录下默认有个models\lora ，但很多教程都提醒并非这个lora目录，

.stable-diffusion-webui/models/Lora

而是另一个：extensions\sd-webui-additional-networks\models\lora

然而事实上，默认解压缩好的Stable Diffusion是没有后面这个路径的，也不要手工创建，需要在Stable Diffusion的网页界面进行如下操作。

AI学习笔记|让数字生命更真实：模型（chekpoint）和微调模型（lora） - 知乎

Stable Diffusion XL

参考

深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识 - 知乎

上表是Stable Diffusion XL与之前的Stable Diffusion系列的对比，从中可以看出，Stable DiffusionV1.4/1.5的U-Net参数量只有860M，就算是Stable DiffusionV2.0/2.1，其参数量也不过865M。但等到Stable Diffusion XL，U-Net模型（Base部分）参数量就增加到2.6B，参数量增加幅度达到了3倍左右。

目前能够加载Stable Diffusion XL模型并进行图像生成的框架有四种：