【StableDiffusion】SD1.4、1.5、2.0、2.1 和 SDXL0.9-1.0、SDXL turbo 等的区别

总览

1.基础sd base model家族:SD1.4、SD1.5、SD1.5-LCM、SD2.0、SD2.0-768、SD2.1、SD2.1-768、SD2.1-UNCLIP
2.升级sdxl base model家族:SDXL0.9、SDXL1.0、SDXL1.0-LCM、SDXL-DISTILLED、SDXL-TURBO
3.专门用于视频生成的 SVD 家族:SVD、SVD-XT
4.最新科研:playground-v2、PixArt-α

在这里插入图片描述


一、基础sd base model家族

1.SD1.4

没什么好说的,古老的SD模型,现在已经几乎不使用了

2.SD1.5

生态较好,使用此版本的模型还是比较多的

3.SD1.5-LCM

将 attention 换为 T 个 什么玩意来着 忘了 然后在这些小块里实现 self-attention

4.SD2.0

升级迭代,使用 512*512 像素的图片数据集来训练

5.SD2.0-768

使用 768*768 像素的图片数据集来训练,更精准清晰

6.SD2.1

升级迭代,使用 512*512 像素的图片数据集来训练

7.SD2.1-768

使用 768*768 像素的图片数据集来训练,更精准清晰

8.SD2.1-UNCLIP

借鉴了 OpenAI 的 DALL`2 模型


二、升级sdxl base model家族

1.SDXL0.9

1.0 的内测版本,仅供研究使用

2.SDXL1.0

· 正式发布的 SDXL1.0
· 模型参数更大,基础模型所使用的Unet包含了2.6B(2.6亿)的参数,相比SD1.5的860M(8600万)参数,相差超过三倍。
· 语义理解能力更强,使用了两个CLIP模型的组合,提高了对语言的理解能力。
· 训练数据库更大,通过改进训练方法,将图片尺寸也作为训练参数,大大扩展了训练的图片数量。
· 可以生成种类更加丰富、质量更高的图片,采用两阶段生图流程,第一阶段使用基础模型生成,第二阶段使用细化模型进一步提升画面细节表现。
· 生图分辨率更高,最佳分辨率达到了1024x1024,原生支持更多不同的分辨率。
· 可以在图片中直接生成文本,使得SDXL可以进行海报设计等需要在图片中添加文字的工作。

3.SDXL1.0-LCM

潜在一致性模型,说人话,用更少的步骤、更快的速度生成和 SDXL 一致的图片

4.SDXL-DISTILLED

一个特殊模型,专门为了速度而生,采用了特殊的蒸馏方式

5.SDXL-TURBO

使用蒸馏技术的究极nb版本,由对抗扩散蒸馏 (ADD) 的训练方法提供支持,出图贼快,效果几乎和 SDXL 一致(较比 SDXL 较弱,但几乎无影响)


三、专门用于视频生成的 SVD 家族

1.SVD

支持 14 fps 视频生成
用于 文字转视频、图片转视频,用了巨大的数据集(5.8亿个视频剪辑恐怖如斯)来支持训练

2.SVD-XT

支持 25 fps 视频生成


四、最新科研的 Playground-v2、PixArt-α、

1.Playground-v2

恐怖到能让用户评判分数高出 SDXL1.0 的 2.5倍的最新成果
实际上,好像和 SDXL 差不太多,但是确实 Playgroundv2 的艺术感更强

2.PixArt-α

华为研发的,训练成本极低的一个模型,质量和美感都还不错

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/333646.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙知识点总结

1 Stage模型应用程序包结构 在开发态,一个应用包含一个或者多个Module,可以在DevEco Studio工程中创建一个或者多个Module。Module是HarmonyOS应用/服务的基本功能单元,包含了源代码、资源文件、第三方库及应用/服务配置文件,每一…

华为CE6851-48S6Q-HI升级设备版本及补丁

文章目录 升级前准备工作笔记本和交换机设备配置互联地址启用FTP设备访问FTP设备升级系统版本及补丁 升级前准备工作 使用MobaXterm远程工具连接设备,并作为FTP服务器准备升级所需的版本文件及补丁文件 笔记本和交换机设备配置互联地址 在交换机接口配置IP&#…

[AIGC] Java常用的JSON库及简单示例

Java常用的JSON库及简单示例 在Java的世界里,JSON库广泛用于日常开发工作,本文将介绍几个常用的JSON库并配以简单的示例代码。 1. Gson Gson是Google提供的一个用来在Java对象和JSON数据之间进行转换的Java库。 它有一定的学习曲线,但一旦熟…

财务RPA机器人如何使用

随着科技的不断发展,自动化技术在各个领域得到了广泛应用,在财务领域,RPA机器人已经成为一种新兴的技术手段,帮助众多企业实现了财务流程的自动化,大大提高了工作效率,降低人力成本。 本文金智维将详细介绍…

move base全解

0. 简介 之前我们专门有一节讲到了《move_base源码学习》。主要介绍了MoveBase基类中函数的大概意思以及调用的方式。move_base是ROS下关于机器人路径规划的中心枢纽。它通过订阅激光雷达、map地图、amcl的定位等数据,然后规划出全局和局部路径,再将路径…

2024年03月 Python(三级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 在Python中,hex(2023)的功能是?( ) A:将十进制数2023转化成十六进制数 B:将十进制数2023转化成八进制数 C:将十六进制数2023转化成十进制数 D:将八进制数2023转化成十进制数 答案:A …

东莞MES管理系统在电子工厂的益处

东莞MES管理系统对东莞电子企业带来了许多好处,包括但不限于以下几点: 提高生产效率:MES系统可以优化生产计划、监控生产过程,提高生产效率,减少生产中的浪费和停机时间,提高产能利用率。 优化库存管理&a…

洛谷 CF1209D Cow and Snacks

题目来源于:洛谷 题目本质:并查集 解题思路: 我们以每种化为一个点,以每个客人喜欢的两朵花给两朵花连一条无向边。则会出现一定数目的连通块,连通块总个数为 ans。 对每个连通块进行分析:第一个客人买走…

指纹识别经典图书、开源算法库、开源数据库

目录 1. 指纹识别书籍 1.1《精通Visual C指纹模式识别系统算法及实现》 1.2《Handbook of Fingerprint Recognition》 2. 指纹识别开源算法库 2.1 Hands on Fingerprint Recognition with OpenCV and Python 2.2 NIST Biometric Image Software (NBIS) 3. 指纹识别开源数…

马斯克:AI时代人人高收入,不需要工作,商品服务不再短缺,可能性80%

当前人工智能现状和未来如何?AI时代下,人类未来会发生哪些变化? 埃隆马斯克(Elon Musk)在2024 VivaTech大会上分享了关于地球未来的诸多愿景。 投资作业本课代表摘录了其中的要点,分享给大家&#xff1a…

ROS | 自动导航

保存&加载地图: image:地图文件 resolution:地图分辨率(珊格地图) origin:地图左下标 第三个参数是偏转角度 加载创建好的yaml文件: 年轻人第一次导航: 全局规划器: 代价地图设置参数&#…

QQ名片满级会员展示生成HTML源码

源码介绍 QQ名片满级会员展示生成HTML源码,源码由HTMLCSSJS组成,双击html文件可以本地运行效果,也可以上传到服务器里面,保存素材去选择QQ个性名片-选择大图模板-把图上传照片墙即可 源码效果 源码下载 蓝奏云:http…

Habicht定理中有关子结式命题3.4.6的证明

个人认为红色区域有问题,因为 deg ⁡ ( ϕ ( S j ) ) r \deg{\left( \phi\left( S_{j} \right) \right) r} deg(ϕ(Sj​))r,当 i ≥ r i \geq r i≥r时, s u b r e s i ( ϕ ( S j 1 ) , ϕ ( S j ) ) subres_{i}\left( \phi(S_{j 1}),\p…

C++进阶 | [4] map and set

摘要:set,multiset,map,multimap 前言 1. 容器 序列式容器:只存储数据,数据之间无关联关系。例如,vector、list、deque、……关联式容器:不仅存储数据,且数据之间有关联…

AI智能体|扣子Coze文生图功能接入微信公众号

大家好,我是无界生长。 AI智能体|扣子Coze文生图功能接入微信公众号本文分享了如何将Coze平台的文生图功能接入微信公众号的详细操作流程,包括创建图像流、创建并配置Bot、设置提示词和开场白、调试、发布等步骤。如果看完还没学会的话&…

stream-并行流

定义 常规的流都是串行的流并行流就是并发的处理数据&#xff0c;一般要求被处理的数据互相不影响优点&#xff1a;数据多的时候速度更快&#xff0c;缺点&#xff1a;浪费系统资源&#xff0c;数据少的时候开启线程更耗费时间 模版 Stream<Integer> stream1 Stream.of…

ELK 日志监控平台(一)- 快速搭建

文章目录 ELK 日志监控平台&#xff08;一&#xff09;- 快速搭建1.ELK 简介2.Elasticsearch安装部署3.Logstash安装部署4.Kibana安装部署5.日志收集DEMO5.1.创建SpringBoot应用依赖导入日志配置文件 logback.xml启动类目录结构启动项目 5.2.创建Logstash配置文件5.3.重新启动L…

wordpress教程视频 wordpress教程网盘 wordpress教程推荐wordpress教程网

WordPress&#xff0c;作为一款强大且灵活的开源内容管理系统&#xff0c;已成为许多网站开发者与运营者的首选。其强大的功能、丰富的插件以及易于上手的特点&#xff0c;使得无论是初学者还是专业开发者都能轻松构建出个性化的网站。然而&#xff0c;对于初学者来说&#xff…

亚马逊高效广告打法及数据优化,亚马逊高阶广告打法课

课程下载&#xff1a;https://download.csdn.net/download/m0_66047725/89342733 更多资源下载&#xff1a;关注我。 课程内容&#xff1a; 001.1-亚马逊的广告漏斗和A9算法的升级变化.mp4 002.2-流量入口解析和广告的曝光机制.mp4 003.3-标签理论 .mp4 004.4-不同广告类…

在未来你将何去何从?

在数字化的浪潮中&#xff0c;信息技术行业无疑是推动全球经济和社会发展的重要动力。随着科技的不断迭代与进步&#xff0c;云计算、大数据、人工智能&#xff08;AI&#xff09;、物联网&#xff08;IoT&#xff09;、5G通信和区块链等技术已经深入到我们生活的每一个角落&am…