快手文生图模型-Kolors快速上手

Kolors是什么

可图(Kolors)：用于真实感文本到图像合成的扩散模型的有效训练

可图，是快手开源的一个文生图模型，架构上使用了chatglm，比普通的sd模型在中文理解上要强大很多，以往sd模型的提示词理解能力往往只有两种 1、理解英文单词 2、理解中文单词，但是不理解中文俗语，更不理解句子。可图解决了这个问题，可以理解长文本中的语义，不需要学习复杂的提示词

可图的一个亮点就是生成图片有文字。（测试发现并不能生成太长的文字）

快速部署

打开网址 CodeWithGPU | 能复现才是好算法，这个是autodl算法镜像的社区，里面已经有一个kolros的镜像

可图(Kolors)：用于真实感文本到图像合成的扩散模型的有效训练

在网页右侧可以看到如下信息：

Kwai-Kolors/Kolors

镜像版本:

框架:PyTorch: 2.3.0

CUDA:11.8

镜像大小:21.36GB

docker pull registry.cn-beijing.aliyuncs.com/codewithgpu2/kwai-kolors-kolors:Pq5DUevPsX

AutoDL创建实例

点击《AutoDL创建实例》按钮，则会进入到gpu 选购页面，可以自己选择机器，我的机器配置如下：

镜像
Kwai-Kolors/Kolors/Kolors:v1.0
GPU
RTX 3090(24GB) * 1
CPU
12 vCPU Intel(R) Xeon(R) Platinum 8375C CPU @ 2.90GHz
内存
72GB
硬盘
系统盘:30 GB
数据盘:免费:50GB SSD  付费:0GB
附加磁盘
无
端口映射
无
网络
同一地区实例共享带宽
计费方式
按量计费
费用
￥1.66/时

付费运行后，在autodl界面可以看到正在准备环境，大约需要10-20分钟。

准备完毕后，点击juypter lab 即刻打开服务器页面。

登录服务器后，可以看到如下页面，打开run.ipynb