Kolors是什么
可图(Kolors):用于真实感文本到图像合成的扩散模型的有效训练
可图,是快手开源的一个文生图模型,架构上使用了chatglm,比普通的sd模型在中文理解上要强大很多,以往sd模型的提示词理解能力往往只有两种 1、理解英文单词 2、理解中文单词,但是不理解中文俗语, 更不理解句子。可图解决了这个问题, 可以理解长文本中的语义,不需要学习复杂的提示词
可图的一个亮点就是生成图片有文字。(测试发现并不能生成太长的文字)
快速部署
打开网址 CodeWithGPU | 能复现才是好算法 ,这个是autodl算法镜像的社区,里面已经有一个kolros的镜像
可图(Kolors):用于真实感文本到图像合成的扩散模型的有效训练
在网页右侧可以看到如下信息:
Kwai-Kolors/Kolors
镜像版本:
框架:PyTorch: 2.3.0
CUDA:11.8
镜像大小:21.36GB
docker pull registry.cn-beijing.aliyuncs.com/codewithgpu2/kwai-kolors-kolors:Pq5DUevPsX
AutoDL创建实例
点击《AutoDL创建实例》按钮, 则会 进入到gpu 选购页面, 可以自己选择机器,我的机器配置如下:
镜像
Kwai-Kolors/Kolors/Kolors:v1.0
GPU
RTX 3090(24GB) * 1
CPU
12 vCPU Intel(R) Xeon(R) Platinum 8375C CPU @ 2.90GHz
内存
72GB
硬盘
系统盘:30 GB
数据盘:免费:50GB SSD 付费:0GB
附加磁盘
无
端口映射
无
网络
同一地区实例共享带宽
计费方式
按量计费
费用
¥1.66/时
付费运行后,在autodl界面可以看到正在准备环境,大约需要10-20分钟。
准备完毕后,点击juypter lab 即刻打开服务器页面。
登录服务器后,可以看到如下页面, 打开run.ipynb
这时会打开一个notebook , 按顺序执行代码即可
也可以用web界面进行操作生成图片
1、使用 Gradio/WebUI 运行
cd /root/Kolors
python gradio_app.py