stable-diffusion-webui sdxl模型代码分析

采样器这块基本都是用的k-diffusion，模型用的是stability的原生项目generative-models中的sgm，这点和fooocus不同，fooocus底层依赖comfyui中的models，comfy是用load_state_dict的方式解析的，用的load_checkpoint_guess_config函数，这个函数webui中也有。

webui在paths中导入了generative-models，在sd_model_config中导入了config.sdxl和config.sdxl_refiner两个config，模型使用sgm下的models/diffusion/DiffusionEngine初始化，refiner和base的模型几乎是一致的。

python webui.py --port 6006 --no-half-vae

webui()->initialize()->
initialize_rest()->
- sd_samplers.py -> set_samplers()->sd_samplers_kdiffusion.py->
- extensions.py -> list_extensions()
- initialize_util.py -> restore_config_state_file()
- sd_models.py -> list_models()
- localization.py -> list_localizations()
- scripts.load_scripts() -> scripts.py 
-- scripts_txt2img=ScriptRunner()/scripts_img2img=ScriptRunner()/scripts_postpro=scripts_postprocessing.ScriptPostprocessingRunner()(scripts_postprocessing.py)
- modelloader.py -> load_upscaler()
- sd_vae.py -> refresh_vae_list()
- textual_inversion/textual_inversion.py -> list_textual_inversion_templates() 
- script_callbacks.py -> on_list_optimizers(sd_hijack_optimizations.list_optimizers)
- sd_hijack.py -> list_optimizers()
- sd_unet.py -> list_unets()
- load_model -> shared.py 
- shared_items.py -> reload_hypernetworks() # 这种方式现在几乎不用了
- ui_extra_networks.py -> initialize()/register_default_pages()
- extra_networks.py -> initialize()/register_default_extra_networks()ui.py -> ui.create_ui()

ui.py

一些基础参数的初始化也在这里，关于ui设计在webui中代码还是挺多的

ui_components.py 一些设计的ui组件

shared_items.py 重复的一些item

下面就是一个FormRow：

elif category == "dimensions":with FormRow():with gr.Column(elem_id="txt2img_column_size", scale=4):width = gr.Slider(minimum=64, maximum=2048, step=8, label="Width", value=512, elem_id="txt2img_width")height = gr.Slider(minimum=64, maximum=2048, step=8, label="Height", value=512, elem_id="txt2img_height")....

调用接口入口：

txt2img_args = dict(fn=wrap_gradio_gpu_call(modules.txt2img.txt2img, extra_outputs=[None, '', '']),_js="submit",inputs=[dummy_component,toprow.prompt,toprow.negative_prompt,toprow.ui_styles.dropdown,steps,sampler_name,batch_count,batch_size,cfg_scale,height,width,enable_hr,denoising_strength,hr_scale,hr_upscaler,hr_second_pass_steps,hr_resize_x,hr_resize_y,hr_checkpoint_name,hr_sampler_name,hr_prompt,hr_negative_prompt,override_settings,] + custom_inputs,

txt2img.py

p = processing.StableDiffusionProcessingTxt2Img(sd_model,,prompt,negative_prompt,sampler_name,...)->
processed = processing.process_images(p)

processing.py

res = process_image_inner(p)
- sample_ddim = p.sample(conditioning,unconditional_conditioning,seeds,subseeds,subseed_strength,prompts)-> StableDiffusionProcessingTxt2Img.sample()
-- self.sampler = sd_sampler.create_sampler(self.sampler_name,self.sd_model)
-- samples = self.samplers.sample(c,uc,image_encoditioning=self.txt2img_image_conditioning(x))

sd_samplers_kdiffusion.py

sample()->
samples = self.launch_sampling(steps,lambda:self.func(self.model_wrap_cfg,x,self.sampler_extra_args,...))
model_rap_cfg:CFGDenoiseKDiffusion->sd_samplers_cfg_denoiser.CFGDenoiser

sd_samplers_common.py

func() = sample_dpmpp_2m ->

repositories/k-diffusion/k_diffusion/sampling.py

sample_dpmpp_2m()->
- denoised = model(x,sigmas[i]*s_in,**extra_args)->
...
# 此处就是去噪产生图片的过程

modules/sd_samplers_cfg_denoiser.py model =

CFGDenoiser()->
forward(x:2x4x128x128,sigma:[14.6146,14.6146],uncond:SchedulePromptConditionings,cond:MulticondLearnedConditioning,cond_scale:7,s_min_uncond:0,image_cond:2x5x1x1)->
denoised:2x4x128x128
# unet预测都被封装在这里

modules/sd_models.py 这块主要是

reload_model_weights()->
sd_model = reuse_model_from_already_loaded(sd_model,checkpoint_info,...)
load_model()
....

modules/sd_samplers_common.py

sd_models.reload_model_weights(refiner_checkpoint_info)
cfg_denoiser.update_inner_model()->

modules/sd_samplers_cfg_denoiser.py

forward()->

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/162066.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

stable-diffusion-webui sdxl模型代码分析

相关文章

java影院管理信息系统设计参考学习

【AI视野·今日Robot 机器人论文速览第五十五期】Mon, 16 Oct 2023

Node介绍(nvm安装和npm常用命令)

【2023最新版】Python全栈知识点总结

CSS属性：定位属性+案例讲解：博雅互动前端开发入门笔记（五）

无声的世界，精神科用药并结合临床的一些分析及笔记（九）

AMEYA360：君正低功耗AIoT图像识别处理器—X1600/X1600E

C++ 类和对象（上）------超详细解析，小白必看系列

[MAUI]深入了解.NET MAUI Blazor与Vue的混合开发

TCP/IP(十八)TCP 实战抓包分析(二)TCP 三次握手和四次挥手

【mfc/VS2022】计图实验:绘图工具设计知识笔记2

ruoyi识别访问设备是pc端还是移动端跳转到对应的登录页面

TCP通信-同时接受多个客户端消息

【网络安全 --- MySQL数据库】网络安全MySQL数据库应该掌握的知识，还不收藏开始学习。

ABB变频器使用PROFINET IO通信模块时的激活方法

客户管理系统是如何提高工作效率的？

2023年四川省网络与信息安全技能大赛初赛个人赛 Writeup

访问文件夹

【Note】CNN与现代卷积神经网络part3（附PyTorch代码）

解码yakit 适配中国的只要base64加密直接yakit