Stable Diffusion WebUI 图生图(img2img):图生图/涂鸦绘制/局部重绘/有色蒙版/上传蒙版/批量处理/反推提示词

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~

本篇文章我们介绍 Stable Diffusion WebUI 的图生图功能,主要包括:图生图、图生图(手绘修正)/涂鸦绘制、局部重绘、局部重绘(有色蒙版)、局部重绘(上传蒙版)、批量处理和反推提示词等。
希望能对你有所帮助!
image.png

文章目录

  • 一、图生图
    • 1. 提示词
    • 2. 上传图片
    • 3. 缩放模式
    • 4. 调整分辨率
    • 5. 按比例缩放
    • 6. 重绘幅度
  • 二、图生图(手绘修正)/涂鸦绘制
  • 三、局部重绘
    • 1. 蒙版模糊
    • 2. 重绘区域
    • 3. 重绘参考内容
    • 4. 重绘画布大小
    • 5. 以蒙版尺寸重绘时的外部填充半径(像素)
  • 四、局部重绘(有色蒙版)
  • 五、局部重绘(上传蒙版)
  • 六、批量处理
  • 七、反推提示词
    • 1. Clip 反推提示词
    • 2. DeepBooru 反推提示词


一、图生图

今天我们一起来看一下 Stable Diffusion WebUI 的图生图(img2img)功能。该功能主要是根据现有的图片来调整细节,或者调整风格,最终生成一张新的图片。
我们可以在文生图(txt2img)中批量生成小姐姐图片,然后选择一张心动的小姐姐,然后点击下面的“将图片和生成参数发送到图生图页面”按钮,图片就跑到图生图页面了。
image.png

1. 提示词

图生图中的提示词是用于针对原图的。该提示词为可选项,但是不填写可能会导致生成的图片效果质量不佳。这里通常与原图的提示词保持一致就行。
image.png

2. 上传图片

此处就是图生图用来上传原图的地方。可以点击上传;也可以将图片拖到此处;还可以将文生图中的图片“发送到”此处;或者将图库浏览器中的图片“发送到”此处。
image.png

3. 缩放模式

当新生成的图片尺寸与原图(参考图)不一致时,需要选择合适的缩放模式(Resize mode);如果尺寸相同,选择哪一种模式都没有问题的。
缩放模式有四种:
image.png

  • 拉伸原图(Just resize):在这种模式下,图片会按照指定的宽度和高度进行直接拉伸。这可能会导致图片中的人物或物体在横向和纵向上被拉长或压扁,从而影响图片的整体比例和视觉效果。
  • 剪裁原图(Crop and resize):当图片的尺寸与原图的尺寸不匹配时,裁剪模式会选择原图的中间部分进行显示,而上下或左右两侧的部分则会被裁剪掉。这样可以确保图片的核心内容得到保留,但可能会损失一些边缘信息。
  • 填充空白(Resize and fill):如果目标尺寸大于原图尺寸,填充模式会根据原图边缘的内容自动填充空白区域。这通常涉及到一些算法来推测并生成与原图风格和内容相匹配的填充内容,以保持图片的连贯性和完整性。
  • 仅调整大小(Just resize):这是一种更复杂的缩放方式,它涉及到对图片的潜在变量进行放大或缩小。这种缩放方式可以更好地保留图片的原始信息和细节,但也可能导致一些不可预测的效果,需要根据具体情况进行调整和优化。

下图展示了各种缩放模式的生成效果(原图:512*768,缩放后:512*512):
4.jpg

4. 调整分辨率

调整分辨率(Resize to)用于调整生成图片的分辨率,通常要与原图相同,或比例相同。点击“小尺子”图标,可以填充原图的分辨率。
image.png

5. 按比例缩放

按比例缩放(Resize by)可以保持原图的宽高比来缩放,下面也会直接显示缩放后的尺寸。
image.png

6. 重绘幅度

重绘幅度(Denoising strength)表示新生成的图片会有多大程序改变原图,值越大AI的自由发挥空间就越大,也越不像原图。
image.png
这个可以根据实际情况来选择,如果你不想改变太多,就将重绘幅度调小;如果想改变风格,就调大。
下图为重绘幅度从01的变化情况:
5.png
例如,我们想加上海滩背景,就可以在提示词中增加 beach background,并将重绘幅度调大,例如 0.8
image.png

二、图生图(手绘修正)/涂鸦绘制

手绘修正/涂鸦绘制(Sketch)是一个特色功能,其操作界面与图生图界面相似,但在原图界面上增加了几个特定的选项。这些选项允许用户控制涂鸦画笔的大小、选择涂鸦颜色以及撤销上一步的操作。
具体来说,用户可以先在要添加物件的部位进行涂鸦,然后在提示词处输入要绘制的物件。通过调整重绘幅度和其他相关设置,可以生成具有所需涂鸦效果的图像。
例如,下图中画了一个白点和一个红点,提示词中增加“蝴蝶”,生成的图片中,就会在相应位置出现两个蝴蝶,颜色也是画笔的颜色:
image.png

注意:可以看出,上图中蝴蝶画出来了,但小姐姐的脸也换了,所以 Sketch 不仅改变了涂鸦部分,也会改变整体画面或风格。

三、局部重绘

局部重绘(Inpaint)功能是一项强大的工具,它允许用户在生成的图像上进行精细的修改和重绘。通过这个功能,用户可以轻松地对图像的特定区域进行编辑,从而改变画面的细节或风格。
使用局部重绘功能时,用户首先需要选择要修改的区域,然后利用提供的工具进行涂鸦或绘制。在这个过程中,用户可以调整画笔的大小、颜色以及透明度等参数,以实现更精确的绘制效果。同时,Stable Diffusion WebUI还提供了撤销和橡皮擦功能,方便用户随时修正错误或调整绘制区域。
局部重绘功能的核心在于其蒙版技术。蒙版可以遮住图像的关键区域,用户可以在蒙版上进行绘制,而不会影响其他部分。通过这种方式,用户可以实现对特定区域的精确控制,同时保持整体画面的完整性。

例如,下图中我们使用画笔工具将小姐姐的头发给盖住,这部分就是蒙版部分,然后在提示词中输入“绿色头发”,那么重新生成的小姐姐的头发变成绿色了:
image.png
此外,局部重绘功能还支持多种参数设置。用户可以根据需要调整蒙版模糊、蒙版区域以及重绘幅度等参数,以获得更满意的绘制效果。这些参数的设置可以帮助用户更好地控制绘制过程,实现更精确的修改。

1. 蒙版模糊

蒙版模糊(Mask blur)用于设置重绘部分与原图的衔接处的模糊度,起到渐变的作用,让衔接看起来比较自然。衔接不好时可以调大一点看看。
蒙版模糊设为1时,会有明显的衔接:
image.png
蒙版模糊设为20时,衔接部分变得更自然了:
image.png

2. 重绘区域

重绘区域(Mask mode)有两个选项:蒙版内和蒙版外。蒙版内表示只重绘蒙版内部的画面,而蒙版外表示重绘蒙版外部的画面。
默认选项为蒙版内,如果改成蒙版外,下图中就会将蒙版外部的头发变成了绿色,甚至还改变了其它元素。
image.png

3. 重绘参考内容

重绘参考内容(Masked content)表示AI在重绘蒙版内蒙时需要参考的元素。有四个选项:填充空白(fill)、原图像素(original)、潜空间噪声(latent noise)、空白潜空间(latent nothing)。
推荐:如果你想让AI自由发挥,可以选择 fill;如果想要与原图保持一致,就使用默认的 original

如下对这四个选项进行一个对比,我们将小姐姐的衣服全部蒙住,让AI来重新绘制:
image.png
(1)填充空白(fill):在渲染时不根据原图的任何元素生成图片。
xyz_grid-0001-1946211942.png
(2)原图像素(original):在渲染时根据原图中的元素生成图片,这也是默认选项。
xyz_grid-0002-4057128629.png
(3)潜空间噪声(latent noise):在渲染时不根据原图的任何元素生成图片,比 fill 想象力更丰富,增加了更多的细节,也需要更多的重绘幅度。
xyz_grid-0003-691857714.png
(4)空白潜空间(latent nothing):在渲染时不根据原图的任何元素生成图片,类似 fill,增加了更多的细节。
xyz_grid-0004-2491264229.png

4. 重绘画布大小

重绘画面大小(Inpaint area)又叫重绘区域,

以原图尺寸重绘(Whole picture) : 如果选的是Whole picture,那AI会基于你的新的要求,把整张图重新画一遍, 但最后只保留你框出来的这一块区域, 拼回到原图里面去。
以蒙版尺寸重绘(Only masked): 如果选择的是Only masked,AI就会只重绘蒙版区域,把它当成一张完整的图画好, 然后再拼回去,它涉及区域小,绘制速度固然更快,但因为它没法读取你的图像全貌,所以经常出现拼上去以后变得奇奇怪怪的问题。因此多数时候推荐使用 Only masked 选项 , 也就是整张重画再拼回去。
Only masked更适合用在,一些针对性强的修改, 想要画一点原图里面没有的东西,但是这个时候我们需要降低重绘幅度,避免变形,并且对提示词做净化处理,这是属于比较进阶的内容了。
下图为以原图尺寸重绘(Whole picture):
00177-1209430900.png
下图为以蒙版尺寸重绘(Only masked),脖子部分有很明显的阴影:
00176-1209430900.png

5. 以蒙版尺寸重绘时的外部填充半径(像素)

以蒙版尺寸重绘时的外部填充半径(Only masked padding,pixels)选项表示使用“以蒙版尺寸重绘(Only masked)”时参考使用蒙版附近的元素的值。值越小参考蒙版附近的元素就越少,出来的图就越随意;值越大参考的就越多,出来的图就更贴切更契合。

四、局部重绘(有色蒙版)

局部重绘/有色蒙版(Inpaint sketch)与局部重绘类似,但可以识别蒙版的颜色。
例如下图,生成的图片参考了蒙版的颜色:
image.png
比局部重绘还多了一个调整蒙版的透明度功能:
image.png

五、局部重绘(上传蒙版)

局部重绘/上传蒙版(Inpaint upload)允许我们上传一张蒙版,然后根据蒙版让AI生成内容。蒙版必须是白色的,其它为黑色的。可以使用PS或者 Segment Anything 插件来制作蒙版。
下面分别上传了原图和蒙版:
image.png
选择重绘蒙版内,可以保持背景不变,更换不同的小姐姐:
image.png

选择重绘蒙版外,可以保持小姐姐不变,来更换不同的背景(加一些提示词可以更换不同的背景):
image.png

六、批量处理

批量处理(Batch)可以让我们批量完成图生图功能。这里主要有三个目录(注意:目录名不要使用中文):

  • 输入目录:输入目录表示要批量处理的图片所在目录。
  • 输出目录:输出目录表示AI生绘后输出的图片所在目录,需要提前建一个空的目录。
  • 蒙版输入目录:蒙版输入目录表示蒙版所在的目录。这是个可选项,如果填上后,相当于使用 Inpaint upload 功能来批处理。并且蒙版图片的文件名要与输入目录中原图文件名一致才行。

下图中,我将三个目录都创建好了:
image.png
输入目录(要重绘的原图):
image.png
输出目录(一个空的目录):
image.png
蒙版输入目录(输入目录中各个图片的蒙版,并且文件名保持一致):
image.png
点击生成后,原图中的小姐姐都被替换了,下面是输出目录:
image.png
如果你只想为小姐姐换背景,那么调整蒙版,将小姐姐变成黑色,其他为白色即可。

七、反推提示词

Stable Diffusion WebUI 的图生图中,还提供了两个反推提示词的功能“使用 Clip 反推提示词”和“使用 DeepBooru 反推提示词”。它们都可以提取图片中的元素,来提取提示词:
image.png
我们使用下面这张图来比较一下这两个反推提示词的区别:
image.png

1. Clip 反推提示词

Clip反推的提示词是句子,可以精准的描述图片中的元素,也是我们推荐的反推方式。
下面是反推出来的提示词:
a painting of a woman in a bathing suit with colorful paint splatters on her body and chest, Artgerm, stanley artgerm lau, a painting, funk art(一幅画,一个女人穿着泳衣,身上和胸口溅满了五颜六色的颜料,阿特泽姆,斯坦利·阿特泽姆劳,一幅画,放克艺术)
使用该提示词生成的图片:
image.png

2. DeepBooru 反推提示词

DeepBooru反推的提示词是单词。
下面是反推出来的提示词:
1girl, black hair, bleeding, blood, blood on clothes, blood on face, blood on hands, blood on knife, blood on weapon, blood splatter, blood stain, breasts, brown eyes, cleavage, cuts, dark-skinned female, dark skin, death, dirty, guro, injury, lips, lipstick, makeup, medium breasts, nosebleed, paint, paint splatter, solo, splatter(女孩,黑发,流血,血,衣服上的血,脸上的血,手上的血,刀上的血,武器上的血,血迹,血迹,乳房,棕色眼睛,乳沟,伤口,深色皮肤的女性,深色皮肤,死亡,肮脏,古罗,受伤,嘴唇,口红,化妆品,中等乳房,鼻血,油漆,油漆飞溅,独奏,飞溅)
image.png
两者的差距一目了然

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/289250.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring-IoC-属性注入的注解实现

1、创建对象的注解 Component 用于声明Bean对象的注解,在类上添加该注解后,表示将该类创建对象的权限交给Spring容器。可以直接将这些类直接创建,使用的时候可以直接用。 注解的value属性用于指定bean的id值,value可以省略&…

BioXcell InVivoPlus anti-mouse Ly6G及部分参考文献

BioXcell InVivoPlus anti-mouse Ly6G 1A8单克隆抗体与小鼠Ly6G反应。Ly6G分子量为21-25kDa,是GPI锚定的细胞表面蛋白Ly-6超家族的成员,在细胞信号传导和细胞粘附中发挥作用。Ly6G在发育过程中由骨髓谱系中的细胞(包括单核细胞、巨噬细胞、粒…

在点集的新知识面前百年集论不堪一击

黄小宁 与x∈R相异(等)的实数均可表为yxδ(增量δ可0也可≠0),因各实数的绝对值都可是表示长度的数故各实数都可是数轴上点的坐标,于是x∈R变换为实数yxδ的几何意义可是:一维空间“管道”g内R…

产品推荐 | 基于 Xilinx ZYNQ UltraScale+的FACE-ZUSSD-C 多核SOC设计开发平台

01、产品概述 FACE-ZUSSD-C多核SOC设计开发平台是FACE系列的新产品。FACE-ZUSSD-C搭载有16nm工艺的ZYNQ UltraScale系列主器件ZU19EG。该主器件具有丰富的FPGA可编程逻辑资源,同时其内嵌有四核ARM CortexA53,双核ARM CortexR5以及Mali400 GPU。 平台板…

常用的苹果应用商店上架工具推荐

摘要 移动应用app上架是开发者关注的重要环节,但常常会面临审核不通过等问题。为帮助开发者顺利完成上架工作,各种辅助工具应运而生。本文探讨移动应用app上架原理、常见辅助工具功能及其作用,最终指出合理使用工具的重要性。 引言 移动应…

构建一个基础的大型语言模型(LLM)应用程序

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

通用指南-营销和设计中的增强现实(AR)

原文作者:Superside 翻译:数字化营销工兵 --- 经典万字长文,权威解读,分享经典,预计阅读完需要30分钟,建议收藏! 目录 一、引言 为什么要尝试AR AR到底是什么?营销人员和创意人…

镭速如何适配国产数据库(达梦)进行高效数据管理与共享

在当今企业运营的背景下,数据的管理和共享显得尤为关键。在这个过程中,挑选一个合适的数据库系统是至关重要的。国产的达梦数据库因其在多个关键领域,如金融、能源、航空和通信等的成功运用,已经成为众多企业的首选解决方案。 作为…

【Git篇】复习git

文章目录 🍔什么是git⭐git和svn的区别 🍔搭建本地仓库🍔克隆远程仓库🛸git常用命令 🍔什么是git Git是一种分布式版本控制系统,它可以追踪文件的变化、协调多人在同一个项目上的工作、恢复文件的旧版本等…

后端程序员入门react笔记(九)- react 插件使用

setState setState引起的react的状态是异步的。操作完毕setState之后如果直接取值,可能取不到最新的值,我们举个例子console.log(this.state.num)打印的值,总是上一次的值而不是最新的。 import React, {Component} from react; class Ap…

SQLiteC/C++接口详细介绍sqlite3_stmt类(十三)

返回:SQLite—系列文章目录 上一篇:SQLiteC/C接口详细介绍sqlite3_stmt类(十二) 下一篇: SQLite数据库文件损坏的可能几种情况 51、sqlite3_stmt_scanstatus_reset sqlite3_stmt_scanstatus_reset 函数用于重置指…

机器学习:探索数据中的模式与智能

文章目录 导言介绍:机器学习的定义和重要性发展历程:从概念到现实应用 基础概念机器学习的基本原理监督学习、无监督学习和强化学习的区别与应用1.监督学习2.无监督学习3.强化学习 常见的机器学习任务和应用领域 结语 导言 当代科技领域中最为引人注目的…

成都欣丰洪泰文化传媒有限公司怎么样正规吗?

随着互联网的飞速发展和电子商务的蓬勃兴起,越来越多的企业开始将目光投向这片广阔的市场。在这个风起云涌的时代,成都欣丰洪泰文化传媒有限公司凭借其深厚的行业积累和前瞻性的市场洞察力,迅速崛起为电商服务领域的领航者,引领着…

百度谷歌301强引蜘蛛池效果怎么样

301强引蜘蛛池效果怎么样 本文 虚良SEO 原创,转载保留链接!网址:百度谷歌301强引蜘蛛池效果怎么样 - 虚良SEO 随着搜索引擎优化(SEO)技术的发展,越来越多的网站开始采用蜘蛛池技术来提高网站的排名和流量。…

谭浩强第五版C语言课后习题(编程题)+答案

谭浩强第五版作为初学C语言必读的一本教材,课后习题具有非常大的参考价值,也是很多高校期末考试或者考研的重要参考。在这里我整理了一部分个人认为比较重要的编程题,供大家作参考 1.输入两个数,求他们的最大公约数和最小公倍数&…

js改变图片曝光度(高亮度)

方法一: 原理: 使用canvas进行滤镜操作,通过改变图片数据每个像素点的RGB值来提高图片亮度。 缺点 当前项目使用的是svg,而不是canvas 调整出来的效果不是很好,图片不是高亮,而是有些发白 效果 代码 …

1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX

3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。 DBRX是一个专家混合模型(MoE)有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。 根据DBRX在MMLU、HumanEval和 GSM8K公布的测试…

FME学习之旅---day15

我们付出一些成本,时间的或者其他,最终总能收获一些什么。 【FME-HOW-TO系列】18 从点生成等高线数据 主要学习在FME中使用ContourGenerator和点数据集创建等高线。 读模块读取的是shp数据,有大概140万个点,加载图形很费劲。 …

二叉树|669.修剪二叉搜索树

力扣题目链接 class Solution { public:TreeNode* trimBST(TreeNode* root, int low, int high) {if (root nullptr ) return nullptr;if (root->val < low) {TreeNode* right trimBST(root->right, low, high); // 寻找符合区间[low, high]的节点return right;}if…

酷开科技依托酷开系统用“平台+产品+场景”塑造全屋智能生活!

杰弗里摩尔的“鸿沟理论”中写道&#xff1a;高科技企业推进产品的早期市场和产品被广泛接受的主流市场之间&#xff0c;存在着一条巨大的“鸿沟”。“鸿沟”&#xff0c;指产品吸引早期接纳者后、赢得更多客户前的那段间歇&#xff0c;以及其中可预知和不可预知的阻碍。多数产…