AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取,并分享了所需模型的下载地址。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

前言

一口气让 Fooocus 生成了 12 张“一个女孩骑着一条龙”的图片:
3_1.jpg
从里边选一张最有气质的照片,就它了:
2024-05-15_10-12-57_7051.png
今天我们就拿这张图片来演示 Fooocus 图生图的功能。

一、图像放大或变化(Upscale or Variatioin)

图像放大或变化(Upscale or Variatioin)可以微调图片或放大图片。

我们将图片拖放至左侧区域(或者上传),然后选择右边的选项,点击【生成】即可。然后,我们对比一下各选项生成的效果:
image.png
不启用:表示不启用图生图功能,会生成新的图片。
变化(细微 0.50):重绘幅度为 0.50,产生细微的变化(女孩表情变了、背景树木更茂密了)。
2024-05-15_10-48-34_4540.png
变化(强烈 0.85):重绘幅度为 0.85,产生强烈的变化(女孩面部和衣服变了,龙变胖了,轮子变成腿了,地面也变成泥地了)。
2024-05-15_10-53-44_2271.png
放大(1.5倍):图片放大了 1.5 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_10-58-08_2550.png

放大(2倍):图片放大了 2 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_11-01-14_8372.png

快速放大(2倍):图片放大了 2 倍,没有修改图片细节。
2024-05-15_11-02-43_3801.png

二、图像提示(Image Prompt)

图像提示(Image Prompt)相当于 WebUI 中的 ControlNet 功能。勾选【高级设置】后,可以看出它有四种 ControlNet 供我们选择:图像提示(默认)、边缘检测、深度检测、换脸。

image.png
Image Prompt 还有两个重要的参数(Fooocus 已为每一种 ControlNet 设置了不同的默认值,通常无需调整):

  • 停止于(Stop At):停止设置控制在生成过程中应用所选 ControlNet 的影响的步骤数。取值范围为 0~1,通常值为 0.5,值越高,ControlNet 与参考图的粘合度就越高。
  • 权重(Weight):权重设置决定了所选 ControlNet 对最终图像的影响强度。较高的权重值会增加 ControlNet 的影响,而较低的权重值会降低其效果。取值范围为 0~2

2.1 图像提示(ImagePrompt)

图像提示(ImagePrompt)可以根据提示词和参考图中的风格来生成新的图片。

一个女孩骑着一头鳄鱼(a girl rides a crocodile):
2024-05-15_14-35-41_6846.png
一个女孩参差一条蛇(a girl rides a snake):
2024-05-15_14-34-44_1727.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_14-41-43_5941.png

2.2 边缘检测(PyraCanny)

边缘检测(PyraCanny)用于识别并提取图像中的边缘特征。当您想要在生成的图片中保留参考图的特定细节或姿势时,PyraCanny 设置特别有用。它创建一个线条艺术图片,从图像中捕获复杂的细节,并将它们应用到文本提示和其他控制网络。这可以产生与输入图像非常相似的合成,同时结合所需的风格变化。

在【高级设置】中打开【开发者高度模式】,在【ControlNet】中勾选【高度预处理】可以生成预处理的控制图:
image.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_15-01-37_7842.png

2.3 深度检测(CPDS)

深度检测(CPDS,Contrast Preserving Decolorization Structure)即保持对比的退色结构,是由 Fooocus 团队开发的定制控制网络。它结合了深度控制和脱色方法,将图像转换为黑白图像。然后,黑白图像的结构充当控制网来影响最终图像。 CPDS 和 PyraCanny 具有相似的目的,但它们采用不同的方法。虽然您可以组合多个控制网络,但建议使用 Pyan 或 CPDS,但不要同时使用两者。

深度检测在使用【调试预处理】时会生成黑白照片:
image.png
一个女孩骑着一头恐龙(a girl rides a dinosaur):
2024-05-15_15-32-03_7639.png

2.4 换脸(FaceSwap)

换脸(FaceSwap)会检测参考图中的脸部和头发并将其替换为生成图片中的脸部和头发。可以结合提示词使用,AI 将从参考图中识别出面部和头发,并将其应用到最终生成的图像中。

参考图:
src=http___b-ssl.duitang.com_uploads_item_201707_02_20170702210428_PQJT3.png&refer=http___b-ssl.duitang.webp
一个女孩骑着一头龙(a girl rides a dragon):
2024-05-15_15-56-43_2732.png

三、图像重绘或扩充(Inpaint or Outpaint)

3.1 图像重绘或扩充

图像重绘或扩充(Inpaint or Outpaint)可以重绘蒙版内容,还可以扩充图片。

将参考图要重绘的部分使用蒙版遮住:
image.png
生成的图片,会重绘蒙版中的内容:
2024-05-15_16-21-50_2390.png

如果想要扩图,可以在【向外扩充绘制的方向】中勾选扩充的方向。

向上:
2024-05-15_16-32-34_1119.png
向下:
2024-05-15_16-36-16_7326.png
向左:
2024-05-15_16-37-18_4069.png

向右:
2024-05-15_16-38-20_5067.png
向四个方向:
2024-05-15_16-33-20_3267.png

3.2 内部重绘-改善细节(脸、手、眼等)

内部重绘-改善细节(Improve Detail (face, hand, eyes, etc.))可以修复脸、手和眼等。

例如,这个女孩的脸想修复一下,用蒙版遮住:
image.png
重绘后的效果:
2024-05-15_16-42-43_7184.png

3.3 内部重绘-修改内容(添加物体、改变背景等)

内部重绘-修改内容(Modify Content (add objects, change background, etc.))可以添加物体、改变背景等

例如,在地面添加一条狗,就可以在地面上添加蒙版,然后在【内部重绘的附加提示词】中添加 dog
image.png
这样就会在蒙版位置添加一条狗:
2024-05-15_16-45-40_3245.png
例如,将远处的山改为火山:
image.png
修改后的效果:
2024-05-15_16-53-06_8680.png

四、反推提示词(Describe)

反推提示词(Describe)可以提取图片中的关键信息,将结果输出到“提示词”文本框中。

主要包括两种——照片(Photograph)、画作/动漫(Art/Anime):

照片(Photograph)反推出的是一些句子,描述图片中的内容。

反推结果:a woman riding on the back of a motorcycle next to a dragon(一个女人坐在摩托车后座上,旁边是一条龙)
image.png

画作/动漫(Art/Anime)反推出的是一些单词,描述图片中的关键词。

反推结果:1girl, solo, long hair, brown hair, outdoors, wings, shorts, tank top, denim, ground vehicle, nature, motor vehicle, mountain, realistic, dragon, road, riding, dragon wings(女孩,独唱,长发,棕色头发,户外,翅膀,短裤,背心,牛仔布,地面车辆,自然,机动车,山,现实,龙,道路,骑,龙翅膀)
image.png

五、生成参数提取(Metadata)

生成参数提取(Metadata)可以提取用 Stable Diffusion 生成图片的生成信息,包括:正向提示词、负向提示词、采样器、采样步数等等。

image.png

六、模型下载

在使用 Fooocus 图生图功能时,会下载一些模型。我将这些模型放到网盘中了,这里分享给大家。

网盘地址:https://pan.quark.cn/s/5b972ab4e26f
image.png
inpaint 内容放到 Fooocus\models\inpaint目录中:
image.png
controlnet 内容放到 Fooocus\models\controlnet 目录中:
image.png
clip_vision 内容放到 Fooocus\models\clip_vision目录中:
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/328672.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入理解MySQL三大日志:redo log、binlog、undo log

前言 MySQL是一个功能强大的关系型数据库管理系统,它的高可靠性、高性能和易用性使得它成为众多企业和开发者的首选。在MySQL内部,为了保证数据的完整性、恢复能力和并发性能,设计了一套复杂的日志系统。其中,redo log、bin log和…

Qt+C++串口调试工具

程序示例精选 QtC串口调试工具 如需安装运行环境或远程调试,见文章底部个人QQ名片,由专业技术人员远程协助! 前言 这篇博客针对《QtC串口调试工具》编写代码,代码整洁,规则,易读。 学习与应用推荐首选。 …

Mybatis基础操作-删除

Mybatis基础操作-删除 删除 package com.itheima.mapper;import org.apache.ibatis.annotations.Delete; import org.apache.ibatis.annotations.Mapper;Mapper //在运行时,会自动生成该接口的实现类对象(代理对象),并且将该对象…

Vue3知识总结-4

Vue3知识总结-4 文章目录 Vue3知识总结-4插槽Slots渲染作用域默认内容具名插槽插槽中的数据传递具名插槽传递数据 组件声明周期声明周期示意图 组件生命周期的应用动态组件组件保持存活组件被卸载 异步组件依赖注入 插槽Slots 在某些场景中,可能想要为子组件传递一…

redis中的集群模式

主从复制、主从同步(解决高并发读的问题) 主从同步原理: 1.全量同步 slave(从节点)每次请求数据同步会带两个参数:replid和offset。 replid:第一次请求同步时,replid和master的replid不一样,这…

线性系统(一)

线性系统(一) 1.什么是线性系统2.高斯消元法3.高斯-约旦消元法4.线性方程组解的结构 链接: 线性系统(二) 1.什么是线性系统 线性:未知数只能是一次方项 非线性: 同时,读者也可以通过作图来更直观地感受&…

TypeScript高级类型 在鸿蒙中的使用 Partial、Required、Readonly、Pick、Record

我的工程代码在这里&#xff0c;持续更新中 欢迎交流&#xff0c;谢谢 https://github.com/MartinLi89/WanHarmony Partial <Type> 新定义 一个类型&#xff0c;将所有属性变为可选的类. class TextTS {a: string "1"b: string "2"c: string &…

即插即用篇 | YOLOv8引入轴向注意力 Axial Attention | 多维变换器中的轴向注意力

本改进已集成到 YOLOv8-Magic 框架。 我们提出了Axial Transformers,这是一个基于自注意力的自回归模型,用于图像和其他组织为高维张量的数据。现有的自回归模型要么因高维数据的计算资源需求过大而受到限制,要么为了减少资源需求而在分布表达性或实现的便捷性上做出妥协。相…

ppt通过修改幻灯片母版修改页脚

修改幻灯片母版 幻灯片母版就可以了&#xff0c;就可以修改页脚

数学建模——农村公交与异构无人机协同配送优化

目录 1.题目 2.问题1 1. 问题建模 输入数据 ​编辑 2. 算法选择 3.数据导入 3.模型构建 1. 距离计算 2. 优化模型 具体步骤 进一步优化 1. 重新定义问题 2. 变量定义 3. 优化目标 具体步骤 再进一步优化 具体实现步骤 1. 计算距离矩阵 2. 变量定义 3. 约束…

基于Django的图书管理系统

文章目录 前言一、页面展示1.登录2.前端页面3.后端页面 二、项目上传&#xff08;1&#xff09;导入数据库&#xff08;2&#xff09;导入项目&#xff08;3&#xff09;数据库密码修改&#xff08;4&#xff09;进入网站 总结 前言 本网站调用Django编写了图书管理网站&#…

漫谈AI时代的手机

以chatGPT 为代表的大语言的横空出世使人们感受到AI 时代的到来&#xff0c;大语言模型技术的最大特点是机器能”懂人话“&#xff0c;”说人话“了。如同历史上任何一个革命性工具的出现一样&#xff0c;它必将对人类生活和工作产生巨大的影响。 在这里。我们不妨畅想一下啊AI…

返回分类信息(带层级)

文章目录 1.前端展示分类管理信息1.目前项目架构2.启动前后端项目1.启动mysql容器2.启动后端 renren-fast3.启动前端1.界面2.用户名密码都是admin 3.创建分类管理菜单1.菜单管理 -> 新增 -> 新增目录2.刷新3.能够新增菜单的原因是前端脚手架与renren-fast后端脚手架通信&…

Linux基础之僵尸进程与孤儿进程

目录 一、僵尸进程 1.1 什么是僵尸进程 1.2 为什么要有僵尸状态 1.3 观察我们的僵尸状态 1.4 关于僵尸进程的小Tip 二、孤儿进程 2.1 什么是孤儿进程 一、僵尸进程 1.1 什么是僵尸进程 在上一篇文章中&#xff0c;我们有提到过进程的死亡状态的概念&#xff0c;而我们的…

国内智能搜索工具实战教程

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

c++AVL树的模拟实现

前面对map/multimap/set/multiset进行了简单的介绍&#xff0c;在其文档介绍中发现&#xff0c;这几个容器有个 共同点是&#xff1a;其底层都是按照二叉搜索树来实现的&#xff0c;但是二叉搜索树有其自身的缺陷&#xff0c;假如往树中 插入的元素有序或者接近有序&#xff0c…

k8s 二进制安装 优化架构之 部署负载均衡,加入master02

目录 一 实验环境 二 部署 CoreDNS 1&#xff0c;所有node加载coredns.tar 镜像 2&#xff0c;在 master01 节点部署 CoreDNS 3&#xff0c; DNS 解析测试 4&#xff0c; 报错分析 5&#xff0c;重新 DNS 解析测试 三 master02 节点部署 1&#xff0…

什么是最大路径?什么是极大路径?

最近学习中&#xff0c;在这两个概念上出现了混淆&#xff0c;导致了一些误解&#xff0c;在此厘清。 最大路径 在一个简单图G中&#xff0c;u、v之间的距离 d ( u , v ) min ⁡ { u 到 v 的最短路的长度 } d(u,v) \min \{ u到v的最短路的长度 \} d(u,v)min{u到v的最短路的…

Redis 的主从复制

Redis 的主从复制 1、主从复制的实现2、主从复制的同步功能(PSYNC)2.1、部分重同步 本文讲解的Redis 主从复制机制&#xff0c;是基于 2.8及以后的版本而言&#xff0c;2.8以前的版本主从复制机制与此有所不同&#xff0c;请知悉。 Redis的复制功能分为 同步 (psync) 和 命令传…

vm16安装最新版本的ubuntu虚拟机,并安装g++的步骤记录

背景 低版本的ubuntu安装G一直不成功&#xff0c;干脆安装最新版的 官网下载 bing搜索ubuntu 下载完成 vm16新建虚拟机 一直下一步&#xff0c;安装完成 终端输入命令 sudo apt-get update ᅟᅠ       sudo apt install gcc ᅟᅠ      sudo apt install g