ComfyUI:基于差分扩散的像素级图像修改

在几个月的沉寂之后,差分扩散(Differential Diffusion)被引入了。

玩了几天之后,我仍然对结果感到震惊。

这种新的先进方法允许以像素为基础进行更改,而不是以整个区域为基础进行更改。

另一种可能更通俗的说法,或者至少这是我的理解方式——即在修复时,差分扩散不是遮盖某个区域以进行更改,而是允许你将遮罩应用为渐变,遮罩的亮区更有可能发生变化,而暗区不太可能发生变化。 这样可以得到更干净、更好的最终结果,没有任何锯齿状边缘。

以下是修复遮罩在使用之前的样子(左)和使用差分扩散之后的样子(右)的并排演示。

左侧是旧方法,带有刚性黑白遮罩。 新方法引入了柔和渐变遮罩以获得更好的效果

虽然这看起来并不一定具有开创性。相信我——结果非常好。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割

1、演示流程

与往常一样,如果你想了解这一切是如何运作的,请查看 Prompting Pixels 网站,那里有可供下载的工作流程。

别担心;我仍然会在本文中介绍许多相同的信息,但我认为该页面可能会让你更好地理解。

1.1 节点

在 ComfyUI 中设置此节点的工作流程非常简单。你至少需要合并三个节点:

  • Gaussian Blur Mask:高斯模糊蒙版
  • Differential Diffusion:差分扩散
  • Inpaint Model Conditioning:修复模型条件
  • Convert Mask to Image:将蒙版转换为图像(可选 - 有助于查看蒙版)

1.2 工作流程

在这个简短的演示中,我们将使用标准的修复工作流程。这意味着将提供一张图片作为输入,然后我们将通过蒙版编辑和提示对其进行修改。

因此,对于工作流程的前半部分:

我们将设置“加载图像”节点,我将在其中输入要调整的原始图像。在本例中,我使用的是 Unsplash 的这张裁剪图像。

然后,通过右键单击图像,我将打开蒙版编辑器以选择要修改的区域:

在这个例子中,我的目标是让她戴上眼镜。因此,考虑到这一点,我将遮盖住相应的区域。

遮盖后,你将“加载图像”节点的“遮罩”输出放入“高斯模糊遮罩”节点。此节点将渐变应用于选定的遮罩。

将 kernel_size 视为画笔的大小(值越大 = 画笔越大),而 sigma 是柔和度的强度(值越大 = 渐变越柔和)。

工作流程应如下所示:

专业提示:渐变越柔和,周围区域的变化就越多。因此,如果您想保留周围物体的风格(例如,在此示例中是鼻子、嘴巴等),请不要将其柔化太多。

检查点将只使用标准的世代检查点 — 而不是修复检查点(稍后会详细介绍)。

至于您的提示,它就像常规修复一样。提示应该是您当前的图像以及您想要的图像。因此,它不仅仅是一个女人,而是一个戴着眼镜的女人。

工作流程的后半部分:

后半部分变得有趣。与必须下载单独的修复检查点的传统修复不同,差分扩散可以很好地与标准世代检查点配合使用(使用修复检查点也可以提供良好的结果)。

工作流程的后半部分如下所示:

但是,你需要通过将模型传递到 Differential Diffusion 节点来调节模型。

此外,你的提示、掩码等也必须通过 Inpaint Model Conditioning 节点。

这些都是 ComfyUI 的原生功能。

专业提示:如果你没有看到它们,请确保相应地更新应用程序以加载这些节点。

最后,对于 KSampler,只需设置最适合您的检查点的值。

你要在这里查看的一个显着变化是 KSampler 节点中的降噪值。本质上,降噪是向蒙版区域添加多少噪声。因此,如果降噪 = 1,则模型将绘制全新的结果,并且不知道蒙版纯白色区域下方是什么。而降噪值为 0,图像不会改变。

通常,0.6 - 0.8 范围内的某个值适合修复,因为最终结果将根据您的提示而改变,同时仍然了解蒙版下的信息。

一切设置完成后,只需点击“队列提示”按钮并查看结果。

以下是我们的前后对比:

脸颊和眼镜之间的一致性非常酷,而且非常一致——你永远不会知道这实际上是两张不同的图像。请注意,她的眉毛和鼻梁等细微细节略有变化——这可以通过在蒙版上更具选择性并降低 Guassian Blur Mask 节点中的 sigma 值来减少。

然而,不可否认的是,睫毛相接处的眼镜顶部线条看起来有点奇怪,但经过一两次迭代后就可以清理干净。

所以,这就是一种更好的修复方法。


原文链接:ComfyUI差分扩散修复 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/413860.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PCL-直通滤波

本篇内容: 讲解直通滤波的作用通过pcl实现直通滤波 效果: 1 主要原理 点云数据通常包含x、y、z三个维度的数据,用户指定维度、范围后,直通滤波过滤或保留该范围内的所有点云 假设我指定维度’y’,范围(…

【unity实战】使用新版输入系统Input System+Rigidbody实现第三人称人物控制器

最终效果 前言 使用CharacterController实现3d角色控制器,之前已经做过很多了: 【unity小技巧】unity最完美的CharacterController 3d角色控制器,实现移动、跳跃、下蹲、奔跑、上下坡、物理碰撞效果,复制粘贴即用 【unity实战】C…

Ubuntu 24.04部署Wordpress

环境: Ubuntu 24.04 PHP 8.1.2-1ubuntu2.18 Nginx/1.18.0 (Ubuntu) WordPress 6.6.1 Mysql 8 文章目录 1. 安装php2. 配置nginx2.1. 安装nginx2.2. 配置 3. 下载wordpress3.1. 配置wordpress 4. mysql配置wordpress数据库和用户4.1. 安装和远程连接4.2. 创建wordpre…

【论文笔记】独属于CV的注意力机制CBAM-Convolutional Block Attention Module

目录 写在前面 一、基数和宽度 二、通道注意力模块(Channel Attention Module) 三、空间注意力模块(Spatial Attention Module) 四、CBAM(Convolutional Block Attention Module) 五、总结 写在前面 …

Photomator 3.3.22 (macOS Universal) - 照片编辑软件

Photomator 3.3.22 (macOS Universal) - 照片编辑软件 适用于 Mac、iPhone 和 iPad 的终极照片编辑器 请访问原文链接:https://sysin.org/blog/photomator/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org Photoma…

LeetCode_sql_day20(1398.购买了产品A和产品B却没有购买产品C的顾客)

描述: Customers 表: ------------------------------ | Column Name | Type | ------------------------------ | customer_id | int | | customer_name | varchar | ------------------------------ customer_id 是这张表中具有唯一…

浏览器播放RTSP流,支持H264、H265等格式,支持IE、Chrome等浏览器

目录 背景 解决方案 效果 代码 前端代码 后端代码 下载 背景 项目中需要在浏览器中播放RTSP流,实在是不想折腾ActiveX控件 1、麻烦(开发麻烦、使用时设置也麻烦) 2、非IE浏览器不兼容 解决方案 使用OpenCvSharpNancy写一个解码服…

617. 合并二叉树

目录 一:题目: 二:代码: 三:结果: 一:题目: 给你两棵二叉树: root1 和 root2 。 想象一下,当你将其中一棵覆盖到另一棵之上时,两棵树上的一些…

捷达千里江山首发亮相,捷达品牌2024成都车展继续宠粉不停

2024年8月30日,捷达品牌携新车捷达千里江山惊艳亮相2024成都国际车展,并在五周年之际,发布幸福包油计划等宠粉福利,号召用户打卡千里江山,奔赴美好。与此同时,全新捷达VS5/VS7五周年纪念版车型进一步降低了…

H264码流结构讲解

所谓的码流结构就是指:视频经过编码之后所得到的数据是怎样排列的,换句话说,就是编码后的码流我们该如何将一帧一帧的数据分离开来,哪一块数据是一帧图像,哪一块是另外一帧图像,只要了解了这个,…

vue3是如何避免样式污染的?

众所周知,在vue中使用scoped可以避免父组件的样式渗透到子组件中。使用了scoped后会给html增加自定义属性data-v-x,同时会给组件内CSS选择器添加对应的属性选择器[data-v-x]。本文讲一下vue是如何给CSS选择器添加对应的属性选择器[data-v-x]。注&#xf…

JVM堆内存空间(heap)

在Java程序运行时,系统运行过程中产生的大部分实例对象以及数组对象都会被放到堆中存储。 默认情况下,如果不通过参数强制指定堆空间大小,那么JVM会根据当前所在的平台进行自适应调整,起始大小默认为当前物理机器内存的1/64&…

基于ssm+vue的汽车租赁管理系统

摘要 随着移动应用技术的发展,越来越多的用户借助于移动手机、电脑完成生活中的事务,许多的传统行业也更加重视与互联网的结合,以提高商家知名度和寻求更高的经济利益。针对传统汽车租赁系统,租赁信息、续租信息等问题&#xff0c…

【算法每日一练及解题思路】找出模式匹配字符串的异位词在原始字符串中出现的索引下标

【算法每日一练及解题思路】找出模式匹配字符串的异位词在原始字符串中出现的索引下标 一、题目:找出模式匹配字符串的异位词在原始字符串中出现的索引下标 二、举例: 两个字符串原始字符串initStr123sf3rtfb,模式匹配字符串regxf3s,找到模…

区域生长算法详解与Python实现

图像分割是计算机视觉中一个重要的任务,区域生长算法是其中的一种常见方法。本文将详细介绍区域生长算法的原理,并通过Python代码实现,带你一步步理解它的实际应用。 1. 区域生长算法简介 区域生长算法是一种基于像素相似性进行图像分割的方…

【方法论】读论文的三个层次,四个阶段,十个问题

学习资料 - 沈向洋十问 如何正确阅读一篇科研论文 阅读理解作者的意图,不同的阅读需求对应不同的阅读层次(速读,精读,研读) 速读:标题,引言,摘要,结论 文章要解决什么…

并发编程之定时任务定时线程池

并发编程之定时任务&定时线程池-CSDN博客

Upload-LABS通关攻略【1-20关】

Pass-01 第一关是前端JS绕过 上传一个php文件显示只能上传特定后缀名的文件 这里将1.php改为1.jpg直接进行抓包,在数据包中将jpg改为php放行 文件上传成功,邮件图片新建页面打开 可以访问到1.php文件,则一句话密码上传成功 使用蚁剑 进行连接…

六、vue进阶知识点

一、scoped解决样式冲突 默认情况:写在组件中的样式会 全局生效→ 因此很容易造成多个组件之间的样式冲突问题。 1.全局样式:默认组件中的样式会作用到全局 2.局部样式:可以给组件加上 scoped 属性,可以让样式只作用于当前组件scoped原理? 1.当前组件内标签都被添加 data-v-…

智慧猪场实训中心解决方案

一、引言 随着科技的飞速发展,传统养猪业正经历着前所未有的变革。为了提高养猪效率、降低生产成本并保障猪只健康,智慧养猪场的概念应运而生。唯众特此推出《智慧猪场实训中心解决方案》,旨在通过先进的技术与管理手段,为养猪业培…