facefusion,使用CPU实现一键图片、视频换脸,无需显卡,无限时长(附下载即用的整合包)

FaceFusion 是一种利用人工智能技术将两张或多张人脸融合在一起的图像处理技术。这种技术通过面部特征的识别和重构,将不同的人脸混合成一张新的脸,生成的图像看起来像是这些人脸的融合体。

FaceFusion使用深度学习算法,来捕捉人脸的细节和特征,并确保融合后的图像保持逼真和自然。FaceFusion 技术可用于多种应用场景,比如娱乐(生成混合脸型的趣味照片)、艺术创作、甚至身份保护和隐私遮盖等。

重要的是,Facefusion不仅支持图片换脸,还能处理视频文件,实现动态的面部替换。

3

获取方法

关注wēi xìn gōng zhòng hào小言Ai工具箱,回复【facefusion】关键字获取整合包下载链接。

无需自己安装和部署,下载即用

使用教程

解压整合包,双击 start.exe

进入CMD界面,稍等待一段时间。

待程序打开后出现如下主界面:

先简单介绍下一些常用的设置。

帧处理器

这里有六个选项:

  1. face_swapper(换脸模式)必须勾选的,不然无法进行换脸。

  2. face_debugger(调试模式)用来开启遮罩时调试用的。正常换脸时不需要勾选。

  3. face_enhancer(脸部增强)比较常用,开启后可以提升转换后的视频中人物面部的清晰度。

  4. frame_enhancer(画面增强)比较常用,开启后可以提升转换后的视频整体清晰度。(此选项会大大增加处理时间,根据你的硬件酌情勾选)。

  5. frame_colorizer(着色器)对视频的单帧进行自动上色。

  6. lip_syncer(对口型)实现嘴唇与音频或语音同步。

人脸交换器模型

下拉选择换脸模型:

  • inswapper_128和inswapper_128_fp16

    默认选择为 inswapper_128_fp16,该模型已能有效应对绝大多数换脸场景。此处的“128”表示处理图像的分辨率为 128x128 像素,而“fp16”则指该模型采用 16 位浮点数(FP16)进行计算。这种计算方式通常在保持足够精度的同时,显著降低计算资源的需求,从而提高处理速度,尤其适用于资源有限或需要实时处理的应用场景。

  • blendswap_256

    该模型主要用于将两张图像中的面部进行混合与交换操作,其中“256”表示图像处理或输出的分辨率为256x256像素。此分辨率较适合处理较小的图像,并能够满足对处理速度要求较高的应用场景。

  • simswap_256

    这个模型采用了相似性交换算法,256指的是模型处理的分辨率为256x256像素。这种模型在保持原图像质量的同时,能够实现高质量的面部交换效果。

  • simswap_512_unofficial

    该模型与 simswap_256 类似,但“512”表明该版本支持更高的分辨率,即512x512像素,能够生成更高清晰度的面部交换结果。“unofficial”意味着该版本并非官方发布,而是由社区成员基于原始模型进行的修改或扩展。

  • Uniface_256

    这个模型以256维度的特征向量表示人脸特征,能够在不同角度、光照和姿势下对人脸进行准确识别。相比一些更复杂的人脸识别模型,Uniface_256 在保持较高识别率的同时,计算效率较高,适合嵌入到需要快速处理的大规模系统中。

    根据具体项目需求选择合适的模型非常关键。使用16位浮点数(如 inswapper_128_fp16)是一种优化策略,能够在不显著影响输出质量的情况下加速模型运行。而更高的分辨率(如 simswap_512)则可以提供更丰富的细节表现,但相应地也会消耗更多的计算资源和处理时间。

    运行模式选择

  • 此处提供了三个选项:如果您使用NVIDIA显卡,请选择Cuda;如果您使用AMD显卡或集成显卡,请选择CPU。

    执行线程数

    图片

    此设置应根据您的显卡性能进行调整。如果显存低于8GB,建议保持默认配置;若显存超过8GB,可以将参数提高至8-10。此建议仅供参考,具体调整应依据显卡的实际性能。

    执行队列数

    图片

“执行队列数”参数仅在使用脚本进行批量换脸时需要设置;通过网页操作时无需调整该参数,保持默认设置即可。

视频内存策略、系统内存限制

图片

此处无需进行调整,请保持默认设置,由程序自动控制。

输出路径

图片

该路径用于存放程序在换脸过程中生成的临时图片,处理完成后程序会自动清除这些文件,因此无需进行修改。

常见选项

图片

  • keep-temp

不建议勾选此选项。一旦选中,换脸过程中生成的临时图片将会保存至所设置的临时目录,这可能会占用大量硬盘空间。

  • skip-audio

跳过音频处理后,输出的视频将不包含音频。

  • skip-download

建议勾选此选项。由于我们的模型已完成下载,您可以选择跳过下载检查步骤。

下面讲解实操步骤说明。

简单换脸

点击源文件,请选择一张人脸照片,最佳选择为清晰的正面照,确保面部没有任何遮挡。特别注意,文件名不能含有中文!

图片

再点击目标文件,选择需要换脸的图片或者视频。特别注意,文件名不能含有中文!

图片

右上角为预览区,以下设置将在稍后进行详细介绍。对于单张图片的换脸操作,这些设置通常不适用。点击“开始”按钮开始替换,替换完成后,点击此处即可下载并保存到您的电脑上。

图片

若希望获得更清晰的效果,请勾选“脸部增强”选项,然后再次进行替换。

图片

以上便是最简便的单张面部替换流程。

多人换脸

人脸选择器模式

图片

  • reference

在默认模式下,系统从左向右检测人脸,检测到的第一个人脸将列在此处。如需更换替换的人脸,只需点击相应的人脸图标即可。

  • one

“One模式”仅会替换检测到的第一个人脸。

  • many

“Many模式”将替换检测到的所有人脸。

参考人脸相似度

图片

在大多数情况下,使用默认值0.6即可满足需求。只有在无法识别出人脸的情况下,例如视频中存在较大角度的低头侧脸镜头时,检测到的人脸匹配度较低,您可以考虑将该值调高。

遮罩换脸

例如,对于这张面部受到物体遮挡的图片,需要选择合适的遮罩模式,以实现更优质的面部融合效果。

图片

在使用遮罩时,建议启用调试模式。预览画面中的绿色框架表示程序默认的框架模式遮罩。

图片

可以观察到口罩部分会露出人脸,因此需要对此进行处理。请勾选第二个遮罩类型。

可以看到,在此模式下,系统计算了剩余的面部范围(绿色框部分)。

图片

遮罩模糊

默认值为0.3,用于调节遮挡物体的透明度。如果不是透明物体,可以调整至0.5以上。在执行前,请务必关闭“face_debugger”调试选项,以防止换脸后视频中的人脸被曲线遮挡。需要注意的是,使用封闭遮罩模式时,遮罩模糊值的合适设置可能需要多次尝试。值得一提的是,该值并非越大越好,对于透明物体(如眼镜或玻璃杯),适当减小该值往往能够获得更真实的融合效果。。

region脸部区域模式

图片

勾选“region”后,下方将出现两排参数,涵盖眉毛、鼻子、眼睛、嘴巴等部位。默认情况下,这些部位均被勾选,将全部进行替换。如果不希望替换原视频中某个特定部位,可以取消对该部位的勾选。。

图片

项目总结

功能特性

  1. 新增直播模式,新增照片/视频上色功能,优化口型同步!

  2. 框架着色器的引入:集成了ddcolor和deoldify模型,引入了帧着色器功能,能够为黑白视频帧添加颜色,使其看起来更加生动。

  3. 口型同步质量提升:通过从音频中提取语音特征,优化了口型同步器的准确性,使得视频中的口型与声音同步更加自然。

  4. 人脸特征点估计:进行了实验性的功能拓展,支持5到68个人脸特征点的估计,增强了面部追踪的精度。

  5. 面部增强器模型:添加了新的面部增强器模型gpen_bfr_1024和gpen_bfr_2048,用以提高面部图像的清晰度和质量。

  6. 帧增强器模型:引入了real_esrgan_x2和real_hatgan_x4模型,用于提升视频帧的分辨率和质感。

换脸步骤

1、设置人脸(Source)

拖入新的人脸图片。

2、设置目标(Target)

拖入要替换的视频。

3、效果预览 (Preview)

可以自由拖动选择

4、 开始换脸(Start)

一切就绪之后,就可以点击“开始”按钮开始正式换脸了。

总结

持续更新的开源换脸项目,支持多种模式:脸部高清修复、画质增强、口型同步等。功能过于强大,大家慢慢探索哈!~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/450058.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenCV答题卡识别

文章目录 一、基本流程二、代码实现1.定义函数2.图像预处理(1)高斯模糊、边缘检测(2)轮廓检测(3)透视变换(4)阈值处理和轮廓检测 3.筛选和排序选项轮廓4.判断答案5.显示结果 三、总结…

YOLOv11改进有效系列目录 - 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制 - 针对多尺度、小目标、遮挡、恶劣天气等问题

目标检测作为计算机视觉领域的一项核心任务,极大地推动了整个领域的发展。它不仅是其他许多视觉任务的基础工具,还在学术研究和实际应用之间架起了一座桥梁。目标检测的主要任务是识别和定位图像或视频中的特定对象,通常需要模型能同时处理多…

C++ | Leetcode C++题解之第476题数字的补数

题目&#xff1a; 题解&#xff1a; class Solution { public:int findComplement(int num) {int highbit 0;for (int i 1; i < 30; i) {if (num > (1 << i)) {highbit i;}else {break;} }int mask (highbit 30 ? 0x7fffffff : (1 << (hig…

【DBA Part01】国产Linux上安装Oracle进行数据迁移

内容如下&#xff1a; 1.1.生产环境RHEL/OEL Linux8Oracle11gR2安装配置 1.2.国产麒麟操作系统Oracle11gR2安装配置 1.3.国产麒麟操作系统Oracle11gR2 RAC集群安装配置 1.4.Oracle11gR2迁移到国产麒麟操作系统&#xff08;单机/RAC&#xff09; 本阶段课程项目需求说明&am…

零一万物 Yi-Lightning:超越 GPT-4o 冲击全球榜单;阿里国际 Marco 翻译大模型发布丨 RTE 开发者日报

开发者朋友们大家好&#xff1a; 这里是 「RTE 开发者日报」 &#xff0c;每天和大家一起看新闻、聊八卦。 我们的社区编辑团队会整理分享 RTE&#xff08;Real-Time Engagement&#xff09; 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 …

CEEMDAN +组合预测模型(Transformer - BiLSTM + ARIMA)

往期精彩内容&#xff1a; 时序预测&#xff1a;LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较 全是干货 | 数据集、学习资料、建模资源分享&#xff01; EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现&#xff08;一&#xff09;EMD-CSDN博客 EMD、EEM…

具备技术二:正则表达式

一、C正则库 regex 用于报文的解析。 使用接口&#xff1a;bool regex_match(const string &src, smatch &matches, regex &e); src&#xff1a;要解释的字符串。 smatch&#xff1a;一个类似于数组的结构&#xff0c;用于存储一个个解释之后的字符串。 matche…

鸿蒙网络编程系列3-TCP客户端通讯示例

1. TCP简介 TCP协议是传输层最重要的协议&#xff0c;提供了可靠、有序的数据传输&#xff0c;是多个广泛使用的表示层协议的运行基础&#xff0c;相对于UDP来说&#xff0c;TCP需要经过三次握手后才能建立连接&#xff0c;建立连接后才能进行数据传输&#xff0c;所以效率差了…

Android -- [SelfView] 多动画效果图片播放器

Android – [SelfView] 多动画效果图片播放器 效果&#xff08;录制的有点卡&#xff09; 1. 引用&#xff1a; <com.nepalese.virgolib.widget.image.BaseImageViewandroid:id"id/base_image"android:layout_width"match_parent"android:layout_heigh…

AD画图的使用

一、新建工程 二、绘制原理图 1、原理图搜索方法&#xff1a; https://www.ti.com/lit/ds/symlink/tlv1117.pdf?ts1729143086540&ref_urlhttps%253A%252F%252Fwww.mouser.tw%252F www.alldatasheet.com 2、绘图步骤&#xff1a; 注&#xff1a;管脚四点朝外

2024软考网络工程师笔记 - 第5章.无线通信网

文章目录 移动通信与 5G1️⃣移动通信2️⃣移动通信制式3️⃣5G 应用场景与关键技术 &#x1f551;WLAN 通信技术1️⃣WLAN 通信技术 &#x1f552;WLAN 频谱与信道&#xff08;高频考点&#xff09;1️⃣WLAN 网络分类2️⃣ISM频段3️⃣不重叠信道&#xff08;重点&#xff09…

uniapp 省、市、区、乡镇 数据层级选择插件 Ba-DataPicker

Ba-DataPicker 是一款uniapp数据层级选择弹窗插件。支持省市区乡四级&#xff1b;支持自定义数据。 支持省、市、区、乡镇四级支持自定义数据支持字母检索 截图展示 支持定制、本地包、源码等&#xff0c;有建议和需要&#xff0c;请点击文章结尾“Uniapp插件开发”联系我&am…

人脸识别-特征算法

文章目录 一、LBPH算法1.基本原理2.实现步骤3.代码实现 二、Eigenfaces算法1.特点2.代码实习 三、FisherFaces算法1.算法原理2.算法特点3.代码实现 四、总结 人脸识别特征识别器是数字信息发展中的一种生物特征识别技术&#xff0c;其核心在于通过特定的算法和技术手段&#xf…

代码随想录算法训练营第八天(1)|哈希表理论基础

文档讲解&#xff1a;代码随想录 难度&#xff1a;有一点 哈希表理论基础 哈希表 首先什么是哈希表&#xff0c;哈希表&#xff08;英文名字为Hash table&#xff0c;国内也有一些算法书籍翻译为散列表&#xff0c;大家看到这两个名称知道都是指hash table就可以了&#xff0…

指尖的无声告白,算法里的隐约温柔

公主请阅 1. 三数之和1. 题目说明示例 1示例 2示例 3 1.2 题目分析1.3 代码部分1.3 代码分析 2. 四数之和2.1 题目说明示例 1示例 2 2.2 题目分析2.3 代码部分2.4 代码解析 1. 三数之和 题目传送门 1. 题目说明 给定一个整数数组 nums&#xff0c;判断数组中是否存在三个元素 …

鸿道Intewell操作系统构型介绍之Intewell-C全实时构型

鸿道(Intewell)操作系统主要包括Intewell-C、Intewell-H和Intewell-V三种不同构型产品&#xff1a; Intewell-C Intewell-C是一款工业实时微内核操作系统&#xff0c;由科东软件自主研发&#xff0c;具有超低延迟和最小抖动&#xff0c;保障工业设备可以高效处理时间敏感的现…

python爬虫实战案例——从移动端接口抓取微博评论,采用cookie登陆,数据存入excel表格,超详细(15)

文章目录 1、任务目标2、网页分析3、代码编写3.1 代码分析3.2 完整代码1、任务目标 1、目标网站:微博文章(https://m.weibo.cn/detail/4813628149072458),这是微博某一篇博文,用于本文测试 2、要求:爬取该博文下,所有一级评论和二级评论,以及每条评论的作者,最后保存至E…

熵权法计算评价指标权重——使用Excel VBA实现

[ 熵权法 ] 信息是系统有序程度的一个度量&#xff0c;熵是系统无序程度的一个度量&#xff1b;根据信息熵的定义&#xff0c;对于某项指标&#xff0c;可以用熵值来判断某个指标的离散程度&#xff0c;其信息熵值越小&#xff0c;指标的离散程度越大&#xff0c; 该指标对综合…

java脚手架系列4--测试用例、拦截器

异常处理、拦截器、数据库连接 1 测试用例 单元测试是一个老生常谈的问题&#xff0c;无论是后端对自己的代码质量把的第一道关也好&#xff0c;也是对测试减缓压力。这里就不过多讲述测试用例的重要性&#xff0c;但是有2个框架我们必须了解一下。 1.1 JUnit和mockito 我们…

gitlab保护分支设置

版本&#xff1a;gitlab10.2.2 一旦设置master分支被保护&#xff0c;除了管理员之外的任何用户都无法直接向master提交代码&#xff0c;只要提交代码就会报错 # git push -u origin master Total 0 (delta 0), reused 0 (delta 0) remote: GitLab: You are not allowed to pu…