AI虚拟主播数字人技术实现Wav2Lip【附完整版教程】及【效果评测】

前言
建议直接阅读飞书文档:Docsicon-default.png?t=N4P3https://yv2c3kamh3y.feishu.cn/docx/S5AldFeZUoMpU5x8JAuctgPsnfg


近期很多饱子私信,想知道关于AI数字人主播的技术实现。现本篇就AI数字人虚拟主播的Wav2Lip技术进行实现与评测,后续还会有其他的相关技术实现与评测。

本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核心都是人物口型与音频中的语音唇形同步)。主要通过将两个不相关的人的视频、音频,采用Wav2Lip技术,最终得到一个完整的视频文件,且视频的人物口型与音频内容一致。举例:小红的语音、加上小花的自拍视频,融合为一个最终的视频;那么小红在发出“啊”声音的时候,小花的嘴应该是张开的,以下是一张效果图),本文第四部分有完整的效果评测视频

本文主要通过以下五个部分展开:

第一部分:深度伪造技术概述

第二部分:Wav2lip技术概述

第三部分:使用Wav2Lip进行AI主播虚拟人的深度实践

第四部分:效果评测

第五部分:Wav2Lip完整版教程的下载
注:本案例涉及到所有内容,包括教程、图片、视频、Wav2Lip等均集中打包分享给大家,可自行复现。

以下是正文


第一部分:深度伪造技术概述

深度伪造一词译自英文“Deepfake”(“deep learning”和“fake”的组合)。它是一种利用机器学习的子领域——深度学习创建合成媒体的技术。
深度伪造Deepfake 可以根据媒体的关注点分为 3 个方向进行更改,即伪造视觉(例如伪造图片或者视频)、伪造音频(例如伪造语音内容等)、伪造视觉及音频(即前两者的结合了,完全都是伪造)。

深度伪造Deepfake很重要的一个技术是表情重现,让目标身份的表情模仿源身份的表情(极端一致,很自然与原始目标人物能够表情自然一致)。这在电影和视频游戏行业中具有极大的应用价值,如对演员的表情表演进行后期调整。本文图片、视频均是自己生成的,可以参考:【震撼来袭】AI视频动画制作《狼来了》全揭秘!【附完整教程】,声音是采用剪映生成的(所有素材均已放在教程中了)。

第二部分:Wav2lip技术概述

Wav2Lip技术是一个基于GAN的唇形动作迁移算法,实现生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与输入语音匹配的视频,俗称「对口型」。该技术的主要作用就是在将音频与图片、音频与视频进行合成时,口型能够自然。
如果您要使用哪个模型文件,github库中的 readme.md 会指出每个模型的关键属性,如下面的屏幕截图所示。

项目地址:https://github.com/baoxueyuan/DeepFake

ModelDescription
Wav2Lip高度精确的唇同步
Wav2Lip + GAN嘴唇同步稍差,但视觉质量更好
Expert Discriminator专家鉴别器的权重
Visual Quality Discriminator在GAN设置中训练的视盘重量

本文着重演示:Wav2Lip与Wav2Lip + GAN
Wav2Lip与Wav2Lip + GAN模型最终的效果对比,可见第四部分。

第三部分使用Wav2Lip进行AI主播虚拟人的深度实践
直接下载教程,完整详细,空间有限,这里仅部分截图展示:

第四部分:效果评测

AI数字人虚拟主播技术实现效果

第五部分:Wav2Lip完整版教程的下载

关注公众号【饱学猿】,回复数字【5301】,即可获取下载链接。
本案例涉及到所有内容,包括教程、模型、图片、视频、Wav2Lip等均集中打包分享给大家,可自行复现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47374.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是虚拟主播?虚拟数字人直播,不用出镜,不用露脸的直播方式

“虚拟主播”(Virtual Youtuber,简称Vtuber)是于2016年在Youtube等视频平台新出现的一类非真实视频主播。此类主播无需真人露脸,视频主体角色多为3D建模,是以依靠数字技术、人声、动作结合后的新产物。截止2018年7月&a…

虚拟主播频繁爆火,想了解虚拟主播的制作过程看这里

随着元宇宙概念的火热,以及我国经济向全面数字化发展转型,作为元宇宙入口的虚拟数字人是目前相关产业中最接地气、最先落地的产业。如果说虚拟人是一座冰山,那么我们看到的部分就是冰山水面以上的部分,而看不到的水面以下则是支撑…

基于大模型的虚拟数字人__虚拟主播实例

基于大模型的虚拟数字人__虚拟主播实例 本文目录: 一、技术的背景: 二、创意名称: 三、创意背景 四、创意目标 五、创意设计 六、技术实现路径 七、完整代码实现 八、创意总结 九、人工智能虚拟人物的一些优秀代表作品及其特点 十、…

科大讯飞今日发布“星火”认知大模型;谷歌一名高级软件工程师跳楼身亡;InsCode 支持 AI 编程|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

用Chat GPT来处理工作问题、Chat GPT处理重启auditd服务后/etc/audit/audit.rules文件内容消失和openssl对文件的加解密的使用说明

文章目录 说明Chat GPT处理重启auditd服务后/etc/audit/audit.rules文件内容消失Chat GPT咨询openssl对文件的加解密的使用说明【1,对文件的加解密(示例,需输入口令):]【2,通过内核模块ecryptfs和软件包ecr…

【小尘送书-第一期】自动化办公应用大全(ChatGPT版):从零开始教编程小白一键搞定烦琐工作

大家好,我是小尘,欢迎关注,一起交流学习!欢迎大家在CSDN后台私信我!一起讨论学习,讨论如何找到满意的实习! 本文目录 一、前言二、作者简介三、内容简介四、抽奖方式 一、前言 在现代社会&…

前沿重器[35] | 提示工程和提示构造技巧

前沿重器 栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经…

【活动总结】0723-COC深圳社区职言职语第1季活动总结之第1视角

0723-COC深圳社区职言职语第1季活动总结 地球有自转,活动不能断,话题不能停。一场愉快的户外职场的畅谈交流会,就这样落下了帷幕…请大家跟随我的第一视角,一起看看我们的活动现场吧。 文章目录 1 活动简介2 活动过程2.1 活动宣传…

手把手教你如何微信公众号开发

最近的话,发现微信开发其实也有很多挺有意思的地方,比如最近很火的一款游戏“跳一跳”,也让我如此着迷。。但是,今天我所要讲的并不是对于小程序的开发,而是要说一下,关于微信开发的另外一个内容&#xff0…

微信公众号开发教程

本教程为看微信公众号视频做的笔记,原视频链接:尚硅谷公众号开发,微信公众号开发实战_哔哩哔哩_bilibili 平台 微信公众号管理:公众号 (qq.com) 微信公众测试号平台:微信公众平台 (qq.com) 微信公众号开发文档&…

公众号推文制作及发布保姆级教程

在这个新媒体的时代,无论是我们刚步入大学,加入了部门,做一些宣传方面的工作,还是想在微信公众号平台发布一些自己的日常生活,写一些文章,甚至以后从事一些关于新媒体的工作……推文这个玩意儿确实越来越吃…

Python预测糖尿病

今天给大家讲解一个实战案例:如何根据现有数据预测糖尿病。在这个案例开始之前,希望大家回忆一下大学里讲过的线性回归的知识,这是数据挖掘里非常重要的一部分知识。当然,鉴于大家都学过,本篇就不再赘述。 一. 数据集介绍 diabe…

小组作业:糖尿病预测

提示:该Blog仅用于作业汇报展示,大佬请绕路 文章目录 一、作业介绍二、数据处理三、数据分析四、特征选择五、模型训练与评价六、模型优化七、与原模型进行对比八、作业总结 一、作业介绍 该项目依托于某医院处理好之后的体检数据,首先进行了…

python糖尿病数据挖掘

有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你…

数据挖掘——糖尿病预测

一、问题描述 糖尿病数据集是Sklearn 提供的数据集。它从442例糖尿病患者的资料中取10个特征:年龄、性别、体重、血压和6个血清测试量值,以及患者在一年后疾病发展的量化值(标签)。 二、实验目的 根据上述10个特征,预…

基于Python实现的糖尿病预测系统

资源下载地址:https://download.csdn.net/download/sheziqiong/86792308 资源下载地址:https://download.csdn.net/download/sheziqiong/86792308 基于Python设计的预测糖尿病 摘要和关键词 本次实验的主要内容是使用回归分析和聚类分析来预测某人患糖…

糖尿病预测

人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站 https://www.captainai.net/shuai 一、糖尿病预测 1.1问题描述 糖尿病数据集是Sklearn 提供的数据集。它从442例糖尿病患者的资料中取10个特征:年龄…

使用 Python 机器学习的糖尿病预测模型

介绍 在本文中,我们将学习如何使用 Train Test Split 模型将数据集分为四个部分,开发预测模型,并通过用例分析预测和数据集。 用例——问题陈述 我们这篇文章的目标是预测患者是否患有糖尿病。我们所有的患者都是年轻女性,她们提供的数据(即怀孕次数、血糖水平和 BMI)…

FGF21 类似物 PF-05231023 改善糖尿病并发症

光感受器细胞中拥有大量的线粒体,以满足视网膜组织高代谢速率的需求。但是,在糖尿病人体内,高血糖引发的代谢异常会增加机体的氧化压力,从而加速视网膜的微血管病变。因此,增强光感受器细胞内的抗氧化通路可以阻止 DR …

保姆级人工智能学习成长路径

文章目录 0. 前言1. 第一阶段:编程语言学习2. 第二阶段:机器学习基本理论3. 第三阶段:深度学习理论与实战4. 第四阶段:细分领域深入学习5. 第五阶段:集大成者 0. 前言 最近有很多小伙伴想学习人工智能,其中…