AI数字人:AI数字人制作初探及相关开源简介

文章目录

    • @[toc]
    • 简介
    • 一、SadTalker
    • 二、Wav2Lip
    • 三、Thin-Plate Spline Motion Model
    • 四、Real_Time_Image_Animation
    • 五、Text2Speech
    • 六、语言模型
    • 其他

简介

数字人这名字听着稀奇又别扭,其实它最初的原型大家都听过——NPC。玩过游戏的应该都知道,也就是游戏内玩家操纵的游戏角色,可以和玩家进行交互的角色。广义上讲可以说是计算机模拟出的具有人的形态的虚拟人都叫做数字人,在平常的观感上,数字人是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。他通过对人物形象的复制模拟,人物声音的克隆及语音合成,可随时随地与真人进行准确交互性对话。

通俗的讲所谓数字人,本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。数字人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。它具备人类的外观和行为模式,数字人具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字人的影像通常是呈现出某种人类的活动。

下面收集了几个开源的数字人项目,整理出来了,大家一起学习,希望对大家有所帮助。

一、SadTalker

https://github.com/OpenTalker/SadTalker

在这里插入图片描述

它可以通过音频驱动图像,生成真实感的3D人脸动画,使得人物可以“开口说话”。

在这里插入图片描述

而且,非常方便的是,可以直接集成到stable-diffusion-webui
在这里插入图片描述

一张图 + 音频 => 视频, 我找了2张图,一段音频,跑了2次。结果还不错,口型几乎都是吻合的。

在这里插入图片描述

二、Wav2Lip

https://github.com/Rudrabha/Wav2Lip

  • 将视频与任何目标语音进行口型同步
  • 适用于任何身份,声音和语言。也适用于CGI人脸和合成语音。
  • 你可以自己训练、或者使用预训练模型

原视频 + 音频 => 新视频 ,这是一个2020年启动的项目,有段时间没有更新,但是如果有需要,还是值得看看的。

三、Thin-Plate Spline Motion Model

https://github.com/yoyo-nb/Thin-Plate-Spline-Motion-Model.git

使用视频,驱动静态图片。“让任何图片开口,讲任何话”。
在这里插入图片描述

再看一个视频交流互动的例子
在这里插入图片描述

四、Real_Time_Image_Animation

https://github.com/anandpawara/Real_Time_Image_Animation

就像项目名称所说的,支持实时驱动静态图像,生成视频/视频流。没错,支持实时摄像头!
在这里插入图片描述

总结一下,“你可以让任何图片说任何话”,“你可以让任何人说任何话。”

五、Text2Speech

文本生成音频。已经相对比较成熟了,像讯飞,微软,很多人一直在使用他们的产品。

六、语言模型

这个就很多了,从国内到国外,太多了,有的人都说千模大战了。ChatGPT,GPT4,GPT5,文心,星火,源,盘古。有了语言模型,人物有了自己的“精神世界”,可以训练特定的人物语言风格,你可以与数字人对话交流,再使用文本生成相应的音频,然后使用音频驱动图片,产生人物表情、姿态,甚至动作,从而最终实现视频交流。比如,你可以在头条上看到的24小时数字人新闻直播:

在这里插入图片描述

因为这个不需要互动,基本上 信息收集 + 缓冲队列 + 画面音频驱动 就可以实现了。而想要达到实时互动的效果,比如视频聊天机器人,需要生成计算人物表情甚至动作,延迟是少不了,而且现有技术条件下,需要消耗巨大的算力,一般的公司或者个人无法承担。除非有牛X的创新的技术出现。因此,你会看到,包括不久前的character AI,拥有相当多的角色人物,但是只能响应文本内容…
在这里插入图片描述

其他

参考:https://www.toutiao.com/article/7242460144024732195

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58214.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剪映发布专业版2.0版本:升级智能字幕、推出创作脚本及图文成片等工具

剪映于2019年5月上线至今,其模板每天被使用超过1700万次。2021年9月9日,在剪映举办的首届创作大会上,剪映发布了专业版2.0。 在剪映专业版2.0中,用户可通过语音识别自动形成字幕,也可将文稿粘贴到软件中,一…

只需四步,手把手教你打造专属数字人

伴随ChatGPT的问世,在技术与商业运作上都日渐发展成熟的数字人产业正持续升温。去年9月,北京市发布了国内首个数字人产业专项支持政策,提出将依托国家文化专网将数字人纳入文化数据服务平台。以数字人、ChatGPT为代表的互联网3.0创新应用产业…

批改网作文不允许粘贴

当我们写英语作文时图方便或是没时间通常都是有道直接翻译复制过来当是老师会设置如下 解决如下: 首先在批改网页面中按下F12进入管理员模式 点击设置按钮并找到调试程序 勾选禁用javascript之后就将自己的内容复制到作文框里 复制成功后再取消勾选禁用javascrip…

md数学公式不显示

md数学公式不显示的原因:自带的预览不能显示,下载插件解决

网页显示数学公式

网页显示数学公式 网页中的数学公式可能会难以正常显示,通过添加Math Anywhere插件就可以正常显示公式。 添加插件在含有公式网页点击运行插件,刷新 点击下载

LaTeX数学公式的输入

1. 在导言区导入amsmath宏包 \documentclass[UTF8]{ctexart} \title{数学公式} \author{GHM} \date{\today} \usepackage{ctex} \usepackage{amsmath} %在导言区导入amsmath宏包 2. 正文区 数学公式都可以在这个网站编辑Online LaTeX Equation Editor - create, integrate a…

如何将截图中公式转换成为可用的mathtype公式

(1)首先我们确保自己的PC端已经安装了如下软件:QQ(截图)或者Snipaste(截图),Mathtype7(7以下的版本如6可能不适用于该方法)。 (2)其次…

MarkdownPad 2 显示数学公式,使用MathJax

MarkdownPad 2 显示数学公式,使用MathJax MarkdownPad 2是不支持数学公式在编辑器内实时渲染的,但是MarkdownPad 2的好处是可以左右对比格式和效果。 这里介绍一个MarkdownPad 2 查看数学公式的方法。 在查看数学公式之前,当然要有Markdown…

Mathtype公式在visio中显示不正常(显示方框)的批量处理方法

问题描述: 在使用mathtype在visio中插入公式的时候,总是遇到显示方框的情况,这种情况往往出现在对画图缩放一定程度之后,公式就有一定概率显示不正常了,如下图所示: 麻烦的方法是,双击图中的方…

浏览器无法正常显示latex公式问题

问题 在使用谷歌浏览器浏览知乎某些论文翻译时无法正常转义latex公式,主要因为代理服务器没有加载数学公式js文件,导致只能显示原始latex编辑公式。 解决方案 按键ctrl shift J打开console,找到与math相关的红色js文件链接(作者…

使用mathtype编辑公式后粘贴在word中显示问号

这几天在看论文的时候,有个公式在MathType里看着没问题,但是粘贴到word里就出现问号,如下图所示: 乍一看好像并没有什么问题,其实word中的问号就是由于MathType公式里带有空格引起的,这主要是由于复制粘贴没…

维基百科公式不显示怎么办 找不到latex公式怎么办?

一劳永逸 维基百科公式不显示怎么办? 注册1个wiki账号,参数设置,显示选项卡,最后的PNG图片点上; 成功; - 有人说改http,为https协议就可以,但是我的本来就是https协议,同样显示不了…

如何在Markdownpad2中显示数学公式

前言 说句实话,我觉得markdown比LaTeX方便多了,但是就是数学公式方面太麻烦了,所以只好想方设法找办法。 Markdown pad2的安装 如果你还没有安装markdownpad2的话,可以参考我的这篇博客。 Markdownpad2安装教程 Markdown上使用数…

如何在MathType中解决公式显示问号

2019独角兽企业重金招聘Python工程师标准>>> 有朋友在使用MathType数学公式编辑器编辑公式时,发现编辑好的公式在Word中会显示乱码,有些符号显示不出来,只能显示问号或者空格,那么这种MathType公式显示问号的问题该怎样…

[转]Web数学公式的输入和显示

Web数学公式的输入和显示 摘要:随着基础教育信息化的推进,许多中小学开始利用网络开展教学与交流,但Web数学公式的输入和显示一直是一个难题。本文介绍了几种Web数学公式的显示方法及其原理,给出了普通网页、博客、Moodle系统中输…

Android 显示数学公式

在你的项目build.gradle文件中添加maven { url “https://jitpack.io” },注意不是app目录下的build.gradle文件 allprojects {repositories {...maven { url "https://jitpack.io" }} }同时 在你app的build.gradle文件中添加compile ‘com.github.daque…

程序员的收入:我靠卖源码都能月入上w

这是本文的目录 前言一、源码是什么?二、卖源码赚不赚钱?三、如何卖源码赚钱?第一类:源码搬运1、在淘宝或互站等平台贩卖2、自建网站销售 第二类:二次开发类写在最后文末福利零基础Python学习资料介绍👉Python学习路线…

基于语音AR的智能眼镜总结(Smart Glasses via Audio)

基于语音AR的智能眼镜总结(Smart Glasses via Audio) 视觉增强眼镜 骨传导眼镜 骨传导技术点 定向扬声器眼镜 声学结构和示意图

关注智能眼镜:tooz Devkit 20

原文 http://i.scwy.net/ai/2020/121922-aieye/: 从某个角度说,智能眼镜是一个趋势。它可以取代智能手机及众多电子设备的屏幕,通过智能的交互设计,从来抛弃现有电子设备的物理交互方式。 今天看到一款智能眼镜 tooz Devkit 20&…

IOS微信逆向-免越狱抢红包防撤回等自定义功能实现

微信砸壳 CrackerXI砸壳,或手动使用dumpdecrypted砸壳 把已砸壳的wech使用scp或者助手at.ipa导出 monkeydev MonkeyDev集成在xcode上面,可以快速开发hook的代码,链接到Mach-O文件,支持修改ipa后的免越狱安装。 新建MonkeyDev项目…