图片制作二次元头像,表情很到位哦

 

【导读】最近,日本一位酷爱 Vtubers的粉丝结合了此前发表的多项 GAN 工作制作了两个动漫人物生成器的工具,这两个工具一个可以帮助广大动漫迷们快速、轻松的生成带有不同姿态的动漫人物形象,另一个可以帮助大家把真人脸表情移植到动漫人物上,以后你也可以定制你的“动漫Twins姐妹 / 兄弟”了。

 

作者不仅是一个资深 Vtubers 迷,对深度学习技术也很关注,也是在这两个兴趣共同激发下,促使了这两个工具:一个是基于单图就能生成动态动漫人物形象;第二个工具基于第一个工具,输入的单图改造,通过摄像头获取实时人脸图像的姿态特征赋予给动漫人物形象中。

 

人工智能技术是动漫创作的重要工具之一,作为一名深度学习调参师的自觉性,要了解这项工作的效果和方法,自然要赶紧学起来。

效果展示

 

copy 你的一颦一笑,不再话下。这两个工具是怎么做到的?我们先来看看最终成果的展示视频:

首先是第一个工具:基于GUI的单图动漫人脸表情生成器。

基于这一个工作的成功方法,作者还在这个系统中加入了人脸表情检测功能。这个动漫角色就可以实时模仿人脸的表情了。通过改变输入,用摄像头获取的人脸姿态表情特征,输入后让动漫人物 Get 到人脸表情同款:

 

有了第二个工作,作者也尝试把输入换成一段视频,当然方法同样奏效。

              

这么有意思,卡哇伊的工作是怎么做到的?下面我们会介绍一下模型、数据这两大方面的方法,但是在整个工作中,还涉及如何标注数据、图像数据处理规范、采样与渲染等诸多细节工作的处理,我们无法一一讲到,但是作者本人进行了详细的说明与介绍,大家可以仔细阅读项目。

 

项目地址:

https://pkhungurn.github.io/talking-head-anime/

 

方法介绍

 

(1)输入和输出

大家在上面的视频中可以看到,界面左侧表示的是输入的单幅动漫人物图像,中间罗列了 6 种姿态调节栏,每种姿态有一定的设置范围,可以多种姿态叠加使用,而右侧图像中则直接输出生成的效果图像。即整个工作只需要输入一张动漫脸和一个姿态(如一种表情),系统就可以在另一张背景中输出给定姿态的动漫脸。

              (输入与输出)

 

(2)实现的主要两个环节

如何生成效果?这就是模型解决的问题,通过改变面部表情和控制表情幅度(眼睛或嘴巴的张开程度)来设计「面部表情」(Face morpher)与「面部旋转器」(Face rotator)两个独立模型。

               (“两步走”系统)

 

(3)具体模型和方法

              

(模型总图)

 

近年来,GAN 在面部表情合成的诸多任务中都取得令人惊喜和和印象深刻的工作。2017 年,StarGAN 提出后,我们可以轻松调整图像中的发色、肌理、肤色、合成有趣的表情,随后,一种基于动作单元(AU)的新 GAN 模型——GANimation 被提出,在无监督训练后,只需要控制 AU 的激活程度,并选取几个 AU 进行组合,模型就可以生成表情转换,效果也很生动形象。

              

而这个系统中的「面部表情」模型就是基于 GANimation 模型设计的。那「面部旋转器」是如何做的呢?作者将  GANimation 模型与发表于 ECCV 2016 上一篇关于光流法的工作《View Synthesis by Appearance Flow》方法进行融合,第一步网络的输出是第二步网络的输入。

             

什么是光流法?光流是对物理世界中物体上各点实际运动速度的估计,解决这一光流估计问题的计算方法称为光流法。在《View Synthesis by Appearance Flow》工作中,主要解决的任务是根据输入图片中物体或场景的视角生成另一个视角的物体或场景,就好比当我们看到一个物体时,我们的大脑中也能想象出这个物体旋转后的样子。

             《View Synthesis by Appearance Flow》

 

如果想了解更多这两篇论文,下面的地址用得上:

    (1)关于 GANimation 模型,可阅读论文:

    https://www.albertpumarola.com/research/GANimation/index.html

    (2)《View Synthesis by Appearance Flow》

    https://arxiv.org/pdf/1605.03557.pdf

 

貌似有了上面的介绍,如果我们想做这个项目,似乎还少了点什么?对,数据集。

 

(4)数据集

 

虽然现在有很多卡通、动漫人物,但是想要实现一些“动起来”的效果,如果只是我们下载的 2D 平面图像,肯定会影响效果,如果是 3D 的数据,肯定是最好不过了。

 

对角色进行 3D 建模,无论是人力还是物力成本都非常昂贵。如果能基于 2D 即时动态生成动漫图

 

为此,作者专门创建了一个新的数据集。作者从 MikuMikuDance 上下载了约 8000 个 3D 动画模型。并将数据集分成了三部分:训练集、验证集与测试集。

 

    MikuMikuDance,简称 MMD,是一个免费的动画程序,可让用户制作动画并创建3D动画模型,

              

作者详细介绍了如何一步一步生成数据,如何训练Face Morpher的网络,如何融合两种算法造出了Face Rotator网络,并在最后给出了主观和客观的结果对比,为这位日本小哥严谨的学术态度点赞。

 

总结

 

该系统仅输入一张2D图像,便可以旋转、改变该图像的面部表情。不需要创建3D模型就可以实现会说话的动态动漫人物,大大降低了动画制作的成本,而且该系统易于使用。不过,未来还有可以继续 working on 的方向,如:

 

1、操纵自然场景下的动漫图像

2、修复现有模型带来的模糊、伪影等视觉效果

3、支持多种嘴、眼睛、眉毛的变化,使效果更逼真

4、从绘画图里面推断2.5D层模型或3D模型

 

项目地址:

https://pkhungurn.github.io/talking-head-anime/

 

原创不易,燃烧秀发输出内容,如果有一丢丢收获,点个赞鼓励一下吧!还有个小惊喜,帮大家整理了一些技术电子书,关注公众号回复“1024”即可获取~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/69926.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

二次元卡通渲染-着色

前言 本文为“优梦创客”原创文章,您可以自由转载,但必须加入完整的版权声明 更多学习资源请加QQ:1517069595获取(企业级性能优化/热更新/Shader特效/服务器/商业项目实战/每周直播/一对一指导) 点赞、关注、分享可免费…

【AI绘画打卡】| 用漫画生成器绘制宅男最爱的二次元美女

二次元美女在日本文化中已经成为一种流行文化和艺术形式,包括漫画、动画等。由于此类作品的富有想象力、多样性和虚构,像二次元美女这样的虚拟角色往往可以充分满足人们的幻想和情感需求。这也是许多宅男在二次元世界寻找自己理想女友的原因之一。 作品…

人人皆可二次元!小姐姐生成不同风格动漫形象,肤色、发型皆可变

点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 机器之心报道 一张输入人脸图像,竟能生成多样化风格的动漫形象。伊利诺伊大学香槟分校的研究者做到了,他们提出的全新 GAN 迁移方法实现了「一对多」的生成效果。 在 GAN 迁移领域…

虚拟人直播-元宇宙离我们有多远?

目标 利用 Live Link Face unrealEngine quixel bridge 方案,实现虚拟形象的建模和控制。为后面的直播等应用搭建基础流程。 安装和配置 unrealEngine (虚幻引擎) 需要从下面的链接先下载 Epic Games launcher 安装好后,再下载并…

虚拟发布会直播有何优势?虚拟直播技术让线上活动变得简单高效

随着数字经济和产业数字化的快速发展,以及直播应用场景愈发深入,企业直播的内容形态和体验方式面临全面升级,利用虚拟技术打造多元化的直播间和线上虚拟发布会已经成为新趋势。 融入了“AR/VR/MR”、“虚实融合”、“虚拟数字人”等概念的虚…

直播有什么新的互动玩法?

其实有很多主播会选择打pk、聊天这种方式互动吸引观众,但是用多了观众也会觉得索然无味。我们不妨转换一下思路,在直播的时候加入一些互动的游戏,既能避免只有主播聊天的“冷场”局面,又能增加观众的兴趣。 现在很多直播间都会选择…

Android面试题汇总(中高级)及答案解析,2023年企业面试题精选

前言 首先要声明的是:面试题的目的不是为了让大家背题,而是从不同维度帮助大家复习,取长补短。让我们正式进入正题: 现在网上的面试题资料实在太多了,而且人人肯定都说自己的最好,那么就导致大家不知道怎…

安卓系统最新面试题(面试题整理,含答案)

最近自己再找安卓系统方面的工作,所以安卓系统整体的知识点进行了整理,内容点涉及的比较多。可以选择自己不熟的层来看跟学习,如果小伙伴还有补充或者自己遇到的题,欢迎留言。 系统应用层: 四大组件: 一.…

2020年Android面试题(BAT最新面试题)包含详细答案

2020年Android面试题汇总,面试必看,轻松拿BAT大厂Offer。完全免费。 基础问题相关(答案在文末) 1、接口的意义-百度 2、抽象类的意义-百度 3、内部类的作用-乐视 4、Java 虚拟机的特性-百度-乐视 5、哪些情况下的对象会被垃圾回…

面试题-史上最全人事面试宝典

与人事相关面试题 人事面试宝典 1、 请你自我介绍一下你自己? 回答提示:一般人回答这个问题过于平常,只说姓名、年龄、爱好、工作经验,这些在简历上都有,其实,企业最希望知道的是求职者能否胜任工作&…

安卓十大必问面试题(附答案和解析)

面试,无非都是问下面这些问题(挺多的 - -!),聘请中高级的安卓开发会往深的去问,并且会问一延伸二。以下我先提出几点重点,是面试官基本必问的问题,请一定要去了解! 基础知识 – 四大…

五年后计算机专业还会吃香吗,未来5年的紧缺职业 五年后最吃香的专业有哪些?...

人们常言“360行,行行出状元”,但是在现实生活中,人们想要找到一份适合自己的工作却并非易事,此前根据人社部的数据显示,2019届高校的毕业生人数达到了834万,就业的压力也是相当大了。那么,未来…

2023年最热门的网络安全行业岗位分析

前言 大数据、人工智能、云计算、物联网、5G等新兴技术的高速发展,蒸蒸日上。但是随之也出现了许多问题,比如:政府单位、企业、个人信息泄露,网络安全问题日益严峻,网络空间安全建设刻不容缓。 网络安全人才需求量巨…

注意!2023年你必须要了解的IT各行业趋势

人工智能蝉联了将近一个月的热门话题,用户最开始只是用来写论文、查资料、写代码,如今GPT-4已经能为人类安排菜谱了。科技的发展总是超乎我们想象边界,如果想快速跟上科技潮流,那么我们就一定得从了解IT行业趋势入手,了…

IT行业的5个热门岗位,你了解吗?

随着互联网发展和IT技术的普及,IT行业作为发展前途最大的几大行业之一,获得了前所未有的广泛关注,并且随着科技的发展,这一趋势将更加明显。 但对于IT行业新人来说,想要在IT行业有所建树,首先应该选择适合…

2023年IT行业就业前景分析,准职场人必看!

随着疫情的放开,2022已接近尾声。新的一年即将来临,作为打工人最关心的肯定是2023年的就业市场以及行业未来发展前景。 如何最直观地看待这个行业是否还有前景,最好的方式就是看市场需求。作为准职场人的你,速速关注起来&#xff…

未来中国最热门的十大职业排行榜

未来中国最热门的十大职业排行榜_联展新闻 2014年的大学毕业生已经毕业个把月了,接下来就是投身到各种工作岗位中。下面笔者根据行业前景、承受压力、进入门槛、福利待遇、供求、上升空间、收入评选出未来中国热门职业前十,供大家参考。 1、销售   提…

验证 哥德巴赫猜想

验证 哥德巴赫猜想 2.写一个函数验证哥德巴赫猜想,一个不小于6的偶数可以表示为两个素数之和,如633,835,1037……在主函数中输入一个不小于6的偶数n,然后调用函数goldbach,在goldbach函数中再调用prime函数,prime函数…

验证哥德巴赫猜想

使用函数验证哥德巴赫猜想:任何一个不小于 6 的偶数均可表示为两个奇素数之和。 如 633,835,…,18513。 将 6~100 之间的偶数都表示成两个素数之和,打印时一行打印 5 组。试编写相应程序。 分析&#xff1a…

chatgpt赋能python:Python源代码的隐藏方法

Python源代码的隐藏方法 Python是一种高级编程语言,由于其易学易用的特点,已成为应用最广泛的编程语言之一。然而在某些情况下,我们可能需要隐藏Python代码的源代码,例如保护知识产权、防止竞争等。在本文中,我们将介…