突破传统,AI在加速“孵化”你的数字人

  • 💂 个人网站:【海拥】【游戏大全】【神级源码资源网】
  • 🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】
  • 💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】

目录

  • 背景
    • 数字人的定义
    • 数字人的应用
    • 传统高精度数字人制作流程
    • 数字人趋势:生于云、长于云、用于云
      • 流程
      • 挑战
        • 如何批量生产
        • 如何持续成长
        • 如何规模应用
  • 1.华为云数字内容生产线简介
    • 华为云数字内容生产线 MetaStudio
      • 资产体系
      • 开发者体系
      • 应用体系
    • 华为云数字内容生产线 —— 核心能力
    • 华为云数字内容生产线 —— 风格化数字人
    • 华为云数字内容生产线 —— 超写实数字人
    • 华为云数字内容生产线 —— 虚拟直播解决方案
      • 预置多直播平台连接
      • 单摄像头视觉驱动
  • 2.高精度三维人脸采集和材质计算
    • 计算机图形学
    • 轻量级人脸几何材质采集系统
    • 多视图几何重建
    • 三维人脸关键检测
    • 非刚性配准
    • 基于多视图的镜面反射分离
    • 光度立体视觉
    • 多视图纹理映射
    • 人脸重建结果
    • 动态人脸重建
  • 3.个性化人脸自动绑定
    • 三维人脸自动绑定
    • 面部动作编码系统
    • 表情基动画
    • 如何去制作关键表情
    • 表情迁移
    • 表情基自动绑定
  • 4.总结与展望
    • 传统数字人制作流程复杂
    • 华为云数字内容生产线 MetaStudio
    • 好书推荐

虚拟数字人一直是业界的热点研究问题,广泛应用在营销、直播、AR、VR等场景中。而传统的数字人制作流程非常依赖于美术人员,制作周期长、成本高、生产效率低。本次分享主要介绍华为云数字内容生产线MetaStudio中的数字人制作管线背后的一些关键技术,利用计算机视觉和图形学等技术,来提升数字人模型制作和动画制作的效率,具体包括高精度三维人脸重建、个性化人脸自动绑定、实时面部表情捕捉等技术,最后介绍一下基于隐式表示的数字人建模和驱动相关前沿技术和应用前景。

背景

数字人的定义

美国作家尼尔·斯蒂芬森在1992年出版的科幻小说《雪崩》中创造了两个概念:元宇宙(Metaverse)和虚拟分身 (Avatar)。

“虚拟分身”在中国发展至今拥有更广泛的称呼 “虚拟数字人”,被视为未来人们进入“元宇宙”的入口

  • 拥有人的外观具有特定的相貌、性别和性格等人物特性
  • 拥有人的行为具有用语言、面部表情和肢体动作表达的能力
  • 拥有人的思想,具有识别外界环境、并能与人交流互动的能力

数字人的应用

传统高精度数字人制作流程

  • 缺点:强依赖美术人员、周期长、成本高、缺少制作标准、动画制作复杂
  • 目标:基于计算机图形学和计算机视觉技术,提升制作效率,降低制作成本

数字人趋势:生于云、长于云、用于云

流程

1、生产:原画、建模、驱动、渲染。

2、成长:

  • 综艺技能(舞蹈、唱歌)
  • 教育技能(内容理解、智能答题)
  • 新闻技能(播报、手语)
  • 电商技能(商品展示、智能交互)

3、应用:

  • 电视、动漫
  • 教育、展会
  • 直播、协作
  • 金融、游戏

挑战

如何批量生产

  • 超写实数字人,制作周期长(柳夜熙模型制作耗时8个月)
  • 捏脸类/照片扫描类数字人,不像真人,动作僵硬

如何持续成长

  • 新皮肤、发型、服饰 (云笙新服装,2人2月)
  • 新表情、动作(云笙舞蹈,2人1月)
  • 新知识、性格(云笙新情绪,2人2月)

如何规模应用

  • 数字人物走入实拍视频,虚实融合 (云笙进入HC大会现场直播,2分钟视频制作时长1个月)
  • 数字人走进教育课堂、综艺直播、线上展厅等需要行业能力

1.华为云数字内容生产线简介

华为云数字内容生产线 MetaStudio

资产体系

  • 数字人模型库:数字人模型(几何纹理、贴图) 10万+
  • 数字人材质库:数字人材质(皮肤眼球、牙齿、毛发) 10万+
  • 行业模型库:行业模型(家具文物、车等) 10万+

开发者体系

  • Demo(50+):数字人名片、产品宣讲、虚拟社交、虚拟试衣、数字人驱动、智能交互、智能问答、小游戏
  • API & SDK:应用类API & SDK,生产、训练、运行类API & SDK

应用体系

视频平台:芒果、华为视频、B站、抖音、快手等20+平台。

教育平台:VIVA畅读、IT大咖说等10+平台。

互娱直播:抖音、快手、虎牙、斗鱼、映客等20+平台。

企业直播:保利威、目睹、微赞等10+平台。

新闻网站:搜狐新闻、央视新闻、腾讯新闻等10+平台。

智能客服:中信银行、泰康人寿等10+平台。

华为云数字内容生产线 —— 核心能力

华为云数字内容生产线 —— 风格化数字人

华为云数字内容生产线 —— 超写实数字人

华为云数字内容生产线 —— 虚拟直播解决方案

预置多直播平台连接

连接多个主流直播平台,一键开启数字人直播

单摄像头视觉驱动

普通RGB摄像头动捕驱动,无需专业动捕/面捕设备

2.高精度三维人脸采集和材质计算

计算机图形学

计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学,主要研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。[wiki]

广泛应用于游戏、电影、动画、设计、可视化、虚拟现实、增强现实、物理模拟、图形用户接口GUl …

轻量级人脸几何材质采集系统

  • 搭建轻量级人脸采集设备,快速采集人脸的几何模型和材质贴图,加速静态人脸资产制作;
  • 通过拍摄多个视角图像,基于多视图几何算法,求解人脸的几何信息;
  • 通过模拟不同的光源方向和视角方向,求解人脸皮肤的材质信息;
  • 通过硬件进行光源和相机的同步,同步误差小于5ms,全部采集时间约100ms;

多视图几何重建

  • 通过多张有一定视角重叠的RGB照片,来恢复出场景的几何结构信息。

  • MVS算法流程: 特征提取、特征匹配、稀疏重建 (Structure From Motion)、深度图估计、稠密重建。·
  • 商业软件: Agisoft Metashape、Reality Capture;开源流程: Colmap稀疏重建 + PMVS稠密重建。

三维人脸关键检测

二维人脸关键点检测器;

通过多视图几何,从多个视角的二维人脸关键点得到三维人脸关键点坐标;

  • 耳朵关键点数据集:公开数据集+自标注数据;
  • 基于Faster-RCNN进行耳朵区域检测;
  • 利用主动外观模型来拟合耳朵关键点;

非刚性配准

  • 给定一个标准网格模板模型X 和一个目标模型Y,如何通过形变,将模板模型和目标模型进行对齐?

如何在变形过程中保持局部形状?

基于多视图的镜面反射分离

光度立体视觉

通过采集物体不同光照方向下的图像 (三张以上),重建出物体表面的法向量和反射率;

基于该算法,利用采集得到的不同光照条件下的人脸图像,求解出各个视角下人脸的漫反射率、镜面反射法线和镜面反射率。

多视图纹理映射

已知相机位姿,将各个视角下得到的材质信息融合到同一张纹理贴图中

人脸重建结果

动态人脸重建

  • 目标:在静态人脸重建的基础上,加上时间维度,每都是一个同拓扑的三维模型
  • 4D 动态人脸数据的作用:

面捕只能跟踪有限的面部细节,丢失很多信息,而4D数据可以还原演员本身的表演

传统的利用Maya制作面部绑定是线性变形,4D数据用于面部绑定能加入非线性的肌肉变形;

基于深度学习的人脸应用需要大量高精度动态人脸数据,而传统采集方案成本高,且需要大量手工交互:

  • 非刚性配准+参数化模型约束+光流约束

3.个性化人脸自动绑定

三维人脸自动绑定

制作了静态人脸模型,如何让角色生成表情动画,即脸部如何动起来?

面部动作编码系统

  • 面部动作编码系统(FACS)是一种基于解剖学结构的系统,用于描述面部的肌肉运动。通过对肌肉运动进行编码,来了解面部运动的方式和原因,是一种可靠的面部运动和表情编码分析技术。

表情基动画

什么是表情基动画?中性表情 B0,以及K个表情BK(每个表情基存储与中性表情之间的差值);

如何去制作关键表情

  • 艺术家通过maya等软件,使用绑定的脸部或者使用“形变编辑器” 和雕刻工具来创建表情。非常耗时!

  • 给定角色的中性表情(或一些极端夸张表情),能否通过自动化算法生成该角色的表情基?

表情迁移

  • 给定一个静态人脸几何,自动生成一组表情基,支持不同风格、不同个数的表情基模板。
  • 核心思想:将一组表情基模板的变形,迁移到目标人脸模型上;

用途:

为艺术家提供超写实数字人表情基,方便后续调整;

帮助普通用户快速生成可驱动个性化人脸表情基;

表情迁移:将参考模型上的形状变化迁移到目标模型上

表情基自动绑定

4.总结与展望

传统数字人制作流程复杂

  • 数据扫描:静态扫描+几十个FACS表情作为面部绑定的参考;
  • 模型清理和制作:Zbrush雕刻细节,Xgen制作头发,MD制作衣服;
  • 模型绑定:面部绑定+身体绑定;
  • 模型驱动:面部表情捕捉+身体动作捕捉;
  • 物理动画:头发模拟、布料模拟;
  • 高品质渲染:实时渲染UE、Unity,离线染 Arnold、Keyshot等;

华为云数字内容生产线 MetaStudio

主页: https://support.huaweicloud.com/metastudio/index.html

好书推荐

《Python自动化办公应用大全(ChatGPT版)》

在这里插入图片描述

借助ChatGPT与Python轻松实现办公自动化:Excel Home多位微软全球MVP专家打造,用大量实例介绍使用Python操作Excel、Word、PPT和日常办公中涉及的各种对象。让没有编程经验的普通办公人员也能驾驭Python,实现多个场景的办公自动化,提升工作效率!

📚 当当自营购买链接:《Python自动化办公应用大全(ChatGPT版)》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20068.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

37岁,公司把整组都裁了,只剩我一人干所有活,但不给涨薪!想主动换工作,又想要赔偿,该怎么办?...

很多时候,工作就像鸡肋,食之无味,弃之可惜。 一位网友求助: 37岁,在如今公司工作4年。公司今年裁员,部门设计组从5人缩减到1人,只剩他自己。侧面了解到公司并没有裁他的打算。现在他心情很复杂&…

职场新人如何使用ChatGPT提高工作效率

刚刚从象牙塔中毕业,走向社会战场。作为职场新人的同学们刚刚进入公司和部门,难免会被安排做些本职工作之外的事务工作,被上级安排做些零零碎碎的小东西,俗称打杂。这些工作说难不难,想要做漂亮也并不简单,…

ChatGPT 最佳实践指南

GPT Best Practices GPT 最佳实践指南 This guide shares strategies and tactics for getting better results from GPTs. The methods described here can sometimes be deployed in combination for greater effect. We encourage experimentation to find the methods that…

基于 ChatGPT 和 React 搭建 JSON 转 TS 的 Web 应用

在本文中,你将学习如何使用 ChatGPT API 构建一个将 JSON 对象转换为 Typescript interface 的 Web 应用 为什么你需要它? 许多网站为不同的场景提供 API 简单的解决方案是发送 JSON 并返回 Typescript 中的interface 你也可以使用 JSON-to-typescri…

ChatGPT 能为计算材料科学做些什么?未来会取代计算材料科学家吗?

来源:ScienceAI 本文约2600字,建议阅读5分钟本文简要讨论了 ChatGPT 可能应用于计算材料科学的 3 个方面,即生成结构、计算材料软件编程,数据可视化等。 ChatGPT 已火爆全球,它可以完成一系列具有挑战性的任务&#xf…

强到在IQ测试中“碾压”人类的ChatGPT,可能解不出这几个数学脑筋急转弯

来源:AI前线 作者:Meghan Bartels 译者:王强 策划:刘燕 ChatGPT 可以在 IQ 测试中拿到高分,但它没法在传奇数学谜题大师 Martin Gardner 设计的题目中击败人类高手 事实证明,如果你想解答一个脑筋急转弯问…

我们拆了一款将ChatGPT“落地”的AI语音交互机器人,八核A7全志R58主控

视频版本拆机:【60块钱,垃圾佬的第一台机器人,国产8核CPU全志R58】 https://www.bilibili.com/video/BV1Qk4y177ja/?share_sourcecopy_web&vd_source6ec797f0de1d275e996fb7de54dea06b 公子小白是一对由狗尾草智能科技推出的人工智能机…

万字长文:Stable Diffusion 保姆级教程

万字长文:Stable Diffusion 保姆级教程 2022年绝对是人工智能爆发的元年,前有 stability.ai 开源 Stable Diffusion 模型,后有 Open AI 发布 ChatGPT,二者都是里程碑式的节点事件,其重要性不亚于当年苹果发布iPhone&a…

Claude注册保姆级教程,含添加slack失败等问题处理方式

ChatGPT最强平替Claude 1. 搜索claude官网 网址:https://www.anthropic.com/product2、添加到slack 进入官网后下拉,滚动到页面底部,点击Product News,“Claude in Slack”。3、进入slack应用市场 https://w1685857018-gkt521992…

外汇天眼:Apple与MetaQuotes之争!谁是下一个Apple?谁会成下一个MT4/5?

手机巨头Apple 从其应用商店App Store中下架领先的交易软件MetaTrader4(MT4)和 MetaTrader5(MT5)引发了外汇市场热议。 虽然截止发稿,Apple以及交易软件MT4/5供应商MetaQuotes均未对此次事件发表任何评论,…

yfinance 国内使用,下载雅虎财经数据

本文基于2021年发布的FinRL框架,在第一步下载数据便遇到了问题 要么时区获取不到:No timezone found, symbol may be delisted 要么数据没有:No data found for this date range, symbol may be delisted 其实都是代理问题 FinRL: Deep Re…

ChatGPT想干掉测试人员,做梦去吧

很多人都发现ChatGPT可以做一些代码相关的工作,不仅可以写一些测试用例和自动化脚本,还可以做一定量的调优,于是就开始担忧起来,到哪天我的测试工作会不会被ChatGPT这个工具给取代了? 1. ChatGPT目前对哪些东西会有冲…

《Steam平台上的VR虚拟现实》(Yanlz+Unity+XR+VR+AR+MR+Steam+SteamVR+Vive+Oculus+Valve+立钻哥哥+==)

《Steam平台上的VR虚拟现实》 《Steam平台上的VR虚拟现实》 版本 作者 参与者 完成日期 备注 YanlzVR_Steam_V01_1.0 严立钻 2019.04.01 ##《Steam平台上的VR虚拟现实》发布说明: “Steam平台上的VR虚拟现实”:是对“Ste…

HTC VIVE VR眼镜的介绍以及初始化设置

硬件设备介绍 使用的硬件设备:HTC VIVE 或 HTC VIVE Pro 1.认识一下HTC VIVE VR头盔上的主要部件: A 是基站(定位器) x 2(发射激光定位头显与手柄控制器) B 是同步线 C 是基站电源适配器 x2(任何电子设备都需要能源支持) E 是联接器(把头显和电脑连起…

2018VR排行手机VR眼镜哪个好?VR眼镜多少钱,哪个VR眼镜性价比高?评测推荐

摘要:虚拟现实(VR)头戴设备目前已成为市面一类比较火热的产品,它有哪些分类呢?一般可分为头戴类、非头戴类和手套类。怎样选购vr眼镜?不妨先来看看目前比较火的vr眼镜产品评测。

Type-C接口AR/VR眼镜转接器方案,同时支持边传输数据边充电

近几年,人们对电子数码设备的需求也不断提升,VR眼镜作为终端显示产品也不断更新迭代。目前VR眼镜开始配备USB -C接口,现在苹果、华为、三星、华硕、小米等品牌的笔记本都支持通过USB C接口来进行视频数据传输。 USB-C接口除了能够用来传输文…

在你眨眼时,VR这样欺骗你的视觉

VR的沉浸感,可以让人仿佛置身于现实之外,还可以利用各种生物传感特性,来模拟一种具有存在感的虚拟空间。实际上,VR可以很好的欺骗人的感官,比如尽管你身处空间有限的房间中,但在VR中你仿佛已来到开阔的户外…

VR眼镜转接器方案,支持同时给电脑手机设备及VR供电。

近几年,人们对电子数码设备的需求也不断提升,VR眼镜作为终端显示产品也不断更新迭代。目前VR眼镜开始配备USB -C接口,现在苹果、华为、三星、华硕、小米等品牌的笔记本都支持通过USB C接口来进行音视频数据传输。 USB-C接口除了能够用来传输…

【2018VR眼镜评测】UGP VR和千幻魔镜哪个好?暴风魔镜和小宅VR有什么区别?哪个牌子VR眼镜好?2017

按照目前VR的硬件形态来划分,VR头戴设备主要分为三种: 1、移动端头显(又叫手机VR) 2、一体机VR 3、PC端VR 【三种VR的的区别】 移动端VR:其实这类产品又称为VR盒子,方便小巧且便宜,相当于纸盒vr的进阶,价格…

ps4虚拟现实VR眼镜入手体验

随着近几年越来越多的资本注入VR行业,市面上VR眼镜的款式和品牌也越来越多,不管是价格高低可以说VR眼镜已经覆盖了中高低端市场,今天小九主要为大家来讲一下ps4虚拟现实VR眼镜的入手体验,为什么要挑选这一款呢?因为市面上很多游戏…