基于图像的虚拟试衣:VITON:An Image-based Virtual Try-on Network(2018)

[paper]VITON: An Image-based Virtual Try-on Network(2018)
[code]VITON

效果

在这里插入图片描述

网络结构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 人的量化表示

    • 人姿态热图
      人的姿态用18个关键点表示。为了利用空间布局,每个关键点都将进一步转换为热图,关键点周围11x11领域设置为1,其他位置区域设置为0。然后将热图堆叠到18通道的姿势热图中。
    • 人体表示
      衣服的外观高度取决于人身体不同部位的位置和形状,使用人体解析算法对人身体的不同部位进行分割,将分割图进一步转换为1通道的二进制掩码,其中除了人脸和头发人身体用1表示,其他都用0表示。二进制掩码图下采样到较低的分辨率,避免在身体形状和目标衣服发生冲突出现伪像。
    • 人脸和头发分割
      使用人体分析提取人的脸部和头发区域的RGB通道,用来在生成新图像时注入身份信息。
      在这里插入图片描述
  • 多任务编解码生成器
    给定衣服无关的人的表示p和目标衣服c,通过cp中相应区域的转换的重构方式来合成参考图像。利用多任务编码器-解码器框架,生成穿衣服的人像以及该人的衣服蒙版,进一步使用预测的衣服蒙版来细化所生成的结果。编码器-解码器是U-Net体现结构的一种通用类型,使用跳过连接可以通过旁路连接直接在层之间共享信息。
    G C G_C GC表示编码器-解码器生成器,输入目标衣服 c c c和人的表示 p p p,输出合成图像 I ′ I' I(3通道彩色图像)和衣服掩码 M M M(1通道二值图像)。为了使合成图像 I ′ I' I更加接近参考图像 I I I,衣服掩码 M M M更加接近衣服掩码 M 0 M_0 M0(通过人工的方法获取的参考图像 I I I上衣服的掩码),利用一种感知损失来模拟合成图像和真实图像的相应特征图之间的距离,该距离由视觉感知网络计算得到。编码器-解码器的损失函数可以写成感知损失和L1损失的总和。
    在这里插入图片描述

  • 细化网络
    细化网络,利用变形目标项目中的真实细节来渲染粗糙的模糊区域。

    • 衣服变形
      根据形状匹配估计衣服变形的包办样条变换(TPS)。根据衣服前景提取的衣服蒙版 c c c和人身上的衣服蒙版 M M M计算他们之间的形状上下文TPS扭曲。变形的衣服图像符合人的姿势和身体形状信息,并充分保留目标的详细信息。这个想法类似于面部合成的2D/3D 纹理变形方法,其中2D面部关键点和3D姿势估计被用于变形。相比之下,由于缺少对服装项目的准确注释,使用基于形状上下文的变形。注意,用形状上下文匹配估计TPS的潜在替代方法是通过连体网络学习TPS参数。但是,对于非刚性衣服具有挑战性,根据经验,直接使用上下文形状匹配可以为虚拟试衣提供更好的变形结果。
      在这里插入图片描述

    • 学习融合
      将变形的衣服图像 c ′ c' c和合成的粗糙图像 I ′ I' I输入细化网络 G R G_R GR,输出1通道值为0-1的掩码图像 α \alpha α,指示从变形衣服图像 c ′ c' c和合成的粗糙图像 I ′ I' I的每一个利用了多少信息。VITON最终试穿结果 I ^ \hat I I^是变形衣服图像 c ′ c' c和合成的粗糙图像 I ′ I' I的组成。
      在这里插入图片描述
      由于视觉感知网络的低层更多的关注图像的详细像素级信息而不是图像内容,所以 I I I I ^ \hat I I^之间的较小位移(通常是由于不完全变形引起的)会导致低层特征图像特征之间较大失配(conv1和conv2),但是虚拟试衣系统中可以接受。因此,仅使用较高的层,鼓励模型忽略不完美变形的影响,因此它能够选择变形的目标服装图像并保留细节。
      进一步规范细节网络 G R G_R GR网络的输出 α \alpha α,使用L1范数和总变异范数TV。细节网络的损失计算为:
      在这里插入图片描述
      图5展示了方便在不同步骤中生成的结果。给定目标衣物和人物的表示形式,编码器-解码器会产生粗糙的结果,保留所保留的人的姿势,身体形状和面部,而目标衣物上的图形和纹理等细节则丢失。基于服装蒙版,细化阶段使用目标服装图像变形并预测构图蒙版,以确定应该在粗合成图像中替换哪些区域。因此,从目标服装图像“复制”的重要细节(第一示例中的材料,第二示例中的文本和第三示例中的图案)被“粘贴”到人的相应服装区域。
      在这里插入图片描述

实验

  • 数据集
    正面试图的模特图像和服装图像16253对,其中训练集14221对,测试2032对。测试过程中,人应该穿着与目标产品不同的服装。

  • 实施细节

    • 训练设置
      在这里插入图片描述

    • 编解码生成器
      在这里插入图片描述

    • 细化网络
      在这里插入图片描述

    • 运行
      在这里插入图片描述

  • 方法比较

    • GANs with Persion Representation(PRGAN)
    • Conditional Analogy GAN(CAGAN)
    • Cascaded Refinement Network(CRN)
    • Encoder-decoder generator
    • Non-parametric warped synthesis
  • 定性结果
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 定量结果

    • 接受分数(Inception Score ,IS)通常用来定量评估图像生成模型的合成质量。产生视觉上多样化且语义上有意义的图像的模型将具有更高的接受分数,并且该度量标准与人类对图像数据集的评估紧密相关。
    • 感知用户研究,反映目标衣服细节是自然转移的还是衣服的姿势和身体是否保留在合成图像中。
      在这里插入图片描述
      参考资料
      [paper]VITON: An Image-based Virtual Try-on Network(2018)
      [code]VITON

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63579.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10个最顶尖的专业服装设计软件(外国)

外文原文连接:点击打开链接 原文是2013年的英文文章,时间比较靠后,但是作为参考,也可以帮助我们了解一下计算机辅助设计在服装设计上的应用。 时尚服装设计软件。不管是专业的服装设计师,还是业余爱好者都可以轻松满…

Unity Metaverse(五)、Avatar数字人换装系统的实现方案

文章目录 🎈 前言🎈 如何将RPM中编辑的Avatar导入到Unity🎈 如何提取模型中的Mesh网格、Material材质、及Texture贴图🎈 如何提取RPM网页中的图片资源🎈 资源配置 🎈 前言 随着元宇宙概念的火热&#xff0c…

【互动多媒体】应用形式(二)体感换装/虚拟试衣

应用描述 体感换装/虚拟试衣就是让用户能够通过简单的操作,看到显示设备重的自己,虚拟地穿上了衣服、装备,以求品牌价值传递或是服饰的试穿体验。 体感换装放在第二项去说,主要是因为它一方面和互动拍照是相关联的,另…

豆瓣网电影信息的抓取

分析 通过上面两张图片可以发现 第一页url:https://movie.douban.com/top250?start0&filter 第二页url:https://movie.douban.com/top250?start25&filter 由此类推 第n页url https://movie.douban.com/top250?startn-1然后25&filter 代…

豆瓣电影简单评分模型-从收集数据到建模分析

思路: 从豆瓣上抓取数据【主要是评分,只是那个人数的百分比和最终评分,不过够用了】 一、收集数据 起始URL:https://movie.douban.com/j/new_search_subjects?sortU&range0,10&tags&start0 【注,爬取的对…

抓取豆瓣的电影排行榜TOP100

1 #!/usr/bin/env python2 # -*- coding:utf-8 -*-3 """4 一个简单的Python爬虫, 用于抓取豆瓣电影Top前100的电影的名称5 Anthor: Andrew Liu6 Version: 0.0.17 Date: 2014-12-048 Language: Python2.7.89 Editor: Sublime Text2 10 Operate: 具体操作请看READ…

爬取豆瓣电影Top250影片信息

爬取豆瓣电影Top250影片信息 查看影片的详细信息爬取过程需安装的包确定爬取地址发送请求头解析数据保存数据完整代码 查看影片的详细信息 进入豆瓣电影Top250,选择某一影片,右击,选择“检查元素”。 爬取过程 需安装的包 安装requests、…

豆瓣电影详情数据爬取

这次的爬虫我们来看url携带多个参数的页面爬取 打开豆瓣电影排行榜官网,这里我选择了喜剧类型,发现只要将鼠标下滚翻到该页面最底部,滚轮就会重新跳到中间,相当于浏览器又发送了请求,重新加载一个页面,对应…

豆瓣电影top250信息爬取

摘要 python的网络爬虫可以方便抓取网页的消息,本文以豆瓣网站为例,实现了python网络爬虫抓取豆瓣电影排行榜top250的过程,以及其中遇到的问题和解决过程。 1.引言 网络爬虫又称网络蜘蛛,或网络机器人。是一种按照一…

基于Python的豆瓣中文影评差评分析

资源下载地址:https://download.csdn.net/download/sheziqiong/86773473 资源下载地址:https://download.csdn.net/download/sheziqiong/86773473 1. NLP NLP(Natural Language Processing)是指自然语言处理,他的目的…

基于电影《少年的你》豆瓣影评数据的爬取与分析

目标网站:豆瓣电影 目标网址:https://movie.douban.com/subject/30166972/comments?statusP 目标数据:(1)评价 (2)日期 (3)评论 (4)评论点赞 …

爬取豆瓣电影前十页的好评一般差评

分析一波 爬取的地址:https://movie.douban.com/subject/26588308/comments 分别找出好评、一般、差评的评论: 通过地址栏分析,评论的类型和percent_type有关: 好评为h一般为m差评为l 但是我们想找的是在全部里面寻找好评一般和差…

豆瓣电影当中的电影详情数据

打开豆瓣电影,点击当中的排行榜,相应的类型选择为喜剧类型,当前的数据如果不使用数据解析来实现的话,会不会通过阿贾克斯请求来请求到json形式相应的电影数据呢? 当滚轮拖动到底部的时候,发现滚轮很快就变动…

针对豆瓣TOP前250电影做的简单的数据分析~

~~~~~~内容参考如下使用python抓取豆瓣top250电影数据进行分析 - 简书 https://www.jianshu.com/p/720b193a5c2b #导入库,三大常用数据分析库 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib#读取保存本地的excel文件…

电影评分数据集的分析

目录 数据集的获得使用工具项目流程 数据集的获得 进入该网址:https://grouplens.org/datasets/movielens/ 找到如下part: 点击ml-100k.zip进行数据集的下载 在本地解压后,将会看到如下内容: 但我们目前只需要三个文件&#…

爬取豆瓣电影的评论

好久没有爬虫了,今天突然叫爬豆瓣,有点懵了,不过看了看以前爬的,一葫芦画瓢整了一个这个。bs4和requests yyds! 分析一波 爬取的地址:https://movie.douban.com/subject/26588308/comments 每次翻页可以看到…

2020 豆瓣电影榜单出炉,直接在豆瓣上看电影吧

公众号后台回复“图书“,了解更多号主新书内容 作者:苏生不惑 来源:苏生不惑 一晃又到了年底,2020年就要结束了(你的小目标完成了吗),一年一度的豆瓣电影榜单也出炉了https://movie.douban.com/…

豆瓣Top250电影数据分析报告

我的其他数据分析报告:求职指南——数据分析职位解析 【Python3】Requests+正则表达式+multiprocessing爬虫并存入MySQL数据库 一、分析背景及目的 豆瓣对Top250电影的定义: 豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价,豆瓣根据每部影片看过的人数以及…

爬取豆瓣电影分类排行榜

确定目标网址:豆瓣电影排行榜 使用Google浏览器打开目标网址,右侧选择分类“传记”,按F12打开开发者工具,会打开如下界面:左侧是数据内容,右侧是网页源代码信息。注:由于该页面是动态的&#x…