使用PyTorch搭建VGG模型进行图像风格迁移实战(附源码和数据集)

需要源码和图片集请点赞关注收藏后评论区留言或者私信~~~

一、VGG模型

VGG模型是科学家们提出的图像分类模型,这一模型采用了简单粗暴的堆砌3×3卷积层的方式构建模型,并花费大量的时间逐层训练,最终在ImageNet图像分类比赛中获得了亚军,这一模型的优点是结构简单,容易理解,便于利用到其他任务当中

VGG-19网络的卷积部分由5哥卷积块构成,每个卷积块中有多个卷积层,结尾处有一个池化层 结构如下图所示

 二、图像风格迁移介绍

图像风格迁移是指将一张风格图的风格与另一张内容图的内容想结合并生成新的图像,利用预训练的VGG网络提取图像特征,并基于图像特征组合出了两种特征度量,一种用于表示图像的内容,另一种用于表示图像的风格,它们将这两种特征度量加权组合,通过最优化的方式生成新的图像,使新的图像同时具有一幅图像的风格和另一幅图像的内容 

风格图如下 是梵高著名的画作《星空》

 内容图如下 选自意大利的一个街道(可以看出是个阳光晴朗的日子,非常的暖色调)

 让我们来看看进行图像风格迁移,即把梵高的风格加到这幅图的内容上会是什么效果!

哈哈 显示是有一点抽象和模糊的感觉,但这也正是星空的风格!

 

三、内容损失函数 

内容损失函数用于衡量两幅图像之间的内容差异大小,通过两幅图片由VGG网络某一卷积层提取的特征图来表示

四、风格损失函数

风格损失函数用于衡量两幅图像之间的风格差异大小,首先需要通过计算特征图的Gram矩阵得到图像风格的数学表示

五、主程序代码的实现

程序分为以下几部分

1:图像预处理  接收一个PIL图片,改变图片大小,转换为张量,进行标准化然后乘以255

2:参数定义

3:模型初始化  

4:运行主函数

5:利用VGG网络建立损失函数

6:优化

7:可视化

最后  部分源码如下

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
from PIL import Imagedef g = input.size()features = input.view(a * b, c * d)G = torch.mm(features, features.t())return Gclass ContentLoss(nn.Module):def __init__(self, target):super(ContentLoss, self).__init__()self.target = target.detach()def forward(self, input):self.loss = torch.sum((input-self.target) ** 2) / 2.0return inputclass Styledef __init__(self, target_feature):super(StyleLoss, self).__init__()self.target = gram_matrix(target_feature).detach()def forward(self, input):a, b, c, d = input.size()G = gram_matrix(input)self.loss = torch.sum((G-self.target) ** 2) / (4.0 * b * b * c * d)return inputclass ImagCder:def __init__(self, image_size, device):self.device = deviceself.preproc = transforms.Compose([transforms.Resize(image_size),  # 改变图像大小transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406],  # 标准化std=[1, 1, 1]),transforms.Lambda(lambda x: x.mul_(255))])self.postproc = transforms.Compose([transforms.Lambda(lambda x: x.mul_(1./255)),transforms.Normalize(mean=[-0.485, -0.456, -0.406], std=[1,1,1])])self.to_image = transforms.ToPILImage()def encode(self, image_path):image = Image.open(image_path)image = self.preproc(image)image = image.unsqueeze(0)return image.to(self.device, torch.float)def decode(self, image):image = image.cpu().clone()image = image.squeeze()image = self.postproc(image)image = image.clamp(0, 1)return self.to_image(image)content_layers = ['conv_4_2'] # 内容损失函数使用的卷积层
style_layers = ['conv_1_1', 'conv2_1', 'conv_3_1', 'conv_4_1', 'conv5_1'] # 风格损失函数使用的卷积层
content_weights = [1] # 内容损失函数的权重
style_weights = [1e3, 1e3, 1e3, 1e3, 1e3] # 风格损失函数的权重
num_steps=200 # 最优化的步数class Mo:def __init__(self, device, image_size):cnn = torchvision.models.vgg19(weights=True).features.to(device).eval()self.cnn = deepcopy(cnn) # 获取预训练的VGG19卷积神经网络self.device = deviceself.content_losses = []self.style_losses = []self.image_proc = ImageCoder(image_size, device)def run(self, content_image_path, style_image_path):content_image = self.image_proc.encode(content_image_path)style_image = self.image_proc.encode(style_image_path)self._build(content_image, style_image) # 建立损失函数output_image = self._transfer(content_image) # 进行最优化return self.image_proc.decode(output_image)def _bd(self, content_image, style_image):self.model = nn.Sequential()block_idx = 1conv_idx = 1# 逐层遍历VGG19,取用需要的卷积层for layer in self.cnn.children():# 识别该层类型并进行编号命名if= 'conv_{}_{}'.format(block_idx, conv_idx)conv_idx += 1elif isinstance(layer, nn.ReLU):name = 'relu_{}_{}'.format(block_idx, conv_idx)layer = nn.ReLU(inplace=False)elif isinstance(layer, nn.MaxPool2d):name = 'pool_{}'.format(block_idx)block_idx += 1conv_idx = 1elif isinstance(layer, nn.BatchNorm2d):name = 'bn_{}'.format(block_idx)else:raise Exception("invalid layer")self.model.add_module(name, layer)# 添加内容损失函数if name in content_layers:target = self.model(content_image).detach()content_loss = ContentLoss(target)self.model.add_module("content_loss_{}_{}".format(block_idx, conv_idx), content_loss)self.content_losses.append(content_loss)# 添加风格损失函数if name in style_layers:target_feature = self.model(style_image).detach()style_l StyleLoss(target_feature)self.model.add_module("style_loss_{}_{}".format(block_idx, conv_idx), style_loss)self.style_losses.append(style_loss)# 留下有用的部分i = 0for i in range(len(self.model) - 1, -1, -1):if isinstance(self.model[i], ContentLoss) or isinstance(self.model[i], StyleLoss):breakself.model = self.model[:(i + 1)]def _transfer(self, content_image):output_image = content_image.clone()random_image = torch.randn(content_image.data.size(), device=self.device)output_image = 0.4 * output_image + 0.6 * random_imageoptimizer = torch.optim.LBFGS([output_image.requires_grad_()])print('Optimizing..')run = [0]while run[0] <= num_steps:def closure():optimizer.zero_grad()self.model(output_image)style_score = 0content_score = 0for sl, sw in zip(self.style_losses, style_weights):style_score += sl.loss * swfor cl, cw in zip(self.content_losses, content_weights):content_score += cl.loss * cwloss = style_score + content_scoreloss.backward()run[0] += 1if run[0] % 50 == 0:print("iteration {}: Loss: {:4f} Style Loss: {:4f} Content Loss: {:4f}".format(run, loss.item(), style_score.item(), content_score.item()))return lossoptimizer.step(closure)return output_imagedevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")
image_size = 256
model = Model(device, image_size)style_image_path = 
content_image_path = 
out_image = del.run(content_image_path, style_image_path)
plt.imshow(out_image)
plt.show()

 创作不易 觉得有帮助请点赞关注收藏~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42784.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pytorch 使用GAN实现二次元人物头像生成 保姆级教程(数据集+实现代码+数学原理)

Pytorch 使用DCGAN实现二次元人物头像生成&#xff08;实现代码公式推导&#xff09; GAN介绍 算法主体 推导证明(之后将补全完整过程) 随机梯度下降训练D,G DCGAN介绍及相关原理 Pytorch实现二次元人物头像生成 如何使用GAN生成二次元头像 数据准备 代码实现 判别、生成模型…

GAN动漫人像生成实现(附带源码)

基于生成对抗网络的人像转卡通像实现 写在前面先来看看效果吧大家最想要的项目原理简介(2021/11/16更)本项目C和Pytorch的OnnxRuntime使用方法(2022/1/3更)APP的代码(2022/4/4更)双城之战风格迁移数据集写在后面 写在前面 天气晴朗万物可爱&#xff0c;希望通过这篇文章对大家…

NVIDIA的StyleGAN、StyleGAN2、StyleGAN3系列论文解读,梳理基于风格的生成器架构

通俗来讲就是&#xff0c;张三造假币(Generator生成器)&#xff0c;然后用验钞机去验证真假(Discriminator辨别器)&#xff0c;如果是假的就继续提高造假技术&#xff0c;直到验钞机检验不出来为止&#xff0c;也就是说一个造假一个验假(验钞机也需升级)&#xff0c;两者互相学…

AI绘画突然爆火?快速体验二次元画师NovelAI(diffusion)

目录 0 写在前面1 diffusion vs GAN2 NovelAI3 AI绘画环境搭建4 体验AI创作 0 写在前面 机器学习强基计划聚焦深度和广度&#xff0c;加深对机器学习模型的理解与应用。“深”在详细推导算法模型背后的数学原理&#xff1b;“广”在分析多个机器学习模型&#xff1a;决策树、支…

女神青涩时纤毫毕现,腾讯 AI 模型 GFPGAN 火上 GitHub 热榜第一,Demo 在线可玩

来源&#xff1a;量子位 作者&#xff1a;明敏 包浆老图立刻清晰到头发丝是一种怎样的体验&#xff1f;看这明亮的眼眸、清晰的发丝&#xff0c;原本模糊的人像立刻添了几分灵动&#xff08;这就是用 AI 修复的高圆圆童年照&#xff09;。 甚至时间更久远的历史名人照片也能搞…

游戏原画师

常用软件&#xff1a; 1. Photoshop著名的图形处理软件&#xff0c;也能绘画&#xff0c;适合绘画功底一般的初学者。 2. Painter很多专业人士都很爱用的一款软件。笔刷很多&#xff0c;适合有一定美术功底的人。 3. Sai画漫画的话&#xff0c;sai就比较好用了&#xff0c;对…

chatgpt赋能python:Python与前端连接:使用Python的Web框架构建后端API

Python与前端连接&#xff1a;使用Python的Web框架构建后端API Python是一种强大的编程语言&#xff0c;越来越受到开发者的欢迎。但是&#xff0c;对于Web开发&#xff0c;Python并不是一种前端语言。那么&#xff0c;如何将Python的后端与前端连接起来&#xff1f;本文将介绍…

Vue前端Flask后端

项目构建 本科期间因为学过相关课程&#xff0c;已经配好了相关的环境&#xff0c;所以直接进行了版本确认。 一、Vue2 1. 前端环境确认 Vue&#xff1a;3.2.47 | 踩过的坑使用1的时候一直为empty&#xff0c;加 -g仍是empty 在项目下1&#xff0c;非项目下要用2 1$ npm in…

chatgpt赋能python:Python前端与后端的数据交互

#Python前端与后端的数据交互 在现代Web应用程序中&#xff0c;前端与后端的数据交互至关重要。前端可能需要向后端发出请求来获取数据或触发某些操作&#xff0c;而后端则需要向前端返回数据或处理请求并采取适当的措施。Python是一种流行的编程语言&#xff0c;用于开发Web应…

上货避坑指南 私域上货选品工具 无货源选品上货 采集商品详情数据API分享 详情图 sku信息

电商开店之后&#xff0c;第一件事就是上货了&#xff0c;上货其实也是有技巧的。 上传商品时我们一定要注意细节&#xff0c;不可忽略一些重要细节&#xff0c;所以商家们在上传商品前&#xff0c;不可忽略是否预售、标题、主图、详情页、保证金、上架时间这几个细节。 详情…

批发供应系统批发订货发货管理系统开发功能

​ 古人说的一点都没错&#xff0c;不同行业的贸易企业看起来都是在卖货&#xff0c;但业务流程的确有很大的不同&#xff0c;而在疫情和现动态的双重打击下&#xff0c;传统商贸企业迫切需要面临转型。 1&#xff09;在哪里转弯。怎么转。 专业点说是转型&#xff0c…

微商助理 防伪防窜货溯源代理授权查询系统源码

源码介绍 微商助理防伪防窜货溯源代理授权查询系统源码支持二维码扫码查询 程序架构&#xff1a;PHPMysql PHP版本要求PHP5.4以上&#xff08;推荐PHP5.4&#xff09; 把源码文件上传到网站根目录&#xff0c;此套系统功能较多&#xff0c;不推荐二级目录安装 安装方法一…

2021-07-10

基础研究方面有中科院、中科大、清华、南大、山西大学、北邮、上海交大等支持&#xff0c;设备研发由国盾量子、问天量子、科易理想量子、济南量子技术研究院、九州量子、中兴、华为等支持&#xff0c;量子网络、中创为量子、神州量子、亨通问天量子、神州信息等提供建设运维&a…

OpenCV:鼠标画直线并显示坐标

【天问】存于咸阳宫内&#xff0c;为秦始皇的配剑。当一个人成为天下至尊&#xff0c;权利已是他手中最锋利的宝剑&#xff0c;所谓“天问”不正是一种举剑问天、舍我其谁的王者气势的体现吗? 【鼠标操作】 1、回调函数 CV_EXPORTS void setMouseCallback(const string&…

神七问天 书中国航天史诗

2008年9月25日晚上9时10分&#xff0c;“神七”腾空而起&#xff0c;不到半个小时&#xff0c;北京航天飞控中心宣布“神七”发射成功。执行神舟七号载人航天飞行任务的航天员翟志刚、刘伯明、景海鹏出征前&#xff0c;向祖国和人民致以庄严的军礼。 “神舟七号”终于揭开了神秘…

C++ 组合模式

作者: 一去、二三里 个人微信号: iwaleon 微信公众号: 高效程序员 组合模式(Composite Pattern)组合多个对象形成树形结构以表示具有“整体-部分”关系的层次结构。组合模式对单个对象(即:叶子构件)和组合对象(即:容器构件)的使用具有一致性,组合模式又被称为“整体…

分享打造爆款书的方法,同时聊聊出版图书中的哪些事和哪些坑

想想若干年前&#xff0c;我通过一位非常热情的图书公司的编辑&#xff0c;出版了我的第一本计算机图书&#xff0c;从此后一发不可收拾&#xff0c;最近2年出版了2本&#xff0c;有1本已经完稿&#xff0c;还有两本尚在写作途中。确实&#xff0c;出版出一件名利双收的事&…

腾讯面经来了

前言 今天给大家分享自己投递腾讯上海IEG后台开发职位的面试经历分享。 腾讯感觉整个流程比较慢&#xff0c;这周才刚刚走完HR面&#xff0c;一二两轮技术面在同一周&#xff0c;三面隔一周&#xff0c;HR面又隔一周&#xff0c;但是每轮面试官的态度还是非常棒的&#xff0c;面…

AliCoCo:阿里电商知识图谱核心技术揭秘 Alibaba E-commerce Cognitive Concept Net

电商技术进入认知智能时代&#xff0c;在搜索推荐等电商核心业务场景上使用电商认知图谱&#xff0c;将给亿万用户带来更加智能的购物体验。 本文介绍 AliCoCo 的背景、定义、底层设计、构建过程中的一些算法问题&#xff0c;以及在电商搜索和推荐上的广泛应用&#xff0c;并分…