生成对抗网络——CGAN（代码+理解）

生成对抗网络——CGAN（代码+理解）

news/2025/1/12 1:51:06/文章来源:https://blog.csdn.net/CXDNW/article/details/139845947

目录

一、CGAN模型介绍

二、CGAN训练流程

1. 初始化

2. 数据准备

3. 输出模型计算结果

4. 计算损失

5. 反向传播和优化

6. 迭代训练

三、CGAN实现

1. 模型结构

（1）生成器（Generator）

（2）判别器（Discriminator）

2. 代码

3. 训练结果

四、学习中产生的疑问，及文心一言回答

1. torch.cat((self.label_emb(labels.long()), noise), -1) 函数理解

2. Discriminator 模型疑问

一、CGAN模型介绍

CGAN（Conditional Generative Adversarial Network）模型是一种深度学习模型，属于生成对抗网络（GAN）的一种变体。它的基本思想是通过训练生成器和判别器两个网络，使生成器能够生成与给定条件相匹配的合成数据，而判别器则负责区分真实数据和生成数据。相比于GAN，它引入了条件信息（y），使得生成器可以生成与给定条件相匹配的合成数据，从而提高了生成数据的可控性和针对性。

二、CGAN训练流程

1. 初始化

首先，初始化生成器和判别器的网络参数（本例未初始化）。

2. 数据准备

准备真实数据集和对应的条件信息。条件信息可以是类别标签、文本描述等。

# labels 即真事条件信息
for i, (imgs, labels) in enumerate(dataloader):# gen_labels 即假条件信息
gen_labels = torch.randint(0, opt.n_classes, (batch_size,))

3. 输出模型计算结果

（1）对于生成器：从随机噪声分布中采样噪声向量，并与条件信息一起输入到生成器中，生成合成数据。

gen_imgs = generator(z, gen_labels)

（2）对于判别器：将真实数据及其条件信息和生成数据及其条件信息分别输入到判别器中，得到真实数据和生成数据的判别结果。

validity_fake = discriminator(gen_imgs.detach(), gen_labels)validity_real = discriminator(imgs, labels)

4. 计算损失

（1）生成器损失：鼓励判别器对生成样本及相应条件c的判断为“真实”，即最大化log(D(G(z|c), c))。

g_loss = adversarial_loss(validity, valid)

（2）判别器损失：激励判别器正确区分真实样本(X, c)与生成样本(G(z|c), c)。

d_loss = (d_real_loss + d_fake_loss) / 2

5. 反向传播和优化

使用梯度下降算法或其他优化算法更新生成器和判别器的网络参数，以最小化各自的损失函数。

6. 迭代训练

重复步骤 3至 5，直到达到预设的训练轮数或满足其他停止条件。

三、CGAN实现

1. 模型结构

（1）生成器（Generator）

（2）判别器（Discriminator）

2. 代码

import torch
import torch.nn as nn
import torchvision.transforms as transforms
from torchvision.utils import save_image
from torch.utils.data import DataLoader
from torchvision import datasets
import matplotlib.pyplot as plt
import argparse
import numpy as npparser = argparse.ArgumentParser()
parser.add_argument("--n_epochs", type=int, default=50, help="number of epochs of training")
parser.add_argument("--batch_size", type=int, default=64, help="size of the batches")
parser.add_argument("--lr", type=float, default=0.0002, help="adam: learning rate")
parser.add_argument("--b1", type=float, default=0.5, help="adam: decay of first order momentum of gradient")
parser.add_argument("--b2", type=float, default=0.999, help="adam: decay of first order momentum of gradient")
parser.add_argument("--latent_dim", type=int, default=100, help="dimensionality of the latent space")
parser.add_argument("--n_classes", type=int, default=10, help="number of classes for dataset")
parser.add_argument("--img_size", type=int, default=32, help="size of each image dimension")
parser.add_argument("--channels", type=int, default=1, help="number of image channels")
parser.add_argument("--sample_interval", type=int, default=400, help="interval between image sampling")
opt = parser.parse_args()
print(opt)dataloader = torch.utils.data.DataLoader(datasets.MNIST("./others/",train=False,download=False,transform=transforms.Compose([transforms.Resize(opt.img_size), transforms.ToTensor(), transforms.Normalize([0.5], [0.5])]),),batch_size=opt.batch_size,shuffle=True,
)img_shape = (opt.channels, opt.img_size, opt.img_size)class Generator(nn.Module):def __init__(self):super(Generator, self).__init__()self.label_emb = nn.Embedding(opt.n_classes, opt.n_classes)def block(in_feat, out_feat, normalize=True):layers = [nn.Linear(in_feat, out_feat)]if normalize:layers.append(nn.BatchNorm1d(out_feat, 0.8))layers.append(nn.LeakyReLU(0.2, inplace=True))return layersself.model = nn.Sequential(*block(opt.latent_dim + opt.n_classes, 128, normalize=False),*block(128, 256),*block(256, 512),*block(512, 1024),nn.Linear(1024, int(np.prod(img_shape))),   # np.prod 计算所有元素的乘积nn.Tanh())def forward(self, noise, labels):# 噪声样本与标签的拼接，-1 表示最后一个维度gen_input = torch.cat((self.label_emb(labels.long()), noise), -1)img = self.model(gen_input)img = img.view(img.size(0), *img_shape)return imgclass Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.label_embedding = nn.Embedding(opt.n_classes, opt.n_classes)self.model = nn.Sequential(nn.Linear(opt.n_classes + int(np.prod(img_shape)), 512),nn.LeakyReLU(0.2, inplace=True),nn.Linear(512, 512),nn.Dropout(0.4),    # 将输入单元的一部分（本例中为40%）设置为0，有助于 防止过拟合nn.LeakyReLU(0.2, inplace=True),nn.Linear(512, 512),nn.Dropout(0.4),nn.LeakyReLU(0.2, inplace=True),nn.Linear(512, 1),)def forward(self, img, labels):d_in = torch.cat((img.view(img.size(0), -1), self.label_embedding(labels.long())), -1)validity = self.model(d_in)return validity# 实例化模型
generator = Generator()
discriminator = Discriminator()# 优化器
optimizer_G = torch.optim.Adam(generator.parameters(), lr=opt.lr, betas=(opt.b1, opt.b2))
optimizer_D = torch.optim.Adam(discriminator.parameters(), lr=opt.lr, betas=(opt.b1, opt.b2))# 均方误差
adversarial_loss = torch.nn.MSELoss()def sample_image(n_row, batches_done):"""Saves a grid of generated digits ranging from 0 to n_classes"""# Sample noisez = torch.randn(n_row ** 2, opt.latent_dim)# Get labels ranging from 0 to n_classes for n rowslabels = torch.Tensor(np.array([num for _ in range(n_row) for num in range(n_row)]))gen_imgs = generator(z, labels)save_image(gen_imgs.data, "./others/images/CGAN/%d.png" % batches_done, nrow=n_row, normalize=True)def gen_img_plot(model, text_input, labels):prediction = np.squeeze(model(text_input, labels).detach().cpu().numpy()[:16])plt.figure(figsize=(4, 4))for i in range(16):plt.subplot(4, 4, i + 1)plt.imshow((prediction[i] + 1) / 2)plt.axis('off')plt.show()# ----------
#  Training
# ----------
D_loss_ = []  # 记录训练过程中判别器的损失
G_loss_ = []  # 记录训练过程中生成器的损失
for epoch in range(opt.n_epochs):# 初始化损失值D_epoch_loss = 0G_epoch_loss = 0count = len(dataloader)  # 返回批次数for i, (imgs, labels) in enumerate(dataloader):batch_size = imgs.shape[0]valid = torch.ones(batch_size, 1)fake = torch.zeros(batch_size, 1)# 生成随机噪声 和 标签z = torch.randn(batch_size, opt.latent_dim)gen_labels = torch.randint(0, opt.n_classes, (batch_size,))# ---------------------#  Train Discriminator# ---------------------optimizer_D.zero_grad()gen_imgs = generator(z, gen_labels)validity_fake = discriminator(gen_imgs.detach(), gen_labels)d_fake_loss = adversarial_loss(validity_fake, fake)validity_real = discriminator(imgs, labels)d_real_loss = adversarial_loss(validity_real, valid)d_loss = (d_real_loss + d_fake_loss) / 2d_loss.backward()optimizer_D.step()# -----------------#  Train Generator# -----------------optimizer_G.zero_grad()validity = discriminator(gen_imgs, gen_labels)g_loss = adversarial_loss(validity, valid)g_loss.backward()optimizer_G.step()print("[Epoch %d/%d] [Batch %d/%d] [D loss: %f] [G loss: %f]"% (epoch, opt.n_epochs, i, len(dataloader), d_loss.item(), g_loss.item()))# batches_done = epoch * len(dataloader) + i# if batches_done % opt.sample_interval == 0:#     sample_image(n_row=10, batches_done=batches_done)with torch.no_grad():D_epoch_loss += d_lossG_epoch_loss += g_loss# 求平均损失with torch.no_grad():D_epoch_loss /= countG_epoch_loss /= countD_loss_.append(D_epoch_loss.item())G_loss_.append(G_epoch_loss.item())text_input = torch.randn(opt.batch_size, opt.latent_dim)text_labels = torch.randint(0, opt.n_classes, (opt.batch_size,))gen_img_plot(generator, text_input, text_labels)x = [epoch + 1 for epoch in range(opt.n_epochs)]
plt.figure()
plt.plot(x, G_loss_, 'r')
plt.plot(x, D_loss_, 'b')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['G_loss', 'D_loss'])
plt.show()

3. 训练结果

四、学习中产生的疑问，及文心一言回答

1. torch.cat((self.label_emb(labels.long()), noise), -1) 函数理解

2. Discriminator 模型疑问

后续更新 GAN 的其他模型结构。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/355256.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【深度学习】GELU激活函数是什么？

【深度学习】GELU激活函数是什么？

torch.nn.GELU 模块在 PyTorch 中实现了高斯误差线性单元（GELU）激活函数。GELU 被用于许多深度学习模型中，包括Transformer，因为它相比传统的 ReLU（整流线性单元）函数能够更好地近似神经元的真实激活行为。…

阅读更多...

如何使用ChatGPT辅助设计工作

如何使用ChatGPT辅助设计工作

文章目录设计师如何使用ChatGPT提升工作效率？25个案例告诉你！什么是 prompt？咨询信息型 prompt vs 执行任务 prompt编写出色 prompt 的基本思路撰写 prompt 的案例和技巧1、将 ChatGPT 视作专业人士2、使用 ChatGPT 创建表单3、使用 ChatGPT…

阅读更多...

JDBC(简介、入门与IDEA中导入MySQL的驱动)

JDBC(简介、入门与IDEA中导入MySQL的驱动)

（建议学完 MySQL 的基础部分） JDBC——简而言之：用 Java 语言操作数据库。 Java DataBase Connectivity（Java 语言连接数据库） 目录一、引言 （1）基本介绍 （2）JDBC 简…

阅读更多...

2024华为OD机试真题- 计算三叉搜索树的高度-(C++/Python)-C卷D卷-100分

2024华为OD机试真题- 计算三叉搜索树的高度-(C++/Python)-C卷D卷-100分

2024华为OD机试题库-(C卷+D卷)-(JAVA、Python、C++) 题目描述定义构造三叉搜索树规则如下：每个节点都存有一个数，当插入一个新的数时，从根节点向下寻找，直到找到一个合适的空节点插入。查找的规则是： 1.如果数小于节点的数减去500，则将数插入节点的左子树 2.如果数大于…

阅读更多...

【配置】Notion自动化备份到github方案

【配置】Notion自动化备份到github方案

步骤打开notion网页，获取到需要的值 token_v2 找到请求getSpaces的 Cookie 值 token_v2 space_id 找到请求getSpaces的响应结果space,如下图： file_token 找个页面点击导出，之后拿到这个配置项注意：配置项会过期&#xff0c…

阅读更多...

低版本火狐浏览器报错：class is a reserved identifier

低版本火狐浏览器报错：class is a reserved identifier

低版本火狐浏览器报错：class is a reserved identifier 原因：react-dnd，dnd-core 等node包的相关依赖有过更新，使得在低版本火狐浏览器中不支持 class 解决方法：在使用webpack打包构建时，编译排除node_modu…

阅读更多...

Unity OpenCVForUnity 安装和第一个案例详解＜一＞

Unity OpenCVForUnity 安装和第一个案例详解＜一＞

目录一、资源简介二、安装使用 1.下载案例Demo 2.移动StreamingAssets文件夹 3.添加场景三、今日案例 1.案例Texture2DToMat Example 2.什么是Mat？ 3.如何把Texture2D变成Mat （1）.初始化Mat （2）.Cv_…

阅读更多...

【React Native】measureInWindow在安卓上无法正确获取View在屏幕上的布局信息

【React Native】measureInWindow在安卓上无法正确获取View在屏幕上的布局信息

问题描述： 在React Native中，我们可以使用measureInWindow的方式去获取一个View在屏幕中的位置信息： 下面这个Demo中，我们写了一个页面HomePage和一个列表项组件ListItemA，我们期望每过5s监测一次列表中每一项在屏幕中…

阅读更多...

RabbitMQ（六）仲裁队列、流式队列、异地容灾（联邦队列Federation Queue）

RabbitMQ（六）仲裁队列、流式队列、异地容灾（联邦队列Federation Queue）

文章目录仲裁队列1、创建交换机2、创建仲裁队列3、验证主节点宕机不影响消息发送和接收流式队列（不推荐，Kafka主场）概念异地容灾一、Federation插件概述二、Federation交换机1、总体说明2、准备工作3、启用联邦插件4、添加上游连接端点5、…

阅读更多...

【深度学习】TCN，An Empirical Evaluation of Generic Convolutional【二】

【深度学习】TCN，An Empirical Evaluation of Generic Convolutional【二】

文章目录膨胀卷积什么是膨胀卷积膨胀卷积公式PyTorch代码从零开始手动实现一个1D膨胀卷积，不使用PyTorch的nn.Conv1d1. 基本概念2. 手动实现1D膨胀卷积 TCN结构如何使用TCN源码说明1. Chomp1d 类2. TemporalBlock 类3. TemporalConvNet 类使用方法膨胀卷积什么…

阅读更多...

DVWA - Brute Force

DVWA - Brute Force

DVWA - Brute Force 等级：low 直接上bp弱口令爆破，设置变量，攻击类型最后一个，payload为用户名、密码简单列表直接run，长度排序下，不一样的就是正确的用户名和密码另解： 看一下…

阅读更多...

【SpringBoot + Vue 尚庭公寓实战】公寓杂费接口实现（八）

【SpringBoot + Vue 尚庭公寓实战】公寓杂费接口实现（八）

【SpringBoot Vue 尚庭公寓实战】公寓杂费接口实现（八） 文章目录【SpringBoot Vue 尚庭公寓实战】公寓杂费接口实现（八）1、公寓杂费业务介绍2、公寓杂费逻辑模型介绍3、接口实现3.1、保存或更新杂费值3.2、保存或更新杂费名称3…

阅读更多...

Android【SDK】 SDK是如何开发的，怎么打包aar包

Android【SDK】 SDK是如何开发的，怎么打包aar包

文章目录一、Android SDK开发示例工程二、Android SDK的开发三、打包aar包四、Android SDK的使用一、Android SDK开发示例工程本教程工程Git链接：https://gitcode.com/xiaohuihui1400/AndroidSdkExample/overview 二、Android SDK的开发新建项目，…

阅读更多...

Photoshop中图像美化工具的应用

Photoshop中图像美化工具的应用

Photoshop中图像美化工具的应用 Photoshop中的裁剪工具Photoshop中的修饰工具模糊工具锐化工具涂抹工具 Photoshop中的颜色调整工具减淡工具加深工具海绵工具 Photoshop中的修复工具仿制图章工具污点修复画笔工具修复画笔工具修补工具内容感知移动工具红眼工具 Photoshop中的裁…

阅读更多...

Redis持久化主从哨兵分片集群

Redis持久化主从哨兵分片集群

文章目录 1. 单点Redis的问题数据丢失问题并发能力问题故障恢复问题存储能力问题 2. Redis持久化 -> 数据丢失问题RDB持久化linux单机安装Redis步骤RDB持久化与恢复示例RDB机制RDB配置示例RDB的fork原理总结 AOF持久化AOF配置示例AOF文件重写RDB与AOF对比 3. Redis主从 ->…

阅读更多...

智能制造uwb高精度定位系统模块，飞睿智能3厘米定位测距芯片，无人机高速传输

智能制造uwb高精度定位系统模块，飞睿智能3厘米定位测距芯片，无人机高速传输

在科技日新月异的今天，定位技术已经渗透到我们生活的方方面面。从手机导航到自动驾驶，再到无人机定位，都离不开精准的定位系统。然而，随着应用场景的不断拓展，传统的定位技术如GPS、WiFi定位等，因其定位精度…

阅读更多...

小摩法兴纷纷转多，看涨港股的时机来了吗？

小摩法兴纷纷转多，看涨港股的时机来了吗？

恒生指数今日高开一度上涨89点报18520点，创近两周高。之后持续震荡下行；恒指临近中午跌幅扩大，恒生科技指数一度跌近1.5%。截止收盘，恒生指数跌0.52%，盘面上，石油、煤炭、环保、建筑节能等板块涨幅居前&a…

阅读更多...

VScode中js关闭烦人的ts检查

VScode中js关闭烦人的ts检查

类似如下的代码在vscode 会报错，我们可以在前面添加忽略检查或者错误，如下： 但是！！！这太不优雅了！！！，js代码命名没有问题，错在ts上面，…

阅读更多...

112、路径总和

112、路径总和

给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在根节点到叶子节点的路径，这条路径上所有节点值相加等于目标和 targetSum 。如果存在，返回 true ；否则，返回 false 。叶子节点是指没有子节点…

阅读更多...

简单且高效的水域物探轨迹坐标转换程序

简单且高效的水域物探轨迹坐标转换程序

简单且高效的水域物探轨迹坐标转换程序前言水上测线的高精度定位是水域物探的难题，水域磁法、水域地震实施时常采用船舶拖拽传感器进行走航式观测，GPS仪器放在船舶上测量，造成船舶位置与传感器位置存在偏差，后期资料整理需要校…

阅读更多...

最新文章

推荐文章