Theory behind GAN

Theory behind GAN

news/2025/1/10 2:30:06/文章来源:https://blog.csdn.net/qq_51426525/article/details/134456002

假如要生成一些人脸图，实际上就是想要找到一个分布，从这个分布内sample出来的图片像是人脸，分布之外生成的就不像人脸。而GAN要做的就是找到这个distribution。

在GAN之前用的是Maximum Likelihood Estimation。

Maximum Likelihood Estimation(最大似然估计)

最大似然估计的思想是，假设数据的分布是 Pdata(x) ，定义一个分布为PG(x;θ) ，求得一组参数θ，使得PG(x;θ) 与Pdata(x) 越接近越好。具体步骤如下：

从Pdata(x) 中sample出一些样本；
对于sample出来的样本，可以计算出它们的likelihood；
计算总分likelihood L，并找到一组参数θ* 使得L最大。

MLE=Minimize KL Divergence

最大似然估计就相当于最小化的KL散度。

如果使用最大似然估计，采用高斯混合模型定义PG ,生成的图片会非常模糊，现在使用generator产生PG 。优化的目标就是使PG 和Pdata 越接近越好，即使得G* 越小越好，但是不知道PG 和Pdata 的公式。

虽然不知道PG 和Pdata 的公式，但是可以从这两个分布中做sample。可以用Discriminator来衡量PG 和Pdata 的Divergence。训练出来的maxV(G,D) 就相当于JS divergence。

证明过程

要求V(G,D)的最大值，就是求的最大值。

因为PG 和Pdata 都是固定的，所以设为常数，然后通过求导求出最大值。

将求出的D* 回带入V(G,D)，然后化简。

Generator 的训练目标就是，找到一个G* 去最小化PG 和Pdata 之间的差异，即，由于不知道PG 和Pdata 的具体公式，所以无法直接计算divergence。于是通过一个discriminator来计算两个分布之间的差异，。所以最终优化目标为。

假设已经把Generator固定住了，红点表示固定住G后的，也就是PG 和Pdata 的差异。现在的目标是最小化这个差异，所以下图的三个网络中，G3 是最优秀的。

具体的做法就是：

首先固定G，找到一个能够使V最大的D；
然后固定D，找到能够使这个最大D情况下V最小的G。不停的迭代。

虽然L(G)中有求最大值，但是它依然可以做微分，即分段求微分。

具体算法如下：

给定一个G0 ；
求解出使得V(D,G) 最大的D0* ；
利用梯度下降求解出G1 ;
利用G1 求解出使得V(D,G) 最大的D1* ，不断迭代。

其实在训练过程中不是真正的minimize JS散度，因为G在训练时变化时，V(D,G) 也会发生改变；此时由于D固定，所以JS散度会变得不再是此刻G下的JS散度了。所以要保证V(D,G0) 和V(D,G1) 很像，即G的参数变化很小。

Algorithm for GAN（Review）

首先训练D，多训练几次直至收敛；之后训练G：其中第一项是与生成器无关的，由于G不能训练太多，否则会导致D无法evaluate JS，所以update一次就好。

In practice

理论上V是要取期望值，但是实际上是不可能的，只能用样本的均值进行估计。

论文原文在实作的时候把log⁡(1-D(x)) 换成-log⁡(D(x)) ，蓝色曲线刚开始的值很大，适合做梯度下降。其实后来实验证明两种结果都差不多。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/197593.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

CI/CD --git版本控制系统

CI/CD --git版本控制系统

目录一、git简介二、git使用三、github远程代码仓库一、git简介 Git特点： 速度简单的设计对非线性开发模式的强力支持（允许成千上万个并行开发的分支）完全分布式有能力高效管理类似 Linux 内核一样的超大规模项目（速度和数…

阅读更多...

4.Pod详解【四】

4.Pod详解【四】

文章目录 4. Pod详解4.1 Pod介绍4.1.1 Pod结构4.1.2 Pod定义 4.2 Pod配置4.2.1 基本配置4.2.2 镜像拉取4.2.3 启动命令4.2.4 环境变量4.2.5 端口设置4.2.6 资源配额 4.3 Pod生命周期4.3.1 创建和终止4.3.2 初始化容器4.3.3 钩子函数4.3.4 容器探测4.3.5 重启策略 4.4 Pod调度4.…

阅读更多...

Sectigo证书——全球SSL证书第一品牌

随着互联网技术的发展和网络安全意识的提升，SSL证书已经成为确保网络数据传输安全的重要工具。而在众多SSL证书品牌中，Sectigo无疑是其中的佼佼者，被誉为“全球证书第一品牌”。 Sectigo是一个有着超过二十年行业经验的老牌认证机构&#xff…

阅读更多...

Add the installation prefix of “Qt5“ to CMAKE_PREFIX_PATH or set “Qt5_DIR“解决

Add the installation prefix of “Qt5“ to CMAKE_PREFIX_PATH or set “Qt5_DIR“解决

修改为Qt5安装目录

阅读更多...

卷积神经网络（CNN）衣服图像分类的实现

卷积神经网络（CNN）衣服图像分类的实现

文章目录前期工作1. 设置GPU（如果使用的是CPU可以忽略这步）我的环境： 2. 导入数据3.归一化4.调整图片格式5. 可视化二、构建CNN网络模型三、编译模型四、训练模型五、预测六、模型评估前期工作 1. 设置GPU（如果使用的是CPU可以…

阅读更多...

图像分类(六) 全面解读复现MobileNetV1-V3

图像分类(六) 全面解读复现MobileNetV1-V3

MobileNetV1 前言 MobileNetV1网络是谷歌团队在2017年提出的，专注于移动端和嵌入设备的轻量级CNN网络，相比于传统的神经网络，在准确率小幅度降低的前提下大大减少模型的参数与运算量。相比于VGG16准确率减少0.9%，但模型的参数只…

阅读更多...

Swin Transformer

Swin Transformer

Swin Transformer 简介下采样的层级设计，能够逐渐增大感受野。采用window进行注意力计算，极大降低了内存消耗，避免了整张图像尺寸大小的qkv矩阵滑窗操作包括不重叠的 local window，和重叠的 cross-window。不重叠的local window…

阅读更多...

leetcode34.排序数组中查找元素第一个和最后一个位置两种解题方法（超详细）

34. 在排序数组中查找元素的第一个和最后一个位置 - 力扣（LeetCode）https://leetcode.cn/problems/find-first-and-last-position-of-element-in-sorted-array/description/?envTypelist&envIdZCa7r67M这道题，读者可能会说这道题有什么好…

阅读更多...

云计算（Docker）

云计算（Docker）

Docker简介 Docker 是一个开源的应用容器引擎，基于 Go 语言，并遵从 Apache2.0 协议开源。它可以让开发者打包应用以及依赖包到一个轻量级、可移植的容器中，然后发布到任何流行的 Linux 机器上，也可以实现虚拟化。Docker 可用于开发…

阅读更多...

详解ssh远程登录服务

详解ssh远程登录服务

华子目录简介概念功能分类文字接口图形接口文字接口ssh连接服务器浅浅介绍一下加密技术凯撒加密加密分类对称加密非对称加密非对称加密方法（也叫公钥加密） ssh两大类认证方式：连接加密技术简介密钥解析 ssh工作过程版本协商阶段密钥和算法…

阅读更多...

程序员如何做事更细致？

程序员如何做事更细致？

最近在工作中老是犯一些小错误，哦，当然也不是最近了，其实我一直是个马虎的人，我很讨厌做一些细活，因为这会让我反复改动多次在会成功，而平时的代码由于有debug，即便出错了，再改回来即…

阅读更多...

基于STC12C5A60S2系列1T 8051单片的模数芯片ADC0809实现模数转换应用

基于STC12C5A60S2系列1T 8051单片的模数芯片ADC0809实现模数转换应用

基于STC12C5A60S2系列1T 8051单片的模数芯片ADC0809实现模数转换应用 STC12C5A60S2系列1T 8051单片机管脚图STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式及配置STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式介绍模数芯片ADC0809介绍通过模数芯片ADC0809把电压模…

阅读更多...

Java Swing商品信息查询系统

Java Swing商品信息查询系统

内容要求 1） 本次程序设计是专门针对 Java 课程的,要求使用 Java 语言进行具有一定代码量的程序开发。程序的设计要结合一定的算法，在进行代码编写前要能够设计好自己的算法。 2）本次程序设计涉及到 Java 的基本语法，即课堂上所…

阅读更多...

redis高级案列case

redis高级案列case

案列一双写一致性案例二双锁策略 package com.redis.redis01.service;import com.redis.redis01.bean.RedisBs; import com.redis.redis01.mapper.RedisBsMapper; import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired; imp…

阅读更多...

基于STC12C5A60S2系列1T 8051单片机的模数芯片ADC0832实现模数转换应用

基于STC12C5A60S2系列1T 8051单片机的模数芯片ADC0832实现模数转换应用

基于STC12C5A60S2系列1T 8051单片的模数芯片ADC0832实现模数转换应用 STC12C5A60S2系列1T 8051单片机管脚图STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式及配置STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式介绍模数芯片ADC0832介绍通过模数芯片ADC0832把电压模…

阅读更多...

【python】OpenCV—Rectangle, Circle, Selective Search（1.2）

【python】OpenCV—Rectangle, Circle, Selective Search（1.2）

文章目录 1 画框画圈1.1 画矩形框1.2 画圆 / 点1.3 椭圆 2 Selective Search3 Resize 1 画框画圈 1.1 画矩形框 # Copy the image img_rgb_copy img_rgb.copy()# Draw a rectangle cv2.rectangle(img_rgb_copy, pt1 (405, 90), pt2 (740, 510),color (255, 0, 0), thickne…

阅读更多...

4种经典的限流算法

4种经典的限流算法

0、基础知识 1000毫秒内，允许2个请求，其他请求全部拒绝。不拒绝就可能往db打请求，把db干爆~ interval 1000 rate 2； 一、固定窗口限流固定窗口限流算法（Fixed Window Rate Limiting Algorithm）是…

阅读更多...

文件传输客户端 SecureFX mac中文版支持多种协议

文件传输客户端 SecureFX mac中文版支持多种协议

SecureFX mac是一款功能强大的文件传输客户端，可在 Mac 操作系统上使用。它由 VanDyke Software 公司开发，旨在为用户提供安全、可靠、高效的文件传输服务。 SecureFX 支持多种协议，包括 SFTP、SCP、FTP、FTP over SSL/TLS 和 HTTP/S。它使用…

阅读更多...

支持4KHz回报还能无线充电，简约不简单的雷柏VT3S游戏鼠标上手

支持4KHz回报还能无线充电，简约不简单的雷柏VT3S游戏鼠标上手

这两年国产鼠标的表现很让人惊喜，不仅外观做工越来越精细，配置也越来越强大，当然价格依然亲民。现在很容易找到一款搭载高端传感器、响应速度快、电池续航时间长，并且还支持无线充电的全能型鼠标。我之前用雷柏的鼠标比较多&…

阅读更多...

Transformer ZOO

Transformer ZOO

Natural Language Processing Transformer:Attention is all you need URL(46589)2017.6 提出Attention机制可以替代卷积框架。引入Position Encoding，用来为序列添加前后文关系。注意力机制中包含了全局信息自注意力机制在建模序列数据中的长期依赖关系方面表现出…

阅读更多...

最新文章

推荐文章