扩散模型浅析

扩散模型浅析

背景-Why

为什么会提出扩散模型

VAE过程

variational auto-encoder(VAE) :先定义隐变量z满足正态分布,后定义条件分布 pθ(x|z),从而定义了 z 和 x 的联合分布。训练模型时,先采样得到隐变量z,后根据z和条件分布得到x。

整个过程理解为:把标准高斯z通过条件分布pθ(x|z)映射到数据分布X上。

  • 出现问题

训练VAE基于最大似然,而 log⁡pθ(x) 的计算是intractable的(因为真实后验无法计算),通常我们都需要借助variational inference的技巧

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hbCUmpC9-1667304334719)(images/TIg3zKEgoUjCphT-7pNZmePO7arbSw5sXAMF4r6ZtP0.png)]

训练VAE的本质是训练右边期望最大值。同时训练 pθ(x|z) 和 qϕ(z|x),当他们相等时取到最大值。

VAE的核心是如何选择 qϕ(z|x)能保证得到最大值?选择简单无法接近真实后验,导致模型效果不好;选择复杂,log( qϕ(z|x))难以计算,导致难以优化。

  • 核心难点

变分后验的表达能力和计算代价的权衡一直是VAE领域核心痛点

GAN和Normalizing Flow

都是直接使用高斯噪声生成数据分布,不需要关注后验分布,简单直接;

但GAN需要额外训练辨别器来辨别生成结果是否真实(难以训练);

Normalizing Flow要求映射函数是可逆的,保证生成结果对应,但一般的神经网络模型不满足要求,限制其应用;

是否有一种生成模型,只需要生成器,目标函数简单,不需要额外网络,表达能力强?

diffusion model!

真正把diffusion model首次做work的工作是2020年提出的DDPM

扩散模型的核心思路

VAE中需要考虑变分后验,难以选择合适的变分后验。既能考虑到将高斯噪声映射到数据分布,又要变分后验与生成函数接近,保证最大期望,这个要求太高。但VAE的思路是先定义生成器后选择合适后验分布匹配,是否可以先选择简单“后验分布”,再定义生成器来匹配它?由此提出diffusion model,先计算数据分布映射到高斯噪声的映射关系,再通过生成器学习高斯噪声到数据分布的逆过程即可。

核心思想:学习前向过程中每一步的逆过程

原理-What

确定了核心思想:学习简单前向过程每一步的逆过程,如何达到这个目标呢?

使用马尔科夫链,不论从什么分布出发,只要一直采样都能得到想要的平稳分布(stationary distribution)。而把数据映射到标准高斯分布的过程其实非常简单:构造一个平稳分布是标准高斯分布的马尔科夫链即可

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NlogG1Lr-1667304334720)(images/lgb86NV2gmZvuQ1FGgRJ9yjh2f29QBpMkedCCJEvArk.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RxTx80ah-1667304334720)(images/RjUuj8h0kz-xNynaRDVXtaHTu_ljYDdcu2rYLbOC0-g.png)]

重点是:前向过程的每一小步的逆过程都可以近似为高斯分布!(原理证明文章)

如果选取的bate很小,可以用高斯分布近似其逆过程。

这也是为什么diffusion model里经常会见到用一个参数化的高斯分布 pθ(xt−1|xt) 来近似逆向过程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-m74Xxsga-1667304334720)(images/NAT5oCjzhXyesMOqYRd8xbO7UmtaQuPStW8u_zI0-cw.png)]

可以用一个直观的图来感受一下。diffusion model定义了一个简单的前向过程(下面那行),不断地加噪来把真实数据映射到标准高斯;然后又定义一个逆向过程来去噪(上面那行),并且逆向过程的每一步只需要是一个很简单的高斯分布即可。

总而言之,从理论角度来看,diffusion model的成功在于我们训练的模型只需要“模仿”一个简单的前向过程对应的逆向过程,而不需要像其它模型那样“黑盒”地搜索模型。并且,这个逆向过程的每一小步都非常简单,只需要用一个简单的高斯分布来拟合。这为diffusion model的优化带来了诸多便利,这也是它empirical performance非常好的原因之一。

Diffusion model的定义:去噪模型与score function的联系

考虑我们上一节介绍的平稳分布为标准高斯分布的马尔科夫链的连续版本:随机微分方程(SDE)。前向过程就是一个不断加噪声的SDE,它唯一对应了一个逆向过程(reverse SDE),其中的未知量只有每一时刻的score function:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6muFwMSk-1667304334721)(images/7UIcMSOCBgxMZ2NcMafKPB8gBb0Y7fsdovFUqey-EuQ.jpeg)]

所谓的“去噪模型”与score function其实是等价的loss,这其实只需要用denoising score matching的一个性质就可以证明。有些文章里会出现“去噪”,而有些文章又会出现“估计噪声”,有些文章又会出现“score function”,但其实它们都是等价的参数化

应用-How

代码中主要三个任务:超分、补全和文本生成图像;
autoencode用于编码特征,进行超分训练;

Image Super-Resolution via Iterative Refinement pdf code 解析 (CVPR2021)
Palette: Image-to-Image Diffusion Models pdf code (sigraph 2022)
guided-diffusion code (openai)
openai/improved-diffusion
diffusion based model for colorization code (slight)

参考

清华博士知乎文章

华科DDPM介绍

diffusion model详细介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38743.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

妙啊!用扩散模型生成蛋白质结构,结果不输天然蛋白质|来自斯坦福微软

丰色 发自 凹非寺量子位 | 公众号 QbitAI 没想到,图像生成领域的大明星—— 扩散模型,这么快就被用来做蛋白质结构生成了! 而且结果在复杂度和结构上都和天然蛋白质有的一拼。 消息一出,不少人都称赞这个组合简直非常妙。 还有人表…

生成扩散模型漫谈:DDIM = 高观点DDPM

©PaperWeekly 原创 作者 | 苏剑林 单位 | 追一科技 研究方向 | NLP、神经网络 相信很多读者都听说过甚至读过克莱因的《高观点下的初等数学》[1] 这套书,顾名思义,这是在学到了更深入、更完备的数学知识后,从更高的视角重新审视过往学过…

什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达 也许过去十年在计算机视觉和机器学习方面的突破是GANs(生成式对抗网络)的发明——这种方法引入了超越数据中已经存在的内容的可能性,是一个全新领域的敲门砖…

扩散模型探索:DDIM 笔记与思考

DIFFUSION系列笔记|DDIM 数学、思考与 ppdiffuser 代码探索 论文:DENOISING DIFFUSION IMPLICIT MODELS 该 notebook 主要对 DDIM 论文中的公式进行小白推导,同时笔者将使用 ppdiffusers 中的 DDIM 与 DDPM 探索两者之间的联系。读者能够对论文中的大部…

几何扩散模型用于分子构象生成ICLR2022

从分子graph预测分子构象是药物发现的基本问题,生成模型在该领域取得进展。受扩散模型启发,作者提出GeoDiff用于分子构象预测。GeoDiff将每个原子视为一个粒子,并学习扩散过程(从噪声分布转为稳定构象)。 来自&#x…

TP5+PHPMailer 实现发送邮件功能

目录 准备工作 一、PHPMailer是什么? 二、使用步骤 1.查看本机是否开放25端口 2.打开邮箱启动邮箱的SMTP服务 3.下载PHPPHPMailer资源 4.代码编写 总结 准备工作 使用QQ邮箱或者163网易邮箱或者126邮箱,这里以qq邮箱为例来进行介绍。 分为三步&#xf…

[PHPMailer]PHP电子邮件教程

前言 这周也是刚放假回来,苦逼高中生一个,很多时候因为我是住宿生,难免没有硬件设备来跟互联网进行沟通,有的时候我们想要给别人一个祝福,比如说某某人生日,但是你在学校,怎么给他祝福呢&#…

三分钟告诉你有可以ai写作的软件吗

你是否曾经遇到过写作困难的时候?或者是遇到了一个写作任务,但却不知道如何下笔?不用担心,现在有一种神奇的软件可以帮助你迅速解决这些烦恼。它就是ai写作软件!是的,你没听错!现在,…

改写句子的软件有哪些-免费改写文章的软件

改写句子的软件 改写句子的软件是一种广泛应用于文字处理的工具,其主要作用是通过对原文中的语言结构和表述方式进行调整和优化,以改进文章的质量和可读性。改写句子的软件广泛用于新闻报道、科学文章、学术论文、书籍等各类文本材料中,旨在…

chatgpt赋能python:关于怎么把Python改成黑色的SEO文章

关于怎么把Python改成黑色的SEO文章 在当今数字化时代,SEO已经成为了数字营销策略中非常重要的一部分。而在内容创作方面,黑色SEO占据着很大一部分。黑色SEO指的是通过一些不可取的手段,来获得搜索引擎排名的提升,以获取更多的流…

chatgpt赋能python:用Python更简单地替换句子中的单词

用Python更简单地替换句子中的单词 简介 Python是一种流行的编程语言,因其易于阅读和编写代码而闻名。它拥有许多强大的功能和库,其中一个非常有用的功能是如何替换句子中的单词。在今天的数字时代,SEO变得越来越重要,其中一个关…

邮箱验证前端

邮箱验证前端代码&#xff08;带定时器&#xff09; <!DOCTYPE html> <html > <head><meta charset"utf-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><title>用户忘记密码</title><m…

验证邮箱是否存在

通过socket、smtp验证邮箱是否存在 验证逻辑图 验证邮箱代码 /*** socket验证** param mail 邮箱* return*/private static Boolean smtpVerify(String mail) {Socket socket null;boolean valid;BufferedReader reader null;BufferedWriter writer null;// 获取邮箱的域…

koa发送验证码至邮箱,QQ邮箱发送

提示&#xff1a;koa发送验证码至邮箱&#xff0c;QQ邮箱发送 文章目录 前言一、依赖和邮箱设置二、使用步骤1.vue中Login.vue2.vue中axios.js3.koa中routes.js4.koa中emailCode.js5.koa中app.js 总结 前言 koa发送验证码至邮箱&#xff0c;QQ邮箱发送 一、依赖和邮箱设置 n…

抖音APP接口分析

抖音搜索接口 接口名类型链接搜索用户综合信息posthttps://aweme-hl.snssdk.com/aweme/v1/challenge/search/?搜索相关用户列表posthttps://search-hl.amemv.com/aweme/v1/discover/search/?搜索相关话题列表posthttps://search-hl.amemv.com/aweme/v1/challenge/search/? …

征集即将截止,《中国AIGC产业全景报告暨AIGC 50》邀你共同参与!

随着ChatGPT火爆&#xff0c;AIGC——AI生成内容&#xff0c;热度被推向了最高潮。 短短两个月内&#xff0c;ChatGPT频频刷屏&#xff0c;霸占舆论热点。不仅在多个场景上效果惊人&#xff0c;还实现了最快达到一亿月活&#xff0c;疯狂拉升各个相关技术和概念公司的品牌、股价…

【历史上的今天】8 月 29 日:Wolfram 语言之父、“新”科学家 Stephen Wolfram 的诞生

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2022 年 8 月 29 日&#xff0c;2014 年的今天&#xff0c;电影《模仿游戏》在美国的特柳赖德电影节全球首映&#xff0c;将“计算机科学之父”艾伦图灵的传奇人生带到…

猜年龄 美国数学家维纳(N.Wiener)智力早熟,11岁就上了大学。

美国数学家维纳(N.Wiener)智力早熟&#xff0c;11岁就上了大学。他曾在1935~1936年应邀来中国清华大学讲学。 一次&#xff0c;他参加某个重要会议&#xff0c;年轻的脸孔引人注目。于是有人询问他的年龄&#xff0c;他回答说&#xff1a; “我年龄的立方是个4位数。我年龄的4次…

图灵奖获得者杰克·唐加拉:ChatGPT并非“超算大脑”,量子芯片或引领行业跨越式飞跃...

来源&#xff1a;数据观 现任美国田纳西大学电气工程和计算机科学系教授的杰克唐加拉&#xff08;Jack J. Dongarra&#xff09;&#xff0c;既是美国国家工程院院士&#xff0c;又是英国皇家学会外籍院士。他是超级计算机基准测试、数值分析、线性代数解算器和高性能计算领域的…

数学家排行榜:高斯和黎曼谁才是近现代最伟大的数学家?

第一&#xff1a;牛顿&#xff0c;高斯&#xff0c;欧拉&#xff0c;阿基米德 第二&#xff1a;柯西&#xff0c;庞加莱&#xff0c;康托尔&#xff0c;凯莱&#xff0c;哈密尔顿&#xff0c;黎曼&#xff0c;爱森斯坦&#xff0c;帕斯卡 第三&#xff1a;伽罗瓦&#xff0c;阿…