OpenAI 利用基于“一致性”的图像生成器超越扩散模型

图像生成领域发展迅速。 尽管 Midjourney 和 Stable Diffusion 等流行工具使用的扩散模型可能看起来是我们所拥有的最好的,但下一个东西总是会出现——OpenAI 可能会用“一致性模型”来解决它,它已经可以完成简单的任务和 数量级比 DALL-E 之类的快。

该论文于上个月作为预印本发布到网上,并没有伴随着 OpenAI 对其主要版本的低调宣传。 这并不奇怪:这绝对只是一篇研究论文,而且非常技术性。 但这种早期实验技术的结果非常有趣,值得关注。

一致性模型不是特别容易解释,但与扩散模型相比更有意义。

在扩散中,模型学习如何从完全由噪声构成的起始图像中逐渐减去噪声,使其一步步靠近目标提示。 这种方法使当今最令人印象深刻的 AI 图像成为可能,但从根本上说,它依赖于执行 10 到数千步的任何地方才能获得良好的结果。 这意味着它的运行成本很高,而且速度很慢,以至于实时应用程序不切实际。

一致性模型的目标是在单个计算步骤或最多两个计算步骤中获得不错的结果。 为此,该模型像扩散模型一样经过训练以观察图像破坏过程,但会学习在任何遮蔽级别(即缺少少量信息或大量信息)拍摄图像并生成完整的源图像 只需一步。

但我赶紧补充说,这只是对正在发生的事情的最粗略的描述。 就是这种样子:

一致性论文的代表性摘录。 图片来源:OpenAI

由此产生的图像并不令人兴奋——许多图像甚至都不能称为好图像。 但重要的是它们是一步生成的,而不是一百或一千个。 此外,一致性模型泛化到各种任务,如着色、放大、草图解释、填充等,也只需一个步骤(尽管经常改进一秒钟)。

 无论图像主要是噪声还是主要是数据,一致性模型都会直接得出最终结果。 图片来源:OpenAI

这一点很重要,首先,因为机器学习研究中的模式通常是有人建立了一种技术,其他人找到了使它更好地工作的方法,然后其他人随着时间的推移对其进行调整,同时增加计算以产生比你开始时更好的结果。 这或多或少就是我们最终得到现代传播模型和 ChatGPT 的方式。 这是一个自我限制的过程,因为实际上您只能将这么多的计算用于给定的任务。
然而,接下来发生的是一种新的、更有效的技术,它可以做以前模型所做的事情,虽然一开始会更糟,但也会更有效。 一致性模型证明了这一点,尽管还为时过早,无法将它们与扩散模型直接进行比较。
但它在另一个层面上很重要,因为它表明 OpenAI 是当今世界上最有影响力的 AI 研究机构,它正在积极研究下一代用例的过去扩散。
是的,如果您想使用 GPU 集群在一两分钟内进行 1,500 次迭代,您可以从扩散模型中获得惊人的结果。 但是,如果你想在某人的手机上运行图像生成器而不耗尽他们的电池,或者在实时聊天界面中提供超快速的结果怎么办? 扩散根本不是这项工作的错误工具,OpenAI 的研究人员正在积极寻找合适的工具——包括该领域的知名人士 Ilya Sutskever,而不是低估其他作者 Yang Song、Prafulla Dhariwal 和 Mark 陈的贡献 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27138.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

扩散模型和Transformer梦幻联动!替换U-Net,一举拿下新SOTA!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>扩散模型微信技术交流群 转载自:量子位 “U-Net已死,Transformer成为扩散模型新SOTA了!” 就在ChatGPT占尽AI圈风头时,纽约大学…

扩散模型diffusion model用于图像恢复任务详细原理 (去雨,去雾等皆可),附实现代码

文章目录 1. 去噪扩散概率模型2. 前向扩散3. 反向采样3. 图像条件扩散模型4. 可以考虑改进的点5. 实现代码 话不多说,先上代码: 扩散模型diffusion model用于图像恢复完整可运行代码,附详细实验操作流程 令外一篇简化超分扩散模型SR3来实现图…

0基础学习diffusion_model扩散模型【易理解的公式推导】Denoising Diffusion Probabilistic Models

0基础学习diffusion_model扩散模型【易理解的公式推导】 一、概述二、扩散过程(已知X0求Xt)三、逆扩散过程(已知Xt求Xt-1)1。算法流程图四、结论五、损失函数六、心得体会(优缺点分析)一、概述 DDPM论文链接: Jonathan Ho_Denoising Diffusion Probabilistic Models(NeurIPS…

07.04.2023 日语笔记

貰『もら』える(可以……吗?) コーヒーをテイクアウトでもらえますか。(可以打包咖啡吗?) マグカップで、飲み物をもらえますか。(可以自带杯子吗?) マグカップ&#x…

红蓝宝书1000题 新日本语能力考试N1文字.词汇.文法 练习+详解

红蓝宝书1000题 新日本语能力考试N1文字.词汇.文法 练习详解pdf百度云免费下载 本书是继《新版中日交流标准日本语》初、中级后,由人民教育出版社与日本光村图书出版株式会社通力合作、精心编写的一套日语自学读本。 本书由知名的日本语学、汉学以及日语教育界的学者执笔,充分…

apple watch可以使用第三方表盘了,Apple Watch 更换第三方表盘需求

apple watch可以使用第三方表盘了,Apple Watch 更换第三方表盘需求 对于 Apple Watch 用户来说,表盘的选择太少而且过于单调。那么,自带的表盘看腻了如何更换第三方表盘呢? 前几代apple watch无法使用新表盘,想要实现更…

Applewatch6/ Applese价格曝光 苹果最新款手表参数区别对比

价格方面,Apple Watch Series 6GPS 版 3199 元起售,蜂窝网络版 3999 元起售。Apple Watch SE GPS 版 2199 元起售,蜂窝网络版 2499 元起售。 Apple Watch Series 6 新品活动 优惠空前机会不容错过 https://www.apple.com.cn/6 Apple Watch Se…

苹果手表计算机功能键,Apple Watch上的2个按键是这么玩的

原标题:Apple Watch上的2个按键是这么玩的 点评:苹果不说,但是你要知道的用法。 Apple Watch是苹果全新的产品,代表了苹果全新的设计理念,如此一来,操作和交互方式就与手机自然也有所不同。结果有的小伙伴把…

如何设置并将你的iWatch和iPhone配对

如何设置并将你的iWatch和iPhone配对 一旦你买到一个iWatch,拿回家并拆封,下面教你如何设置。 iWatch是这样一个装置,它被设计出来和你的iPhone一起使用。它可以说是一个iPhone配件,它们的关系非常亲密。这也是为什么设置iWatch感…

Apple Watch发售在即 苹果门店大变脸

本周五,苹果公司将正式发售人气如虹的智能手表Apple Watch,有意购买者将有机会尝试不同尺寸、表带款式和设定,并在4月24日正式铺货前先行预订。 苹果零售业务主管安吉拉阿伦茨(Angela Ahrendts)一直在和首席设计师乔尼…

android+wear+和iphone,Android Wear手表兼容iPhone:和苹果抢用户

原标题:Android Wear手表兼容iPhone:和苹果抢用户 北京时间9月1日早间消息,不愿使用Apple Watch智能手表的用户现在有了新选择:Android Wear设备。 Android Wear首席产品经理杰夫常(Jeff Chang)表示,Android Wear将通过…

如何更改Apple Watch 上的表盘?

我们在使用Apple Watch的时候,您可以为表盘选取不同的设计、调整颜色,以及添加复杂功能。您甚至可以将时间提前。那我们该如何操作呢?需要的朋友快和小编一起来看看吧! 如何在 Apple Watch 上切换表盘 1.在表盘上,从…

Apple Watch使用指南:所有Apple Watch图标和符号含义

Apple Watch是iPhone的缩影,具有“ n”个功能,苹果为它们制定了各种不同的图标和符号。这篇文章详细总结了所有Apple Watch图标和符号含义,还不了解的朋友快来学习一下吧! 雷电的力量 1、绿色闪电 我们大多数人都知道这个常见标…

watch的使用方法

1、 通过 watch 监听 data/computed 数据的变化。 2、通过 watch 监听 obj 数据的变化。(深度监听 deep) 因为修改是修改的对象里某个属性的值,监听不到user对象,所以要深度监听 网页打开 handler就执行一次 3.通过 watch 监听 data 数据的…

杰理-手表-AC701-watch-添加表盘

添加表盘 1.复制一个表盘,更改名称表盘6 2.修改表盘6路径下的copy_file.bat 3.修改表盘预览图资源名字 4.表盘文件夹重新命名 5.批处理添加表盘的资源打包处理,注意表盘资源的名字 6.添加背景图片,时分秒 保存编译 7.在模式界面…

苹果设计可变色Apple Watch表带,智能穿戴玩法多

苹果最新技术专利显示,苹果正在为 Apple Watch 设计一款可变色的表带,可以根据佩戴者所穿着的服装、所在的环境等自动改变颜色。据介绍,这款表带里的灯丝具有电致变色功能,可以通过施加不同的电压,来实现显示多种颜色或…

科研在线实用工具

————————————————————————————————————————— SCI文献查找: Sci-Hub: 将知识带给每个人Sci-Hub网站。免费获取学术期刊。免费下载来自ScienceDirect、IEEE、Wiley、Springer、Nature及其他的研究论文。https://sci-hub.s…

人工智能前沿——深度学习热门领域(确定选题及研究方向)

近年来,人工智能发展迅猛,其主要动力来自深度学习。深度学习的炙手可热源自于它对人工智能技术发展的整体促进和在广泛应用场景中的巨大应用价值。毫无疑问,深度学习仍旧是当今时代人工智能前沿技术的核心。 目录 一、计算机视觉(…

Sci-Hub和 Alexandra 的基本信息

作者: Alexandra 翻译:科大云炬 I decided to make a quick summary of facts about Sci-Hub and myself, because in our times you cannot fully trust articles published in media, Wikipedia pages. Well, they do present facts about Sci-Hub th…

用canvas绘画一些图形(图标)

最近在研究HTML5,发现其中的canvas用途很广。不但可以绘制图形,还可以制作图片线性渐变,而且还能渲染文字做成特效。 是 HTML5 新增的,一个可以使用脚本(通常为JavaScript)在其中绘制图像的 HTML 元素。它可以用来制作照片集或者制…