英伟达把P图软件GAN了

晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI

英伟达的最新AI工具又让网友用户们激动了。

“我已经等不及了!”

bd242b2e7bdf8dedfba5a43134380355.png

一位网友在看完演示视频后表示。

对于“手残党”来说,英伟达的EditGAN简直就是零基础P图神器。

能够高质量、高精细度地对图像进行修改,让P图方式从未如此容易。

例如,让画像和雕塑“挤眉弄眼”:

8835299613ffb127726525eae3bc81ba.gif

只要你会上传图片、能画草图,就能够轻松P图。如此“魔性”的工具,难怪得到了网友热捧。

EditGAN甚至能精细到修改车轮辐条大小和方向:

dd1586cf10e940183e3256b1a5978f9a.gif

当然,真人照片也不在话下,如控制人眼朝向、头发量等:

cd5074c62a31390541de347d8bc9209c.gif

还能给猫咪修改耳朵大小:

1d8cf68435108c0dafb53e432af05f3f.gif

而你要做的,只是上传一张图片,然后由程序生成一张语义分割草图,直接在草图上涂抹修改。

31040fb40af7357fc6db00c7e4302d8a.png

 在草图中加入牙齿部分,人就笑了

EditGAN只会修改你想要改变的部位,其他部分都原封不动。

和最近的GauGAN2一样,英伟达也为EditGAN开发了一个电脑软件:

4a539142c363eeea1c18962b031b3ee3.gif

这项研究已经被NeurIPS 2021接收。

本文一作是来自多伦多大学的华人博士生凌欢,他同时在该校人工智能研究院(Vector Institute)和英伟达做研究。

951212f98c20166e9a79f1f8a1556238.png

首个GAN驱动的图像编辑器

研究人员表示,EditGAN是第一个GAN驱动的图像编辑框架,它的主要特点是:

1、提供非常高的精度编辑,
2、只需要很少的注释训练数据,
3、可以实时交互式运行,
4、允许多个编辑的直接合成,
5、适用于真正的嵌入式、GAN生成甚至域外图像。

首先,EditGAN使用StyleGAN2生成图像。

StyleGAN2的工作流程是:获取图像,将其编码到潜在空间,并使用生成器将这个编码子空间转换为另一个图像。

但问题在于,这个空间是多维的,我们很难将其可视化,也很难确定该子空间的哪一部分负责重建图像中的哪个特征。

487474f52844b04bcdd6ed130c12c726.png

通常,需要庞大的标注数据集,才能知道模型中潜在空间哪一部分控制哪些特征。

而EditGAN仅通过对少数标记的数据集示例进行学习,就能将分割与图像相匹配,从而实现图像图像的编辑。

EditGAN保留了完整的图像质量,同时提供了前所未有的细节和自由度。

更重要的是EditGAN不仅知道潜在空间对应控制那个部分,而且还将它们与草图对应起来。这样,我们就可以通过修改草图轻易地修改图像了。

EditGAN基于DatasetGAN,结合了图像建模及其语义分割。

EditGAN的关键思想在于利用图像和像素级语言分割联合分布。

具体而言,就是将图像嵌入GAN的潜在空间,并根据分割编辑执行条件潜在代码优化。

be90faf2edc8845c4dd52b7f94fb33b9.png

以上展示了EditGAN的训练过程:修改语义分割并优化共享的潜在代码,与编辑区域内的新分割,以及编辑区域外的RGB外观保持一致。相应的梯度通过共享生成器进行反向传播。

为了摊销优化,作者在实现编辑的潜在空间中找到“编辑矢量”。该框架允许学习任意数量的编辑矢量,然后以实时的速率直接应用于其他图像。

P图工具即将发布

作者团队在英伟达内部GPU集群上使用V100执行底层 StyleGAN2、编码器和分割分支的训练以及嵌入和编辑的优化。

该项目使用了大约14000个GPU 小时,其中大约3500个 GPU 小时用于最终实验,其余用于研究项目早期阶段的探索和测试。

至于EditGAN的运行,在V100上进行30 (60) 步优化需要 11.4 (18.9) 秒。

虽然训练不起,但是用训练好的模型来P图还是有可能的。

此前英伟达发布的Canvas就集成了GauGAN2等最新成果,可以用手绘草图生成精细的PS文件。

2b234110fbc1924934e63803e94caea9.gif

可能Canvas也会很快集成EditGAN的吧。

有个好消息是,英伟达表示,将会代码和编辑工具软件即将推出。你是是不是迫不及待想尝试一把了?

论文地址:
https://arxiv.org/abs/2111.03186

补充材料:
https://nv-tlabs.github.io/editGAN/editGAN_supp_compressed.pdf

讲解视频:
https://www.youtube.com/watch?v=bus4OGyMQec

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31321.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英伟达NVIDIA GPU 架构介绍

一、NVIDIA GPU的架构演变历史和基本概念 截止2021年,发布时间离我们最近的8种NVIDIA GPU微架构是: Tesla (特斯拉) Fermi(费米) Kepler(开普勒) Maxwell(麦克斯韦) Pascal&#x…

英伟达 GPU 架构简史

英伟达 GPU 架构简史 尽管近年来 Nvidia GPU 确实更频繁地成为新闻,但它们绝不是新事物。事实上,多年来,Nvidia GPU 已经进行了多次迭代,GPU 架构也取得了进步。因此,让我们回顾一下最近的历史,以了解 GPU…

英伟达创始人CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好 | 英伟达:地球上最重要的公司之一

英伟达创始人&CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好 文章目录 英伟达创始人&CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好英伟达公司…

英伟达突破万亿美元市值,创始人黄仁勋分享创业心得

你知道全球第一家市值突破万亿美元的芯片公司是哪一家吗?它的创始人又是怎样的一个人呢?今天我们就来聊聊英伟达和黄仁勋的故事。 —————————————————————————————— 英伟达(NVIDIA Corporation)&a…

不愁失业!英伟达 CEO 黄仁勋:“AI 让每个人都能成为程序员”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 你是否想过,AI 可以帮你圆梦程序员? 早些年,大家或许对此存在疑惑,但近来 AI 编程工具的涌现和升级,这题的答案或许是——“y…

关于英伟达数字人文章的致歉和说明

大家好,昨天我们发布的一篇英伟达数字人新进展的文章,引发了较大范围的关注和讨论。经过我们的复核及英伟达官方最新确认,这篇文章存在不严谨和失当之处,特此进行说明和致歉。 一、说明一下我们的错误。 今日英伟达官方确认&#…

元宇宙大比拼:英伟达Nvidia,Facebook,iwemeta

还是那个熟悉的黄色厨房,还是那身立领的黑皮衣,在11月9日下午4点,黄仁勋带着他的元宇宙概念开启了英伟达GTC 2021大会。 在长达1小时30分钟的新品发布会中,黄仁勋重磅发布了英伟达最先进的Omniverse Avatar平台,这是一…

英伟达首席科学家:深度学习硬件的过去、现在和未来

作者|Bill Dally 翻译|胡燕君、沈佳丽、贾川 过去十年是深度学习的“黄金十年”,它彻底改变了人类的工作和娱乐方式,并且广泛应用到医疗、教育、产品设计等各行各业,而这一切离不开计算硬件的进步,特别是GP…

英伟达的这款GPU太强了!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 今年 3 月 21 日 - 24 日举办的 NVIDIA GTC 2022 大会可谓是亮点十足。NVIDIA 不仅一口气更新了 60 多个 SDK 应用程序,继续加大在 Omniverse、机器人平台、自动驾驶和量子计算等…

英伟达创始人出生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 2 月 17 日,在 1996 年的今天,IBM 的超级计算机“深蓝”首次挑战卡斯帕罗夫落败。“深蓝”首次挑战虽然最终败北,但却赢得了…

作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配

正在成为组织运营标配的流程挖掘,到底有哪些商业价值? 作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配 文/王吉伟 AIGC正在影响越来越多的行业,流程挖掘领域亦不例外。 Mindzie首先宣布集成生成式AI,使用户…

如何利用ChatGPT构建高效的思维导图

如何利用ChatGPT构建高效的思维导图 文章目录 如何利用ChatGPT构建高效的思维导图第一步输入指令,生成大纲指令内容GPT回答 第二步把得到的markdown格式保存为md文件第三步,导入到XMind生成思维导图思维图成品展示 第一步输入指令,生成大纲 …

2021年中国健康体检现状与格局分析,老龄化趋势推动产业发展,民营占比持续提升「图」

一、健康体检产业链概述 健康体检产业上游主要包括相关仪器设备和医用耗材,下游为个人客户或单位团体客户。医疗器械的市场分散程度较高,如果体检中心对医疗器械的采购量大,对上游的议价能力就强;体检中心对下游的团体客户议价能…

【报告分享】2021中国人健康大数据报告-光华博思特(附下载)

摘要:生老病死是我们每个人的坎,如今现代社会,文明程度较高,人们不再追求虚无缥缈的“长生不死”。如何能在有限的生命中,过得更好、更健康,才是打开生命的正确姿势。从这份报告中那些触目惊心的数字里不难看出我国国民…

中国健康体检行业行情动态及未来发展趋向分析报告2022年版

中国健康体检行业行情动态及未来发展趋向分析报告2022年版 【报告目录】: 正文目录 2 图表目录 19 第1章:中国健康体检行业发展环境分析 21 1.1 健康体检行业概念及产业链分析 21 1.1.1 健康体检行业定义 21 1.1.2 健康体检行业产业链简介 21 1.1.3 健…

关于GPT-4,14个容易被忽略的惊人细节!

来源:华尔街见闻 OpenAI推发布了GPT-4之后,向科技界再次扔下了一枚“核弹”。 根据OpenAI的演示,我们知道了GPT-4拥有着比GPT-3.5更强大的力量:总结文章、写代码、报税、写诗等等。 但如果我们深入OpenAI所发布的技术报告&…

科研人的利器:利用New Bing五分钟读完一篇论文

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加我,拉你进群。 New Bing『新必应』是微软一款集成了ChatGPT的搜索引擎,它以聊天的方式来进行信息搜索,这不同过去几十年通过对话框搜索信…

两位阿里 P10 的成长经历,让我学到这几点...

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 作者:shixin。 最近看完了专栏《超级访谈:对话毕玄》,和年初看的《超级访谈:对话汤峥嵘》类似,它们都是对阿里 P10(程序员金字塔顶…

独立产品灵感周刊 DecoHack #052 - 100个AI 工具导航网站

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 ❤️ 刚换工作再加上个人原因有些自己的事…