人人都是绘画大师!微软必应接入DALL·E模型,文字生成图像!

机器之心编辑部

微软必应完善文字生成图像能力,Adobe 今日也发布 Firefly,杀入生成式 AI 这场游戏。

今晚实在是有些热闹。

一边英伟达 GTC 正在进行中,一边谷歌正式开放了 Bard 的测试,这里微软必应也不甘寂寞。

e4e30f1642f1595f06a2bb3a5b3ab831.png

今日,微软正式宣布,必应搜索引擎接入了 OpenAI 的 DALL·E 模型,增加了 AI 生成图像的功能。

也就是说,在接入 ChatGPT 之后,必应再次强化,Bing Image Creator 能够让用户用 DALL·E 模型生成图像。

「对于拥有必应预览版权限的用户,Bing Image Creator 将完全集成到必应聊天体验中,首先在创意模式下推出。」微软消费者营销主管 Yusuf Mehdi 解释道。「通过输入图像描述,提供位置或活动等额外语境,选择艺术风格,Image Creator 将根据用户的想象生成图像。」

dfb20af0b620b382479e77306361e8d6.png

必应具有三种响应模式:创意模式、平衡(balanced)模式和精确(precise)模式。创意模式下必应生成的结果通常是「原创和富有想象力的」,而精确模式则倾向于准确性和相关性,以获得更真实和简洁的答案。目前 Image Creator 只能在创意模式下使用。

值得一提的是,即使没有必应预览版的使用权限,用户也可以通过直接访问 bing.com/create 单独使用 Image Creator 来尝试其图像生成功能,目前仅支持英文输入。微软表示,随着时间的推移,它将支持更多的语言输入。

此外,微软今天还在必应中推出了新的 AI 支持的视觉故事(visual Stories)和 Knowledge Cards 2.0。

2ddd0d80adebd2e8dbc65e7830ad28c5.png

我们简单为大家梳理介绍下 OpenAI 文本生成图像的 DALL·E 系列研究。

2021 年 1 月 6 日,OpenAI 博客发布了两个连接文本与图像的神经网络:DALL・E 和 CLIP。DALL・E 可以基于文本直接生成图像,CLIP 则能够完成图像与文本类别的匹配。这两项研究的发布,引起了社区极大的关注。

据博客介绍,DALL・E 可以将以自然语言形式表达的大量概念转换为恰当的图像,可以说是 GPT-3 的 120 亿参数版本,可基于文本描述生成图像。

8df20d9c20703dd8a2b5163d52c0d093.png

DALL・E 示例。给出一句话「牛油果形状的椅子」,就可以获得绿油油、形态各异的牛油果椅子图像。

2 个月后,DALL·E 的论文和代码公开。

2779e217905e66cf678432dc89503ad8.png

  • 项目地址:https://github.com/openai/DALL-E

  • 论文地址:https://arxiv.org/abs/2102.12092

2022 年 4 月 7 日左右,DALL・E 迎来了升级版本 ——DALL・E 2。与 DALL・E 相比,DALL・E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且,新版本还增添了一些新的功能,比如对原始图像进行编辑。

OpenAI 还公布了 DALL・E 2 的研究论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。

7dc3a1bcb1a0b6771da2e274c85402be.png

论文地址:https://cdn.openai.com/papers/dall-e-2.pdf

此次必应接入的 DALL・E 应该是经过更新迭代的。这在一定程度上,弥补了当前 ChatGPT 在跨模态生成方面缺失的体验。不过等到 GPT-4 多模态能力开放后,也许能为我们带来更多新的体验。

最后提一句,今日还有一项生成式 AI 的发布引起了业内人士的关注与讨论。

那就是 Adobe 发布 Firefly。这是一系列用于创意表达的生成式 AI 模型,让用户可以通过键入命令快速修改图像。目前,Firefly 开放了测试版本,感兴趣的读者可以申请体验。

120d30f58a8c611fd32fd22dd28bbda9.png

如今看来,生成式 AI 这场游戏有越来越多的玩家涌入,竞争也变得越来越激烈。

参考链接:

https://blogs.microsoft.com/?p=52560769

https://www.theverge.com/2023/3/21/23649943/microsoft-bing-openai-dall-e-image-creator-ai

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

ad0b8864aceb36a8ec2f0291e5be70df.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

be59c973f3979e7c2423be9896be2ee3.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43523.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对比编程语言的四种错误处理方法,哪种才是最优方案?

△点击上方“Python猫”关注 ,回复“1”领取电子书 作者:Andrea Bergia 译者:豌豆花下猫Python猫 英文:Error handling patterns 转载请保留作者及译者信息! 错误处理是编程的一个基本要素。除非你写的是“hello world…

巴比特 | 元宇宙每日必读:不再盲目迷信硬件掘金,大厂XR集体后撤,业内人士建议多条腿走路,生态和内容才有更广阔市场...

摘要:据极点商业报道,元宇宙凉热之间,大厂集体收缩XR业务。是舆论定调的风口已过,还是如业内人士所言,进入理智探索时代?为何短短半年时间内,大厂们态度就发生了截然不同的变化?“与…

学会这些思维模型,窥见查理·芒格的致胜秘笈(二)

目录 导语 模型五:SCQA模型 模型六:问题树模型 模型七:MECE原则 模型八:SWOT分析 模型九:波特五力模型 模型十:波斯顿矩阵 导语 读者朋友们好,在我上一篇文章介绍了几个最核心和底层的模…

产品读书《穷查理宝典:查理.芒格智慧箴言录》

要通过提升自己,来强化对世界的感知,内在的能力才能增长,和世界的大趋势才能互相匹配。这种匹配度提高了,无论你是用来投资、创业,还是做其他事情,都会无往而不利。 查理芒格在书中反复强调的4点内容有&a…

芒格最新演讲:中国的水有些聪明人已经蹚进去了,时候到了更多人会进场

图文来源:雪球 译者:RanRan 我们在说某个人有常识的时候,我们其实是说,他具备平常人没有的常识。人们都以为具备常识很简单,其实很难。 2月14日,95岁的芒格参加了Daily Journal 公司年会,发表了…

站在大模型新风口的云知声:十一年创业之路引领智能语音技术变革

AGI的目标是实现人类般的通用智能,这意味着AI可以像人类一样理解任意通用任务,并以人类的智力水平执行完成。基本上,除了自我意识的生成,AGI就是人类对人工智能的终极梦想了。在AGI曙光照进现实之际,云知声化身为那位站…

在MT4上使用KDJ指标

KDJ指标就是随机指标,由K线、D线和J线这三条曲线共同构成,通过分析图表,我们可以得出,K、D、J分别用不同的颜色线条来表示,所谓的K线是指快速确认线,D线就是指慢速主干线,而J线则为方向明暗线。…

同花顺资金监测精鹰指标公式源码 通过资金监测强弱

使用方法&#xff1a; 指标不含未来,是通过资金监测强弱,资金是不会骗人 当红柱有粉色帽子或红柱上方金色线均表示资金流入 源代码&#xff1a; VAR1:VOL/((HIGH-LOW)*2-ABS(CLOSE-OPEN)); 主动买盘:IF(CLOSE>OPEN,VAR1*(HIGH-LOW),IF(CLOSE<OPEN,VAR1*((HIGH-OPEN)(…

django中使用auth.authenticate在用户名和密码都正确的情况下返回值依然为None的可能原因

毕业设计做了一个系统&#xff0c;其中涉及到用户修改密码&#xff0c;然后发现密码改完之后即使输入了也登不上去&#xff0c;最终定位到问题出在auth.authenticate上&#xff0c;它返回的是None&#xff0c;在csdn上找了好久&#xff0c;全都是说在创建的时候使用django自带的…

美国公司裁员潮可视化;GitHub + Kaggle + InfoQ:3份报告回顾中国开发者的2022 | ShowMeAI每周通讯 #005-01.07

这是ShowMeAI每周通讯的第5期。通讯聚焦AI领域本周热点&#xff0c;及其在各圈层泛起的涟漪&#xff1b;关注AI技术进步&#xff0c;并提供我们的商业洞察。欢迎关注与订阅&#xff01; 导读&#xff1a;2023年第1周&#xff0c;美国科技大厂的裁员信息&#xff0c;终于还是来了…

如何转换图片格式?教你三招一键轻松转换图片格式

之前有朋友跟我吐槽说&#xff0c;有时候保存到电脑上的图片原来是正常的&#xff0c;结果保存下来以后就打不开了&#xff0c;搞的他非常苦恼。其实这个问题也很好解决&#xff0c;一般这种问题都是由于图片格式导致的&#xff0c;只需要将图片格式转换成jpg、png等常见格式就…

手把手教你免费、批量转换HEIC图片到JPG

iPhone手机更新IOS11系统后&#xff0c;相机拍摄的文件格式为HEIC格式&#xff0c;很多软件都无法打开。找了半天也是各种收费&#xff0c;就比如某款软件居然收费&#xff0c;还有年费88块&#xff01;你们怎么好意思收费的&#xff1f; 要么就是在线的转换&#xff0c;一张张…

PS把变成人物照片插画效果

算不算插画不是很懂&#xff0c;又有点类似&#xff0c;效果就是下图的这样&#xff0c;使用陌鱼社区动作&#xff1a;简单时尚手绘人物插画效果PS动作&#xff0c;下面是一些效果图&#xff0c;喜欢的可以试一下 01、双击图案&#xff08;.pat&#xff09;&#xff0c;Adobe P…

通过python我实现了照片转化为动漫模式,媳妇儿再也不用愁没有好看的头像了~

​ 最近某音上的动漫特效特别火&#xff0c;很多人都玩着动漫肖像&#xff0c;我媳妇儿也不例外。看着她这么喜欢这个特效&#xff0c;我决定做一个图片处理工具&#xff0c;这样媳妇儿的动漫头像就有着落了。 编码 为了快速实现我们的目标&#xff0c;我们就不自己写图片处理程…

将照片转换成漫画风格的API推荐

这段时间休息的时候发现了一个很有意思的API——将照片转换成漫画风格API&#xff0c;是在 APISpace 这个接口服务平台发现的。它里面的很多接口都非常的好用&#xff0c;使用起来也很方便&#xff0c;所有的接口都可以提供免费的试用&#xff0c;有需要的同学可以去看看~ 效果…

APISpace 将照片转化成漫画风格API

APISpace 的 将照片转化成漫画风格API&#xff0c;会自动为你将照片转换成漫画风格&#xff0c;无须使用Photoshop 等图片编辑软件、无须任何技术基础。输入图片的url&#xff0c;即可得到漫画风格的图片。 APISpace 上面还多各种各样的API&#xff0c;包括常见的短信、物流、…

Photo2Cartoon,照片图片批量转漫画

当你宅在家里冲浪&#xff0c;当你和驴友出行&#xff0c;当你打开自己的相册。。。。有没有想过让自己的照片换个样子。照片转漫画是一个不错的idea&#xff0c;换个角度欣赏会获得更多的意想不到&#xff0c;不是吗&#xff1f;试试看&#xff01; 首先&#xff0c;进入“图…

ACC编程应用挑战赛决赛真题

目录 哈喽 真题 题目一——圈地盘 题目二——门票 题目三——免单挑战 题目四——逃脱 题目五——一夫当关 题目六——游乐场 最后 哈喽 Hello!昨天是六一儿童节&#xff0c;可在雅安接连发生了6.1、4.3级地震。我在成都&#xff0c;虽然我没感觉到&#xff0c;但我们…

北师大计算机学院保研,北师大信息科学与技术学院保研-北京师范大学信息科学与技术学院保研推荐免试研究生方法...

109梁竞月北京大学电子信息科学类(电子、微电子、计算机软件与理论86.00硕士 110林武桃武汉大学信息安全计算机软件与理论90.00硕士 111刘沛东北京大学电子信息科学类计算机软件与理论88.00硕士 112骆宇冲北京大学电子信息科学类计算机软件与理论83.00硕士 113蒙力北京大学电子…

【DFS专题训练】踏青 C++程序题 连通块问题

题目描述 小白和他的朋友周末相约去召唤师峡谷踏青。他们发现召唤师峡谷的地图是由一块一块格子组成的&#xff0c;有的格子上是草丛&#xff0c;有的是空地。草丛通过上下左右 4 个方向扩展其他草丛形成一片草地&#xff0c;任何一片草地中的格子都是草丛&#xff0c;并且所有…