微软、Adobe 加入 AI 生成图像“内卷”大战,网友:用中译英文本之后,每次图片都有新惊喜!...

217867d9f2a56643e6258afc5df5f10e.gif

作者 | 屠敏

出品 | CSDN(ID:CSDNnews)

在这一场看不到硝烟的战争中,各大科技公司正带着 AI 从自动生成文本、代码的赛道“杀入”下一场——图像领域。

继上周百度发布的文心一言在多模态上实现文本生成图像之后,就在昨夜,微软、Adobe 作为最新的选手,快速进场。

和 AI 艺术爱好者使用更为专业的文本生成图像工具 Midjourney 的体验感有所不同,当互联网公司将这类工具融合到聊天机器人之后,全球网友化身成“提示工程大师”,以不同的姿势打开了 AI 生成图像的新大门。

d5d3a9e7069ba4c89d0c0637701110db.png

微软在 Bing Chat 中带来 Bing Image Creator

微软与 OpenAI 的联手,可谓是打遍天下无敌手。昨日,微软正式官宣将 OpenAI 的 DaLL-E 图像生成器带到新 Bing 中,并把这项新产品称之为“Bing Image Creator”(https://bing.com/images/create)。

不过,微软并没有直接说明在这项功能里面使用的是 OpenAI 哪个版本的 DALL-E 模型,只是说使用的是“最新的 DALL-E 模型”。

早在 2021 年初,OpenAI 便推出了推出了从文字标题生成图像的新型神经网络模型 DALL·E。

2022 年,OpenAI 带来了进阶版本 DALL·E 2,相比初代,分辨率提高了 4 倍,还带来了编辑现有图像等功能。

按理来说,“Bing Image Creator”功能引入的至少是 DALL·E 2 甚至是更高的版本,它在生成图像上更加逼真。现在你只需要用自己的话来描述想要的图片,Bing Image Creator 就能自动生成了。

就像这样:

9fea17333811230896467e6dd3615d47.png

值得注意的是,Bing Image Creator 当前只支持英语作为提示语言。想要更好更准确的让它生成理想中的图片,还需要遵循「形容词」+「名词」+「动词」+「风格描述」的表达模板。

因此,在生成图片的时候,对普通用户的提供的提示语以及口语表达能力还是有一定的门槛的。

而之所以开发这样的工具,微软表示,根据研究,人类大脑处理视觉信息的速度要比文本快 60000 倍,这导致视觉工具成为用户搜索、创造和获得理解的重要方式。想必,这也是为什么很多人都爱发表情包的原因吧。

当前,微软已将 Bing Image Creator 功能集成到 Bing Chat 中,并在 Creative 模式下提供,未来会逐步出现在 Bing 的 Balanced 和 Precise 模式中。

通过输入图像描述,提供位置或活动等额外的背景信息,并选择一种艺术风格,Bing Image Creator 可以根据自己的想象力生成一个图像。简单来看,在聊天窗口一番输入之后,就会得到如下图所示的图片:

005f8e8118afaeaf39ec29d7491d72d1.png

除此之外,微软还将此功能引入了 Edge 浏览器上——要在 Edge 中使用 Bing Image Creator,只需单击侧边栏中的 Bing Image Creator 图标即可创建图像。

不过,并非所有可以访问 Bing Chat 的用户都能使用,其官方 Twitter 称:“它将在未来几天推出,敬请期待更新。”

b7a68279a44542bb4c065fc13b473e5f.png

6ca51958db95a0558c48d4438affb86d.png

图片生成能力:Bing Chat vs 文心一言

在 Bing Image Creator 面向部分用户开放之后,很多人也开启了试用模式,其中可以免费尝试生成 25 张图:

cb901d61d1633ffbac9c2398eddb17bc.png

不难看出,Bing Image Creator 生成的图片都是偏卡通风格的,效果也不错:

95a16a2af5c2da75e52ea74cd991606c.png

de78bb55993c680465ecf14c02b33ec4.png

对此,我们也对百度文心一言的图片进行了实测:

e654cb1f31cc07e74db884e710b0854f.png

07532d71a3d37d3c90d9ecea38c6d99b.png

89ecb0339706c69a2a31092094fcafca.png

整体来看,两家生成的图片效果都不错,各有千秋。

不过,在我们继续实测两家产品过程中,发现无论是只支持英文文本输入的 Bing Image Creator,还是更擅长中文输入的文心一言,在二者遇上博大精深的中国文化、本土食物时,画风新奇,直接按照字面的意思走。

譬如,生成一颗娃娃菜的图片:

4b34adc5c161c8a619e9ea1fb263a327.png

Bing

9052439287308c390cf79d152e2aa55f.png

文心一言

生成一张“奥特曼大战葫芦娃”的图片:

4c806684e347ff1667baa36b67f84cd1.png

Bing

6aa1af8fb12913893c612f968cd42c59.png

文心一言

生成一张“椰子鸡”的图片:

a811c67fb3fa8c5aac20be21c3b3dbbe.png

Bing

ff221856dafa53d1b2aafccd78e0c621.jpeg

文心一言

通过 AI 生成图片也不难知晓为什么大家都说“汉语是世界上最难学的语言,且没有之一”的原因了,就这样,想必大家可以戏耍 AI 图片生成器一整天,还能处处见惊喜,毕竟你永远猜不透它下一次给你生成的图片会是什么。

0fa8002d45e4e3aab9d794b7e6d1ddf9.png

Adobe 入局,专业 Buff 拉满

如果说前两者在自家产品中带来 AI 图片生成功能只是为了将搜索等业务的用户体验加分,那么一直走在图像处理软件工具研发最前沿的老牌软件公司 Adobe 宣布下场拥抱 AI,带来 AI 图像生成模型——Adobe Firefly(https://www.adobe.com/sensei/generative-ai/firefly.html),则是将 AI 图像生成的专业性直接提升。

4c02945fdc8f28028837af4d31f0313b.png

因为它不仅仅是将文本生成图片这么简单:

16b0244df92b30baf937eb0fc2c3c6d5.png

还可以直接换风格、加图层等编辑操作。

ed29b853698e604a4b58da9dc42b848d.png

比如,输入自然语言,一键实现换背景:

10765bf8b31f0663c406caccf0ce5474.png

又比如,自动识别出图片里面的灯塔,Adobe Firefly 可以使用 AI 来生成不同版本的灯塔,并实现替换。

31d28b2b3653c7ce1f800ea263e5889e.png

基于以上,Adobe 在这场发布会上直接带来两个大招,一个是根据文本提示 prompt 创建图像,对标 Midjourney、Stable Diffusion 这样传统的文本生成图像工具;一个是给文字加上 AI 生成的纹理和图案,类似于 AI 辅助的 WordArt。

fe18430b706f8ccb10b8c85b93a2835f.png

这是 Adobe 的一次重大发布与更新。事实上,Adobe 加入这场战局,业界不少人评价道,“意料之外,情理之中”。毕竟一方面,Adobe Firefly 的到来恐直接影响其旗下的系列图片处理工具;另一方面,在自然语言可以解决一切的 AI 世界,不拥抱变化,可能只会被动地淘汰。

a4ef12d0d1933d5e6e57ec736ff2638b.png

为此,在发布 Adobe Firefly 时,Adobe 生成人工智能和 Sensei 副总裁 Alexandru Costin 也直言道,“我们不惧怕变化,我们正在拥抱这种变化。”与此同时,Adobe 采取的策略也并非自己革自己的命,而是选择“将这些功能直接带入 [我们的] 产品中,因此 [用户] 不需要知道它是否具有生成性。”

目前,Adobe 将 Firefly 首先作为内部测试版推出,还没有正式面向公众开放测试,但可以申请加入等待名单(https://survey.adobe.com/jfe/form/SV_2tNbydqEp6ovet0) 。

最终,Adobe 计划将生成式 AI 工具与其创意应用套件(如 Photoshop、Illustrator 和 Premiere)紧密集成。也计划通过各种平台上的 API 提供 Firefly,使客户能够集成到自定义工作流程和自动化中。

0b6189f8373ff5d55a7cd08aabfcc98a.png

道德与版权问题

其实自 OpenAI 的 ChatGPT 惊艳亮相以来,业界对 AI 领域的关注度达到了前所未有的高度,类似 Stable Diffusion 、Midjourney、DaLL-E 等工具层出不穷,但随之而来的是人类对其生成作品带来的版权、恶搞等影响方面的担忧。

为了在一定维度上,解决 AI 存在的版权问题。百度的文心一言、微软的 Bing Image Creator 都会在 AI 生成的画作中加上水印。

此外,微软也在规则中注明,为了遏制 Image Creator 的潜在滥用,“我们已确保将 OpenAI 的安全措施以及其他保护措施纳入 Image Creator。例如,我们实施了旨在限制有害或不安全图像生成的控制措施。当我们的系统检测到提示可能会生成可能有害的图像时,它会阻止提示并警告用户。我们还明确表示 Image Creator 的图像是由 AI 生成的,并且在每张图像的左下角加上了一个 Bing 图标的水印,帮助大家识别该图像是使用 Image Creator 创建的。”

此外,「我们将允许现有艺术家将他们的姓名 report 提供给我们,以限制创建与其姓名关联的图像。」

d46fb0a327bdb77f26a75dc7546b0fe3.png

相比微软的做法,Adobe 直接宣称自己是没有原罪的 AI 模型。

其表示,自己没有盗用艺术家的作品来训练模型。Adobe 用于训练模型的数据要么是版权过期的,要么有许可,要么是 Adobe Stock 图库中的。

Adobe 生成人工智能和 Sensei 副总裁 Alexandru Costin 表示,公司有权使用这些数据。这应该会给 Adobe 的系统带来不惹恼艺术家的优势,并使其系统更具品牌安全性。

Costin 称,Adobe 也计划向贡献训练数据的艺术家支付报酬。这不会在现在公布,其计划是在系统结束测试版之前制定某种“补偿策略”。

你觉得 AI 文本生成图像会对人类设计师存在威胁吗?哪家的模型更胜一筹?

参考:

https://blogs.microsoft.com/blog/2023/03/21/create-images-with-your-words-bing-image-creator-comes-to-the-new-bing/

https://www.theverge.com/2023/3/21/23648315/adobe-firefly-ai-image-generator-announced

https://firefly.adobe.com/

https://blog.adobe.com/en/publish/2023/03/21/bringing-gen-ai-to-creative-cloud-adobe-firefly

 

05d87415c924d1dca16d4a251e564933.gif

☞拼多多驳斥有关其应用程序为“恶意软件”的指控;Google向部分用户预览Bard;ChatGPT出现严重漏洞|极客头条
☞GPT-4 挑战当老板,目标:用 100 美元生成 100000 美元!
☞阿里 VP 贾扬清确认离职!尚未创立公司,方向或是 AI 架构?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9809.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一周AIGC丨太卷了,Stability AI发布无需prompt绘图工具,Midjourney核弹级更新

上周,海外两大AI绘画巨头Midjourney和Stable Diffusion几乎在同一时间更新。Stable Diffusion XL 0.9发布,新版本生成的图片更加逼真,更有质感,可以正确生成人类五指。Midjourney5.2震撼发布,能够像相机一样变焦、填充…

ChatGPT将代替60%的Android岗位……

移动端已凉,更多的是一种焦虑情绪的表达,市场确实不太好,但这并不是针对移动端,是整个互联网行业衰败的表现而已。 但要说整个IT行业的移动端已凉有点过了,IOS都还没说话呢,Android凑什么热闹?…

“字节一年,人间三年!”

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号,领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇:ChatGPT研究框架(80页PPT,附下载)…

随便聊聊 顺便晒一下我的听歌设备

作者:ChenZhen 博客地址:https://www.chenzhen.space/🌐 版权:本文为博主 ChenZhen 的原创文章,本文版权归作者所有,转载请附上原文出处链接及本声明。📝 如果对你有帮助,请给一个小…

前端已死?我看未必,但「低代码」已剑指前端程序员

本文笔者会从以下几个方面分享,希望能够帮助正在迷茫的前端小伙伴提供一点思路! 逛技术博客 不局限框架 全栈工程师兴起 关注前沿 写技术文章 录制前端视频 总结 2023第一季度快过去了,没工作的找到工作了吗?有工作的加薪了…

详细解析张雪峰老师对计算机专业的评价“进可攻,退可守”--【职场篇】

文章目录 张雪峰的评价计算机行业类的总结性指示就业面宽本科也不太卷的方向进可攻,退可守另一个就业出口--培训 就业总结导图持续学习,技术过人 总结 张雪峰的评价 计算机行业类的总结性指示 “就业面宽,进可攻,退可守&#xff…

太卷了!

大家好!我是韩老师。 前几天,我给大家分享了微软开出的新职位: 微软招人啦!微软招前端了! 没想到,昨天看到同事说 Azure HDInsight 的两个hc已经招满了: 相比于从前,这也太快快快快了…

ChatGPT官宣数学能力再升级,网友:终于精通十以内加减法了

来源:机器之心 本文约3000字,建议阅读5分钟 随着 ChatGPT 热度一直不减,OpenAI 持续拓展其能力。同时,ChatGPT 的竞品不断涌现,如何更准确检测其生成文本也成为了近来学界的一大研究课题。 自 ChatGPT 发布以来&#x…

太卷了,前后端程序员都开始学习ChatGPT开发偷偷赚米了

最近发现身边的做开发的程序员朋友,都在学习ChatGPT开发,一个做后端的朋友告诉我,学习ChatGPT开发只用两三天时间就够了。更神奇的是,连做前端开发的小伙伴也开始学起了ChatGPT开发。我想说,这么卷,你们老板…

微信小程序获取手机号功能将收费

我是卢松松,点点上面的头像,欢迎关注我哦! 据知情人士透露,继企业微信加好友数量需要收费后,“小程序获取手机号组件”即将迎来升级并开启“收费”模式。下图是价格表: 升级前后组件的样式对比&#xff…

微信小程序开发费用一览表 微信小程序制作费用是多少钱

总的来说,微信小程序定制开发的报价影响因素有功能繁简程度、开发技术难以程度、人工成本以及开发周期、项目整体服务类目的多少,一般的报价分析都是从这个几方面去入手。 1、对开发需求方案的分析 2、对技术实现方案的分析 3、开发团队的人工成本投入 …

小程序开发费用一览表,如果你也想要用低成本制作出自己的小程序,来了解一下!

近几年来微信小程序的发展的十分的迅速,越来越多的用户对小程序已经非常熟悉,同时很多商家都看到了小程序的商机,其中小程序商城更是受到众多用户和商家的欢迎。 制作小程序商城主要的方式有两种,一种是源码定制开发,一…

花3万买的大学申请文书,竟和ChatGPT写的一样?

正值高考毕业季,留学出国又成热门话题。眼下,选学校、写申请书是不少学生头等大事。在AI如火如荼的今年,这个老行当却有了新变化。 当学生纷纷用AI写申请书,留学机构开始缩减业务,中介用AI写文书“糊弄”学生&#xf…

ChatGPT智能生成论文,“灰色行业”正在经受打击

自从ChatGPT于去年发布以来,各种关于人工智能的讨论就层出不穷,其中的焦点之一就是人工智能会取代哪些职业。而最近一个大家比较熟悉的职业就受到了ChatGPT的影响,它就是“灰色行业”——代写。 虽然代写行业一直被视为作弊行为,欧…

上下文-Context

Context的作用和意义 Golang这个语言最大的一个优势就是拥有一个高并发利器:goroutine,它是有Golang语言实现的协程,有了它就可以实现高并发请求,但有了大量的协程后,就会带来一些问题,比如: …

【HelloKitty团队项目】Beta阶段项目展示

项目内容这个作业属于哪个课程2023北航软件工程这个作业的要求在哪里团队项目-Beta阶段项目展示我在这个课程的目标是学习软件工程技术,完成团队开发流程这个作业在哪个具体方面帮助我实现目标Beta阶段开发 (一)项目亮点 一、项目管理 团队…

对垃圾收集器一脸懵B,看这篇就对了|金三银四系列

本文详解了7种垃圾收集器,文章很干,适合用来面试前复习。建议收藏再看! 点击上方“后端开发技术”,选择“设为星标” ,优质资源及时送达 上一篇文章讲了垃圾回收算法,它是内存回收的方法论,垃圾…

【HelloKitty团队项目】Alpha阶段项目展示

项目内容这个作业属于哪个课程2023北航软件工程这个作业的要求在哪里团队项目-Alpha阶段项目展示我在这个课程的目标是学习软件工程技术,完成团队开发流程这个作业在哪个具体方面帮助我实现目标Alpha阶段开发 一、项目亮点 项目管理 团队是如何进行项目管理的&am…

springboot使用aop切面统一处理查询不同接口中接收的请求体,实现多条件分页查询

目录 需求描述 前端ajax请求调用查询接口示例 准备工作 引入相关依赖 实体类 controller层 service层接口 service层实现类 mapper层 mapper.xml中的selectAll复杂动态sql 控制层切面 工具类MyUtils 通用类DataVO 发送请求查看响应结果 ajax请求体 响应内容 关…

chatgpt赋能python:Python如何阻止弹窗

Python如何阻止弹窗 Python是一种高级编程语言,它具有广泛的应用和丰富的库。它还可以被用于开发自动化程序,包括阻止弹窗。在本文中,我们将介绍如何使用Python阻止弹出窗口,并探讨防止弹窗的原因。 为什么要防止弹窗&#xff1…