OpenAI 人工智能绘图工具 DALLE 好用吗?

用朴素的语言,还原你天马星空的想象。

f539246718e9cdd3d4f555618293cc60.png

喜悦

早上,终于收到了 OpenAI 的通知 —— 漫长的排队后,我可以用 DALLE 了。

afe8c7160e233eda0eb4e0e1337dd8eb.png

这款人工智能绘图工具让我种草了多长时间?其实都快忘了,哈哈。查了一下,我是 4 月 7 日申请的,到被批准差不多 100 天吧 😂

30cd3609dc389c646e243bf189e631df.png

激动的心,颤抖的手,我赶紧按照信件提示,点链接进去。欢迎我的,是这样一个霸王条款:

eb4502405ad0a57792b505b5d546ff22.png

DALLE 生成的图片,严禁商用,更别提上 NFT 交易了;而且 OpenAI 对于我创作出来的图片拥有所有权。用户只对「自己上传到系统的图片」有所有权。但是,为了改进模型,人家可能还要用你上传的图片作为训练数据……

搁以前我的脾气,早就扭头走人了。但是这回不行,DALLE 的吸引力太大,而且前面沉没成本较高。忍一忍吧。

尝试

我进入 DALLE 后,发现页面非常清爽,只有一个文本框。

735457d94d29566b1d85618cf1574a43.png

我在其中输入了这样一段描述文字:

a kung fu panda is fighting with a T-rex in the woods

应用自动开始工作,通过训练好的大模型来进行图像生成。等候过程中,会有一些提示和样例。

例如这个:

151c96bb7ea56b40575c39ae2f968546.png

进度条往后走,还有这样的提示:

45a5d38a1675c8037846fdd67604a109.png

这些不断变化的提示,既缓解了用户焦躁等待的心情,同时还帮你改进后续的内容输入方式。这种一举两得的方式,值得其他应用借鉴。

几十秒钟之后,进度条终于挪动到头儿了,于是我看到了生成的结果,一共 6 张图片。我一一点进去。

其中这张很不错:

aef6af7f24a620a5f72052809c25551c.png

这张嘛,也还行:

1150eb316fc6ed86e4b6b5e09bb71f98.png

最搞笑的,是这张:

bd464de23afccdb5960d8c1a7e4c5b32.png

喂,你拿恐龙当玩具吗?

这是 6 张图片的全景。你更喜欢其中哪一张呢?

5d0c19cb72e943b630b49c5db63b81e8.png

我正玩儿得不亦乐乎,大儿子进来了。他刚放假,最近在和弟弟养小鸡。于是他出的题目自然是:

Two little boys, teasing two fluffy chicks

DALLE 做出来的结果,他不是很满意。

772a47ef7a52e4e8e9ec2d5b5f25f207.png

因为这俩小孩儿,看上去明显是外国人嘛。于是我帮着修改了一下描述:

Two little Asian boys, teasing two fluffy chicks

2879d23a2a271d39823600efca8d39f2.png

嗯,这回看起来好多了。

对比

其实,这已经不是我第一次为你介绍人工智能自动绘图工具了。

还记得吗?去年那篇《如何把你的想法一键变成图画?[1] 这款工具的绘图能力。

下面咱们来对比一下 Text to Image Art Generator[2] 和 DALLE 对同样的文字绘制图像结果的差别。

这是第一句:

a small boy on the shark in deep ocean

Text to Image Art Generator[3] 当初绘制的图形是这样。

0f70044017deb6415b78b07d097e003f.jpeg

我把同样的内容,输入到了 DALLE ,咱们再来看看。

ffcaff6c7f67711d025ce558cc8477c0.png

果然是「没有对比就没有伤害」啊,哈哈。当时的文章里,还有一句话,是:

a t-rex playing in olympics 100 meters running game

Text to Image Art Generator[4] 做的图是这样的:

41514114e90efda98b4551f5087ec260.jpeg

咱们看看同样的话,在 DALLE 里面是啥样?

9e3f47be054e2e50d97b0c94b4997c48.png

我现在只能用「不可同日而语」来形容二者之间的差距了。

顺便,我也想对比一下前些日子非常火的 Disco Diffusion 和 DALLE 的区别。

刚开始用 Disco Diffusion 的时候,我做了不少测试。其中写过这样一段:

a beautiful landscape painting of A wizard in black robes, and a Tyrannosaurus rex in a fierce battle in the primeval forest. a 9-year-old boy and a 5-year-old boy are watching them in the corner.

这是当时 Disco Diffusion 在 Google Colab 里经过几十分钟生成的结果:

593567ed47e628c45f48dd303f9e3df8.png

而这,是 DALLE 几十秒内画出来的:

1f5f8078341099c05a4dea59c03fc07f.png

好吧,再来对比另外一组:

A comic with a robot wearing a cowboy hat in the center is painting a landscape on a drawing board. The right side of the painting has a creek running through it, with mountains and sunset in the distance in the background by Pablo Munoz Gomez Trending on artstation

这是 Disco Diffusion 的结果,够抽象的。我要不说,你能看出是机器人画家在作画吗?

c1eea6051282aa7ddb126dc678104d45.png

而这,是 DALLE 的绘图:

5fe9710791cf3fd30efb28c19740ffa3.png

其中,我最喜欢的是这张。

a9417f12c0251bef21bc2032dd588440.png

你喜欢哪张?

图片生成图片

除了文字生成图片以外,注意文本框下面还有一行小字儿 —— 你可以上传图片,然后由 DALLE 进行调整生成新的图片。

7857fb93602f263d3d966ef87832c498.png

我尝试了几张图片。发现并不是所有图片都可以。例如说图片里面包含人脸,就不行。

人脸不行,咱们就试试牛脸好了。我上传了一张水牛的照片。然后 DALLE 生成了另外 5 张图。

23024c4733b1b7d5d7b2a81237299866.png

我觉得其中第 3 张最为有趣。

6f9aa5598e92cbdee7828435b3beabc5.png

因为它包含了原始图形中根本没有涉及的角度。可以看得出来,这种图片生成可不只是旋转、镜像这种低级简单操作。

挑战

我给你不厌其烦展示这种机器作画的能力,并不是显摆「看我电脑画得多棒」,或跟你鼓吹「艺术家要失业了」之类的危言耸听。

艺术家不会失业。他们会和 AI 联合,把工作做得更高效,进一步挑战人类创造力的边界。

但是,DALLE的绘画能力,展现了一些潜在的挑战,我们可能需要注意。

首先,那些从事非艺术的绘画创作的人(例如低等级的插画师),可能会遭受到职业危机。

原先如果你需要一个特定的图画,又没有现成的,也许就需要找人来绘制。绘制的效果不一定要多么艺术,但是得美观能用,符合要求。所以只要你会画画,又对报酬没有过高的要求,总有一些生存的空间。

但是,现在只要有了想法,我用文字写出来,就可以由人工智能画出。我对这些图画,也没有啥太高的要求,够用就行。例如今天早上,为了给知识星球的新文章弄个题图,我直接让 DALLE 绘制了这样一副场景:

a highly intelligent robot finding things among different databases, digital art

然后嘛,下面这些题图就能用了。

954db3e1d7659b74457f606208a771f6.png

我前面提到过,DALLE生成的图片,版权依然是个问题。如果你把机器生成的图片用作商用,DALLE 并不适合。不过好在技术的进步,会带来更快的迭代速度,和更好的绘画质量。而且根据以往的经验,随着热度提升,先进技术还会迅速扩散。我们可以期待,后续会有更多类似 DALLE 的人工智能绘画服务,便宜、好用,而且没有那么多的霸王条款。

而另外一件事情,可能带来的挑战更为剧烈一些。

我思考这个问题,是因为前些日子我们学院主办了一次《数据分析与信息服务发展国际会议》。

7b9525d893c26130a809a2ff4c8bf31f.png

其中一位主讲嘉宾 Daniel E Acuna 提出了科研伦理中的典型问题——图片抄袭。你在新闻报道中可能已经听说过,不少很多论文的抄袭、剽窃都是用图片对比来发现的。

a59da31607e12f285d83c7e8321137b8.jpeg

(图片来源:Mazaheri et al., 2021)

你可能会感到奇怪,为什么这些作者非得要原封不动像素级拷贝别人论文的图片呢?这是因为,科研中的证据照片(例如显微镜观察到的)或分析结果绘图要想「无中生有」,其实挺困难的。诸多因素牵扯,使得你「生造」图像的话,很容易会被专业人士识别出来。

因此更多人的铤而走险,选择的方向是把已经出现在图片里面的元素,稍加改动或者干脆拷贝粘贴。他们的侥幸心理作祟,期盼别人发现不了这张图和原图之间的联系。

3e956d9750cd6af82611424a78a1eef5.jpeg

(图片来源 t.ly/D6PH[5]

我在想,DALLE 这样强悍的工具出现,对于学术论文插图的剽窃甚至造假活动,会意味着什么?

在很多领域,例如生物、医学,都有大量的图片和它们对应的文字描述。难免有人出于种种目的,把这些内容进行采集,并且微调 DALLE 这样的图像生成模型。在并不遥远的将来,他完全可以瞒天过海,仅用自己的语言描述,就把想要的结果直接变成制式、风格全都无懈可击的「新」照片或图形。或者直接上传原始图片,用语言进行调整修改,结果会让原论文作者自己都认不出来。这些操作,将给研究结果真实性和原创性审核带来严峻的挑战

有什么好办法来应对吗?我没有进行深入研究,无法回答。目前我能想到的,也就是用技术对抗技术。只有同样见多识广的模型,才能打败这种违背学术道德的「无中生有」。咱们拭目以待吧。

小结

本文我为你介绍了自己试用 OpenAI 的 DALLE 这款人工智能绘图应用的结果,以及一些涌入头脑的思考。面对新的科技浪潮,拥抱比排斥往往更为明智。尽管面对潜在的挑战,我们可能需要做好准备,以免使自己的生活,乃至于科学界的公序良俗遭受到冲击。

你有没有尝试这些近期高速发展的人工智能绘图应用?你觉得效果如何?有什么想要赞叹或吐槽的?欢迎留言,我们一起交流讨论。

祝(人工智能)绘图愉快!

感觉有用的话,点赞 +「在看」,把它转发给你身边有需要的朋友。

订阅我的微信公众号,加星标,避免错过新推送提示。

欢迎关注我的视频号,时常更新。

6c8ba71adf9c2e163f28e0c47830f9e8.jpeg

欢迎来知识星球,查看已经积累下的数十篇精华帖子。更欢迎你提出自己的好问题。

ff6c8694df53a5836ac6043a2d55ff09.jpeg

由于微信公众平台的限制,文中部分链接可能无法正常显示与跳转。如需访问,请点击文末「阅读原文」链接,查看链接齐备的版本。

延伸阅读

  • 【视频】临时笔记(Fleeting Notes)的记录与加工

  • 【星球精选】Obsidian 中的 excalibrain 插件:免费的 theBrain ?

  • 如何更高效用 Roam?免费分享 Roam Untangled 作者 Jamie Miles 的几个小技巧

  • 如何安装 Python 运行环境 Anaconda?(视频教程)

  • 如何用 Python 和决策树预测广告点击行为?(云环境视频教程)

参考资料

[1]

如何把你的想法一键变成图画?: https://mp.weixin.qq.com/s/E_rN2ZhuP2AOrSn5HCuoTA

[2]

Text to Image Art Generator: https://creator.nightcafe.studio/text-to-image-art

[3]

Text to Image Art Generator: https://creator.nightcafe.studio/text-to-image-art

[4]

Text to Image Art Generator: https://creator.nightcafe.studio/text-to-image-art

[5]

t.ly/D6PH: t.ly/D6PH

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27796.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web在线聊天室(完结) --- 注册用户+ip地址

注册用户 注册用户接口设计前端异步回调ajax函数编写servlet实现注册业务逻辑操作数据库插入新用户实现效果 项目发布地址 注册用户 接口设计 请求: POST /register {name: xxx,password: xxx,nickName: "蔡徐坤",signature: "我擅长唱跳rap篮球", } 响应…

IP获取方法二:太平洋网络IP地址查询Web接口

接口列表: (1)ip.jsp(2)ipJson.jsp(3)jsAlert.jsp(4)jsDom.jsp(5)jsFunction.jsp(6)jsLabel.jsp(7)jsWrite.jsp(8)whois/index.jsp(9)ipAreaCoord.jsp(10)ipAreaCoordJson.jsp 接口参数:param ip:可指定IP地址,不指定则取request.getRemoteAddr()的值。…

从APNIC获取中国IP地址列表

关于APNIC 全球IP地址块被IANA(Internet Assigned Numbers Authority)分配给全球三大地区性IP地址分配机构,它们分别是: ARIN (American Registry for Internet Numbers) 负责北美、南美、加勒比以及非洲撒哈啦部分的IP地址分配。同时还要给全球NSP(Netw…

使用IPIP.net识别客户端真实访问地址,具体到国家,省,市

这个IP库实测还是比较准确的,免费版的可以具体到国内城市,国外只能到国家名称,免费版的自己定期更新Ip数据库即可。 以下为C#调用代码 class Program{static void Main(string[] args){try{//传入要查询的ip 和17monipdb.datx 下载的ip库所在位置string address …

Google 以图搜图 - 相似图片搜索原理 - Java实现

前阵子在阮一峰的博客上看到了这篇《相似图片搜索原理》博客,就有一种冲动要将这些原理实现出来了。 Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相似的图片。 打开Google图片搜索页面: 点击使用上传…

GPT-5紧急叫停?千名专家联名呼吁,AI技术的未来又该何去何从?

在半个月前强势上线的GPT-4 ,以其强大的性能再次掀起了一波关于人工智能技术的全民热潮。但GPT-4太强了,强到发指,不止群众恐慌,北京时间3月29日,全世界的 AI 大佬们纷纷出手,千名专家发表公开信&#xff0…

这次彻底搞懂 Redis,超详细总结!

作者:wugongzi 来源:https://www.cnblogs.com/wugongzi/p/16827473.html Redis 基础 如果对 Redis 还不了解的同学可以先看一下这篇 https://www.cnblogs.com/wugongzi/p/12841273.html 这里面介绍了 Redis 是什么,以及怎么用。 Redis 管道 我…

《花雕学AI》35:如何一次性和17个AI聊天机器人交流?ChatALL让你轻松实现

聊天机器人,也称为对话机器人,是一种能够通过自然语言与人类进行交流的人工智能系统。聊天机器人的应用领域非常广泛,从客服、娱乐、教育、医疗、社交等,到科研、商业、政治、军事等,几乎无所不包。随着深度学习和自然…

一个程序员的成长之路

学习笔记 java基础类型与String相关基本类型范围基本类型的转换byte计算自动转换int基本类型与包装类equals与的区别 集合比较与常用集合原理反射机制与真实使用场景动态代理与使用范例异常类加载机制与热加载实现与反编译内存模型与threadLocal与syncronizejvm的GC与调优处理J…

【Idea】人工智能编程他来了,Idea集成一款和ChatGPT一样智能的编码辅助神器

文章目录 简介官方介绍功能介绍 注册使用使用方法功能说明 结尾 简介 Bito是一款建立在OpenAI和ChatGPT之上的开发辅助神器!他可以帮我们生成代码、语法提示、生成测试用例、解释代码含义、生成注释、优化代码、检测代码安全性以及学习理论知识等!我们可…

澎湃新闻对话腾讯丁珂:从“治已病”到“治未病”,企业需快速构建“安全免疫力”

作者:澎湃新闻记者 周頔 随着数字化进程加快,企业数字化体系的边界在不断拓展,安全风险和挑战不断增加,传统被动防御的安全应对常显疲态,数字安全时代亟待建立全新的安全范式。 6月13日,腾讯安全联合IDC等…

2023年大学生就业怎么样?双一流高校就业率仅15%,到底是咋了?

2023年,大学毕业生就业状况如何,一直是社会关注的焦点。尤其是中国的双一流高校,以其优越的教学与研究背景和实力,被众多年轻人视为就业的理想选择。 然而,在最新的统计数据中,这些一流高校的就业率却惊人…

Chat GPT 的上线,网络安全问题已经显现

前言 Chat GPT已经发布了,一位不知名的作者将它的孪生兄弟“DAN”就在世界上最黑暗的暗网上线了。 这个黑化的GPT刚刚上线的一周后,就已经有组织利用“DAN”犯罪了。 他们利用虚拟电话号码注册各种交友平台的账号,然后再模仿有魅力的男女人…

媒体专访|知道创宇黑哥:视野和格局将决定网络空间测绘的未来!

日前,网安专业媒体安全牛【牛人访谈】栏目专访了知道创宇CSO黑哥(周景平)。 围绕知道创宇出版的新书《网络空间测绘技术与实践》,安全牛分析师与黑哥就网络空间测绘技术当下的应用与挑战、未来的发展与创新进行了对话与交流。 以…

《花雕学AI》比尔・盖茨:AI 和 ChatGPT 可以改善人类生活,但也要防止滥用和危害

3月21号,微软创始人比尔盖茨,发表最新AI文章《人工智能时代已经开始——人工智能与手机、互联网一样具有革命性》,文章中表示:「自1980年首次看到图形用户界面(graphical user interface)以来,O…

速下载|2023上半年网络与数据安全法规政策、国标、报告合集

随着国家数字经济建设进程加快,数据安全立法实现由点到面、由面到体加速构建,目前我国数据安全立法已基本形成以《网络安全法》《数据安全法》《个人信息保护法》《密码法》等法律为核心,行政法规、部门规章为依托,地方性法规、地…

ChatGPT进军网络安全,安全从业者将会被取代?

在ChatGPT爆火之后,微软宣布推出基于ChatGPT的“安全副驾驶”产品,宣称将“帮助防御者以机器的速度和规模进行端到端防御。” 网络安全是人工智能最大的细分市场,而ChatGPT又是引领当下人工智能技术革命的“核弹级产品”,在网络安…

C#与西门子PLC通信通过S7.NET

前言: S7.NET支持连接S7-200SMART,S7-1200,S7-1500,S7-300,S7-400PLC,只支持西门子系列PLC,而且连接方式要是profinet通信 一,引用S7.NET的dll文件 二,using S7.Net; 三,实例化PLC 如果是连接PLC SMART200,CPU.Type直…

利用NetToPLCsim将西门子PLCSIM变成一个真实PLC,实现与录波软件、HMI软件等的通讯

学习西门子PLC的朋友们对于西门子的S7-PLCSIM软件都不陌生,当我们安装了该软件后,在STEP7或者博图的面板中就多出了一个仿真的按钮,点击该按钮,就会调出仿真软件S7-PLCSIM软件,将当前的PLC项目下载进去。启动该仿真PLC…

博途仿真PLC与第三方客户端通信

NetToSimPLC使用 在缺少PLC硬件的情况下,我们可以借助PLC模拟器(西门子)PLCSim做一些简单程序测试。但是除了PLC程序本身需要测试以外,PLC之间的通讯和PLC与HMI、SCADA的连接也是需要调试的。在缺少硬件的情况下, 往往…