Midjourney 能识图了,这是个好事儿吗?

ae6be2245442bfe9055ecb14e8dc5f27.jpeg

进化

前些日子,有人发了这样一张图,揶揄现在的 AI 检测器。说是「魔法战胜了魔法」。

af2c9a9d9703547ea69f7eed922cde6c.jpeg

这张图,是用 AI 生成的。但是 AI 检测器显然没有发现。在它看来,这张图片「天然成分」有93%;人工智能生成的可能性,只有7%。

这是个错误的判断,但是我们也不要因此嘲笑 AI 。毕竟你第一眼看到这张图片时,真的能分辨出这是 AI 画出来的吗?

当然了,要控制 AI 绘图结果,还是有一定门槛的。要不然也不会有 prompt (提示语)交易市场 的存在。

一个好的提示语可以卖出很多份,每份也够一顿午餐的钱。所以,这个职业,确实也给不少人提供了赚钱的机会。

5acbe503546dad2b34b483558302e8dc.jpeg

然而,就在今天,情况陡然发生了变化。Midjourney 又一次进化,支持了一个新的功能,叫做 /describe 。

这个新功能一经发布,一石激起千层浪。AI 绘画领域的爱好者们立即展开了尝试,随后就是声浪巨大的讨论。

这功能是干啥用的?

简单来说,你给 Midjourney 一幅画,它立即把对应的 prompt 给你写出来。这样一来,你可以用 prompt 绘制类似的图片,或者依照自己的意思,对图片中的元素进行微调。

常言道「光说不练假把式」,我这就给你做个测试。

尝试

我从网上搜来了一张爱因斯坦的照片,不是很清晰。

9d08526c28bd1a8f5752e7d091b603d5.jpeg

(图片来源:网址)

然后我就把这张照片丢进了 Midjourney 的 /describe 功能界面。

16d82907ad725a4a831e17d08bcc0db9.jpeg

很快,Midjourney 的 prompt 就生成完毕了。有 4 个备选方案。

473c642bd1a8dc7e5250a871f65a3f45.jpeg

提示语列表是这样的:

  • the scientist albert einstein in front of a blackboard, in the style of victorian-era clothing, associated press photo, automatism, youthful energy, light green and light brown, black and white mastery, tesseract --ar 3:4 (阿尔伯特·爱因斯坦科学家站在黑板前,穿着维多利亚时代的服装,与自动主义、青春活力、浅绿色和浅棕色、黑白精通以及四维超立方体相关。这是一张美联社的照片,画面比例为3:4。)

  • the albert einstein lecture, circa 1927, in the style of portraitist extraordinaire, tesseract, barbizon school, lighthearted, dignified poses, light green and light black, distinctive noses --ar 3:4 (阿尔伯特·爱因斯坦的演讲,大约在1927年,以肖像画家特瑟拉克、巴比松学派、轻松庄重的姿势、浅绿色和淡黑色为风格,鼻子突出--AR 3:4。)

  • a black and white photo of albert einstein, in the style of light green and brown, witchy academia, barbizon school, untrained, untrained, dark indigo and yellow, emile claus --ar 3:4 (一张阿尔伯特·爱因斯坦的黑白照片,风格为浅绿色和棕色的巫术学院、巴比松派、未受过训练的暗靛蓝和黄色,埃米尔·克劳斯--ar 3:4。)

  • the albert einstein collection, in the style of creative commons attribution, frances macdonald, youthful energy, neo-academism, associated press photo, chalk, american barbizon school --ar 3:4 (阿尔伯特·爱因斯坦收藏,采用创意共享署名风格,弗朗西丝·麦克唐纳,青春活力,新学院主义,美联社照片,粉笔画,美国巴比松学派--ar 3:4)

我想你已经猜到了,上面提示语里的中文,也是 ChatGPT 翻译出来的。

看看这些详细到琐碎风格描述,如果没有 Midjourney 的描述,我这个艺术门外汉不可能会形容的。

上面图片下方有 4 个选项,分别对应不同的提示语。

咱们先试试第一个好了。这是绘制的结果:

c08ed8767dfb7a7ec9bd99b02283a413.jpeg

虽然跟原作比起来有不小的差异,但是爱因斯坦的辨识度没问题,对吧?而且你看下面的大图,照片也清晰多了。

04d2c9fd80faba0a904cbce3ffe27faf.jpeg

这是第二组,辨识度依然非常高。只是背景被消除了。

e9891cfcdab0dc8b75c8c4d42662e2e2.jpeg

下面是第三组,场景更换了。

a6e4ddfefffecff04343a280e1864689.jpeg

我更喜欢其中的第三张,真的好像一张老照片的样子。我说不出来哪儿好,但就是觉得「顺眼」,哈哈。

下面这 4 张,就颇为「艺术」了,我没有相关知识储备,就不予置评了。

cce15ba290f6e396157b7036ea109178.jpeg

总体而言,你觉得画得如何?

我在朋友圈里看到不少人惊叹,说以后付费图库生意恐怕不会像从前那么红火了。

但是,这还只是问题的一部分。很自然就有人继续联想 —— 既然有了 prompt ,那么就有了快速微调的可能。调整图片改变意思,门槛非常低。

例如我拿出来了第一个备选 prompt ,然后恶作剧一般加上了三个单词 holding an iPhone,提示语成了这样:

the scientist albert einstein in front of a blackboard holding an iPhone, in the style of victorian-era clothing, associated press photo, automatism, youthful energy, light green and light brown, black and white mastery, tesseract --ar 3:4 --v 5(阿尔伯特・爱因斯坦科学家站在黑板前,手持 iPhone,穿着维多利亚时代的服装风格,与自动写作、青春活力、浅绿色和浅棕色、黑白掌握以及四维超立方体相联系 --AR 3:4。)

而画出来的图片,就成了这个样子:

5c21f9c697f609fab1057f9d71025340.jpeg

我觉得图 1 最为自然,你觉得呢?

这还不算完,下面咱们尝试使用第二组 prompt,只不过我又加了几个词,这次我不说,你自己找:

the albert einstein lecture, holding a cat, circa 1927, in the style of portraitist extraordinaire, tesseract, barbizon school, lighthearted, dignified poses, light green and light black, distinctive noses --ar 3:4 --v 5 (阿尔伯特・爱因斯坦在 1927 年左右拿着一只猫做演讲,风格类似于画家 Tesseract 的巴比松学派作品,姿态轻松庄重,颜色为浅绿和浅黑,鼻子很有特点。--ar 3:4 --v 5)

画出来就这样了:

8ce0c009908d2f804222e767026c65da.jpeg

你喜欢其中哪一张?

有人迅速脑补了这种方案的应用场景,然后说以后照片都信不得了。随便加点儿内容,虚假信息就「有图有真相」了。

你觉得真有那么严重吗?

进一步测试

咱们不能凭空臆断,还是做个尝试吧。

拿别人举例子似有不妥,还是用我自己的照片好了。

我把自己的标准照扔了进去。

183dded1619c282a735aa3d8f972b718.jpeg

很快,Midjourney 反馈给我以下的候选 prompt 。

a4baafb6c73e48f8479b11eed7479261.jpeg

  • a young chinese businessman in a blue suit, in the style of jindrich styrsky, light beige and purple, dain yoon, photo taken with provia, portrait, huang guangjian, smilecore --ar 2:3(一位年轻的中国商人穿着蓝色西装,风格类似于金德里希·斯特尔斯基(Jindrich Styrsky),衣服颜色为浅米色和紫色,照片使用Provia拍摄,是一张肖像照片。他名叫黄光健,面容微笑。--ar 2:3)

  • jia hua, xsix enterprises marketing manager, in the style of white background, high quality photo, dark gray and blue, skillful lighting, human connection, grand manner, panasonic lumix s pro 50mm f/1.4 --ar 2:3(嘉华,XSIX企业市场经理,在白色背景、高质量照片、深灰和蓝色风格下,技巧娴熟的光线处理,人性化连接,大气的方式展现了松下Lumix S Pro 50mm f/1.4 --ar 2:3。)

  • businessman wearing a blue suit with a smile, in the style of oshare kei, photo taken with provia, portraits with soft lighting, chinese iconography, ue5, poetcore, white background --ar 2:3(穿着蓝色西装微笑的商人,风格为oshare kei,使用provia拍摄的照片,柔和的灯光下的肖像,中国图案设计元素、ue5、诗人核心主题,在白色背景下--宽高比2:3。)

  • david luan, thai man, shanghai office, in the style of white background, nikon d850, oleksandr bogomazov, dark white and blue, salon kei, studio portrait, 32k uhd --ar 2:3(大卫·鸾,泰国人,在上海办公室工作,以白色背景为风格,使用尼康D850相机拍摄,奥列克桑德尔·博戈马佐夫(Oleksandr Bogomazov)的黑白和蓝色调,Salon Kei(沙龙Kei)的工作室肖像照片。32K UHD--AR 2:3。)

这几条提示语,真的把我给看乐了 —— 为啥还要坚持给我起个不认识的名字啊?而且,我哪里像泰国人了?

算了,不管它,开始画就好。这是第一张的绘图过程记录。

7136b416b13ee4c447ec1776590c72f6.jpeg

这是绘制的结果:

5c3b711eff727915ba1d6e4454e2ab56.jpeg

小伙儿挺帅啊,可惜不像我啊!😂

这是第三组:

0193c2d82a2c804c76de22dfcefd4f99.jpeg

怎么看,怎么觉得第二张眼熟,好像在哪儿见过啊。

第四组:

64d65f13c8d369668f55a56d76400785.jpeg

看来,似乎 Midjourney 真的把我画成了泰国人。

你问我第二组哪儿去了?

别着急,在这儿呢:

41a1d3446ad874e6e26bc408bec38bca.jpeg

这姑娘挺漂亮的。可是这「图片到 prompt 再到图片」的还原度,也太离谱了吧!

虽然画的人物就没有一个像我的,但是 prompt 里面似乎确实把握了「肖像照」的精髓。是吧?

那么,有没有可能利用「肖像照」的场景设定,再把人物画得更加相似一些呢?我于是又展开了进一步的尝试。

混合

这一步尝试的方法,是借用《如何用 Midjourney 绘制你自己的皮克斯风格头像?》这篇文章里给你展示过的方法,把原始图片链接加入到提示语中,并且加大原始图片的权重。

我觉得上面第三组提示语效果更符合预期,于是就用它来改造。在提示语的最前面,我加上了原始图片链接,然后加上了 --iw 1.5 参数,以提升原始图片权重。

https://media.discordapp.net/ephemeral-attachments/1092492867185950852/1092724565811146822/small.jpg?width=406&height=610 businessman wearing a blue suit with a smile, in the style of oshare kei, photo taken with provia, portraits with soft lighting, chinese iconography, ue5, poetcore, white background --ar 2:3 --iw 1.5

这是绘制的结果:

bb5fb24d2406d3b78f016155775dcdb6.jpeg

我觉得,除了不像自己以外,没啥大毛病。于是我决定继续加大原始图片权重,把上面提示语中的 --iw 1.5 替换成 --iw 2 ,这已经是最大取值了。

https://media.discordapp.net/ephemeral-attachments/1092492867185950852/1092724565811146822/small.jpg?width=406&height=610 businessman wearing a blue suit with a smile, in the style of oshare kei, photo taken with provia, portraits with soft lighting, chinese iconography, ue5, poetcore, white background --ar 2:3 --iw 2

这次绘制的结果,是这样的:

038a9c3d610d71fc26332cdeb17a3849.jpeg

看着都挺眼熟,只是…… 不像我啊。

你觉得呢?

到这里,我会不会很失望呢?不,我稍稍放心了。

至少在近期,要想拿我这样普通人的照片加以修改,还让别人看不出来,门槛足够高。

当然,这样的阶段能维持多久?我没有任何信心。

讨论

看到这里,你可能会有个疑惑:

为什么爱因斯坦的原始照片这么不清楚,绘制出来却怎么都像;我用了自己的清晰标准照片,一个劲儿尝试增大原画权重,却怎么都画不像呢?

其实从 Midjourney 自动生成的 prompt 里面,你不难看到一些端倪。回顾一下,这是爱因斯坦的:

d7ff827a71e7b937d1f29eff8b8dd4a1.jpeg

这是我的:

c1dd7f05735ac707411e9f47d97d5789.jpeg

两相对比,你不难发现,爱因斯坦的名字,Midjourney 给出提示语中是自动识别的。而我呢?Midjourney 发现,这家伙是个 nobody ,随便给他起个名字好了,嘉华或者大卫・鸾叫啥都成(估计就相当于「石头」和「狗剩儿」),甚至有的条目干脆连名字都懒得起了。

这个差别看似不起眼,但是很能说明问题。因为许多图片领域的大模型,训练时都使用了一个 58.5 亿张的图片文本对应数据集,叫做 LAION-5B。

0616e41c4479cf0e6569508a531ca1e4.jpeg

这图片数据里,什么种类都有。爱因斯坦在里面出现过,所以模型对他老人家记忆深刻,一个名字就能唤起。当然,还有很多名人,甚至是如今的体育明星,Midjourney 也都熟悉。

所以,你知道现在谁最担心 Midjourney 搞怪了吧?

反正不是嘉华或者大卫・鸾。你说是吧?

小结

这篇文章,我给你介绍了 Midjourney 新功能 —— 用图片自动生成提示语,然后绘制或微调类似图形。通过咱们演示的实验步骤,你应该已经观察到了它的能力和不足。你是不是已跃跃欲试了?

如果你能把自己的标准照用 Midjourney 绘制得惟妙惟肖,欢迎把提示语和技巧分享给大伙儿。AI 快速发展的当下,咱们一起学习进步。

点赞 +「在看」,转发给你身边有需要的朋友。收不到推送?那是因为你只订阅,却没有加星标

欢迎订阅我的小报童付费专栏,每季度更新不少于10篇文章。目前价格优惠。

507b95e736ea48f9ab610da04e24ee37.jpeg

如果有问题咨询,或者希望加入社群和热爱钻研的小伙伴们一起讨论,订阅知识星球吧。不仅包括小报童的推送内容,还可以自由发帖与提问。之前已经积累下的帖子和问答,就有数百篇。足够你好好翻一阵子。

2cd76cb4dfca8f94679f7ed5b5f24b4e.jpeg

若文中部分链接可能无法正常显示与跳转,可能是因为微信公众平台的外链限制。如需访问,请点击文末「阅读原文」链接,查看链接齐备的版本。 

延伸阅读

  • AI 帮我找卡片挺好,但能不能帮我创作出新的相关卡片啊?

  • 摸索那么多工具后,怎样才能避免「效率成瘾」?

  • 世界很大,英语不好的你如何去看看?

  • 自己录制和剪辑视频,如何解决占用空间过大的问题?

  • 想打造个性化高效工作流,可不会编程怎么办?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7703.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI无意间发现了一个有史以来最赚钱的商业模式

正如这些论文所说那样,引发人工智能革命的论文有个朗朗上口的标题:注意力就是你的全部所需(Attention is All You Need.)。 这篇论文的作者是 Google Brain 的一支团队,发表于 2017 年,里面介绍了现在已经十…

我决定给 ChatGPT 做个缓存层 >>> Hello GPTCache

🌟 写在前面 黄老板的一句【AI 的 iPhone 时刻已至】震撼了半个科技圈。或许,应该把这句话再扩展一下:AI 的 iPhone 时刻早已势不可挡,它不是平静随和地跟大家 say hi,而是作为一个强悍的巨人携着一把名为 ChatGPT 的斧…

ModaHub魔搭社区:我决定给 ChatGPT 做个缓存层GPTCache

目录 由一次午饭时闲聊开始的项目…… LLM 缓存层的可行性到底有多少? 为什么不是 Redis? 从零搭建 GPTCache

修改几行代码就让LLM应用提速100多倍!这个团队两周搭建ChatGPT缓存层,曾被老黄OpenAI点赞...

允中 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT爆火,为何大模型却依然没有得到广泛的应用? 原因无它,受制于性能和成本。 最近,有这样一个项目引发业内关注和讨论——GPTCache(https://github.com/zilliztech/GPTCac…

我决定给 ChatGPT 做个缓存层 Hello GPTCache

🌟 写在前面 黄老板的一句【AI 的 iPhone 时刻已至】震撼了半个科技圈。或许,应该把这句话再扩展一下:AI 的 iPhone 时刻早已势不可挡,它不是平静随和地跟大家 say hi,而是作为一个强悍的巨人携着一把名为 ChatGPT 的斧…

Prompt交易平台;ChatGPT构建自动化工作流;7万字ChatGPT学习笔记;大模型训练避坑指南 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『ChatGPT 用户周留存稳定在 30% 左右』三分之一的用户习惯和需求被完全改变 🤖 『谷歌 | Bard开放公众测试』体验还行。f…

Chat GPT:软件测试人员的危机?

Chat GPT,作为一个引起科技巨头“红色警报”的人工智能语言模型,短期内便席卷全球,上线仅两个月活跃用户破亿。比尔盖茨更是如此评价“这种AI技术出现的重大历史意义,不亚于互联网和个人电脑的诞生。” 在各个行业备受关注的Chat …

chatgpt赋能python:Python程度加速方法

Python程度加速方法 Python是一种灵活且易于学习的编程语言,但它在处理大规模数据和执行计算密集型任务时可能会显得比较慢。幸运的是,有许多针对Python的加速程序,可以帮助你优化Python的运行速度。在本文中,我们将介绍几种加速…

chatgpt赋能python:Python加速:如何提升代码运行速度

Python加速:如何提升代码运行速度 作为一名有10年Python编程经验的工程师,我了解到Python是一门强大而灵活的语言,被广泛应用于Web开发、数据分析、机器学习等领域。然而,随着应用程序的复杂性增加,我们也需要考虑如何…

chatgpt赋能python:Python加速方法——提升运行效率的必修课

Python加速方法——提升运行效率的必修课 Python是一门被广泛应用于人工智能、机器学习、数据处理等领域的高级编程语言。虽然它易于学习和上手,但在处理大规模数据等复杂场景时,Python的运行效率往往成为了制约因素。为了避免因运行效率问题而影响产品…

程序员的未来属于「伪代码」!Nature专栏:用ChatGPT加速科研编程的三种姿势

视学算法报道 编辑:LRS 【导读】ChatGPT让科研编程不再难! 基于生成式人工智能工具,比如ChatGPT、Bard等聊天机器人的出现,以及如何将AI工具用于学术研究引发了巨大的争议,但与此同时,AI生成的代码用于科…

程序员的未来属于「伪代码」 Nature专栏:用ChatGPT加速科研编程的三种姿势

新智元报道 编辑:LRS 【新智元导读】ChatGPT让科研编程不再难! 基于生成式人工智能工具,比如ChatGPT、Bard等聊天机器人的出现,以及如何将AI工具用于学术研究引发了巨大的争议,但与此同时,AI生成的代码…

对话数字栩生宋震:ChatGPT加速了「数字人」迈向「西部世界」化

未来的数字人既要有好看的皮囊,又要有有趣的灵魂,就像美剧《西部世界》里的人一样,那就是人人幻想的世界。我们始终坚信未来数字人会朝着那个方向发展,而且现在速度会越来越快。 作者:王立新 出品:碳链价值…

GPT4来了!微软云能否反超亚马逊夺冠,就靠它了

文|光锥智能,作者|刘雨琦 “Azure(微软云)能否反超AWS(亚马逊云)夺冠,就靠ChatGPT了。” 今天凌晨,GPT4横空出世,支持图像输入和混合输入,多模态…

ChatGPT 标志着 AI 进入 iPhone 时刻 | 开谈

整理 | 禾木木 责编 | 梦依丹 出品 | CSDN(ID:CSDNnews) 5 天注册用户超 100 万,60 天用户破亿,引得国内外大厂纷纷追随 AIGC 步伐,史上增速最快的消费级应用程序 ChatGPT 更是引领 AI 在科技圈一路“狂…

ChatGPT 之后,B 端产品设计会迎来颠覆式革命吗?| Liga妙谈

近日,脑机接口公司 Neuralink 宣布,其植入式脑机接口设备首次人体临床研究已被准许启动。遥想当年,我们还嘲讽罗老师「动嘴做 PPT」,谁曾想不久后我们可能连嘴都不用动🙊。 脑机接口何时会引爆人机交互革命尚未可知&a…

马斯克要买地当「城主」/ 苹果手表引入ChatGPT/ 小鹏辟谣多名核心高管离职…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月10日星期五,想好明天去哪里嗨皮了嘛。 最近科技圈都发生了哪些新鲜事?一起来和日报君看看。 马斯克计划购地建城 马斯克已经买好土地,准备建城了?&#xff…

Python发送邮件(以QQ邮箱为例)

1.首先去QQ邮箱 设置-》账户 找到邮箱服务 2.打开smtp服务,生成授权码,这里需要QQ邮箱绑定手机号发送验证码发送一条短信进行验证。 发送后,复制授权码。稍后会用到。 3.编写程序 import ssl import requests import requests import json…

Java利用qq邮箱发送邮件

使用java应用程序发送程序十分简单: 本案列使用了开启QQ邮箱的STMP来进行邮件发送,下面是完成步骤: 首先我们需要开启邮箱发送端口: 在获得了授权码后,接下来便是进行编写邮件发送接口了,我们使用的是Java…

如何配置QQ邮箱或腾讯企业邮箱发送邮件

1. 如果是使用QQ邮箱发送 登录qq邮箱点击设置然后点击账户,如图 账户页面往下翻,找到这个地方,画红框的两个服务开启,然后生成一个授权码 找到配置中心填写邮件的 SMTP服务器:smtp.qq.com 发送邮件的邮箱&#xff1…