自ChatGPT走红以来,以“聊天”为核心的人工智能协作工具们受到了各行各业的关注,让AI写首诗、发封邮件,或是做一份计划书,这些工作已经成为AI聊天机器人的“日常需求”。但似乎,人们遗忘了AI还具有创作文字以外的内容,比如,一幅画。
2022年8月,美国科罗拉多州博览会艺术比赛宣布了一名令人惊喜的获奖者,这位获奖者名为杰森·艾伦,他既不是专业的画家,也不是自由艺术家,而是一款桌面游戏的CEO。他的获奖作品《太空歌剧院》,由新型AI绘画工具“Midjourney”创作而成。
《太空歌剧院》是一幅神奇的画作,它结合了古典与科幻的元素,将17世纪欧洲的歌剧院场景与极具科幻的太空相融,画中身穿华丽服饰的贵妇们站立于穹顶之上,漫游于太空之间,极具魔幻色彩。这样一副“神奇”的画作,竟是出自AI之手。
没错,Midjourney,这款完成度极高的AI绘画工具,正在开启AIGC(人工智能生成内容)的新世代。
Midjourney为何突然走红?
在《太空歌剧院》获奖之前,Midjourney其实一直处于不温不火的状态,即便它拥有不俗的内容创作能力,但依然只在AIGC爱好者的小众圈子里流行。可以说,美国科罗拉多州博览会,让Midjourney走进了大众的视线。
2021年,OpenAI发布了第一代AI绘图工具DALL E,使用文字描述,即可生成一张图像,打开了AI绘图的新世代。由于是初代工具,DALL E的表现并不完美,很多场景都没法真实呈现,或者说,这个工具创作的作品,看起来依旧是一张来自人工智能生成的图片。
这样的结果并不让人意外。自2020年以来,不少小众AI绘图工具走红,基本遵循了“临摹”、“描述生成”和“参考生成”这三种工作模式,早些时候在短视频平台“抖音”上很火的“AI一件变装”,正是基于参考生成实现。即使是有参照物、有一定的描述,这些AI工具依然很难令人满意。
AI绘图之所以“一眼假”,主要还是两个部分:光影和手指。
与人类作画不同,AI绘图工具没法了解到用户所描述的场景里光源的正确走向,以Stable-Diffusion、Lora这样的热门绘图工具为例,它们处理光影的方式往往具有一定的随机性,左右光源不分,导致产出的作品不够真实。同理,手指的几何形状十分复杂,没有一定的规律,AI工具很难有针对性的处理。
这些问题,在V5版本的Midjourney上全都被解决了。
上周,有网友利用Midjourney制作了一系列“情侣合照”,因过于真实的场景塑造和人物表情,走红网络。不少网友表示,在得知它是由AI工具创作之前,只觉得是一张平平无奇的照片。像“一张照片”,在某种意义上,诠释了Midjourney的成功。
网友们大开脑洞地将马斯克与炼铁工厂组合到了一起、把爱因斯坦带到了热闹非凡的音乐节、甚至帮中国男足“拿下”了卡塔尔世界杯的冠军。天马行空的想法,如今只需文字描述就能做到。
Midjourney,真正智能的AI绘图工具
Midjourney能够大获成功,除了对细枝末节的精准把控之外,更重要的还是对场景的还原。
前面提到,AI制图之所以能被人们快速识别,细节的成败是关键,但实际上,作品的风格十分重要。从网友的一些作品中不难看出,Midjourney拥有根据场景自动调色的能力。
举个例子,当你尝试生产一张90年代的照片时,你是否会对照片的质量有所顾虑,毕竟在那个年代,胶卷相机才是主流。而胶卷相机往往没有那么清晰的画质,对曝光的控制也比较差劲,这样的风格被摄影玩家称为“胶片感”。Midjourney在接到关于年份的描述时,会主动匹配用户的需求,不会让一张高清图片出现在“90年代”的场景描述之下。
这正是Midjourney的精妙之处。
当然,匹配风格对于V5版本的Midjourney来说,还算不上什么真正的主菜。Midjourney现在可以按照用户的需求,模拟不同摄影设备的摄影效果,例如“shot on Canon R6 with 50mm f1.4”,此处包含了相机型号为佳能R6,50mm焦段与f1.4光圈等信息。Midjourney可以根据用户提供的信息,模拟出所需的效果。
不得不说,Midjourney这项功能不仅是“惹”到了绘画创作者,还同时“惹”到了光学设备制造商,同时让两个领域的专业人士失业,很难不让人感到担忧。
Midjourney关键词大全指令方法教程如下获取:
https://www.52tu.shop/614.html