Midjourney V5 与 V4 哪个更好?综合评测,Prompt 全公开!

15fb7682eabc07efd76fc04412ab7815.gif

【CSDN 编者按】最近 AI 绘画工具新版本 Midjourney V5 一经发布,便火爆朋友圈,今天我们就来评测一下 V5 与 V4 的区别~

原文链接:https://medium.com/@catmus2048/midjourney-v5-%E6%AF%94-v4-%E6%9B%B4%E5%A5%BD%E5%90%97-%E7%BB%BC%E5%90%88%E8%AF%84%E6%B5%8B-prompt-%E5%85%A8%E5%85%AC%E5%BC%80-bd8a1d909867

未经授权,禁止转载!

最近是不是被这张在网上转疯了的情侣照刷爆圈了。

46a9ee4a6c65931b72cf142e12f974f6.png

第一眼是不是以为是真人拍摄。

但实际是 AI 生成的,来自 Midjourney V5 版本产出的一张 AI 绘画。

Midjourney V5 已发布多天,今天将做个全面评测:

  • V5 的惊艳之处:photograpy,CG rendering,HD film style 类生成。

  • Prompt 控制准确度的基本测试。

  • V5 比 V4 更好的地方:在 V5 里可以准确控制镜头语言,光影也更真实自然。

  • V5 相比 V4 倒退的地方:V5 会让构图更碎片化、产生更多不必要的细节,成像的锐利和清晰程度下降。

cf659a5287cb44f570110050140d5674.png

V5 的惊艳之处

下面是一些用 V5 生成的照片写实类 photo realism。

5c9ebba621995c87b0948e2e97ea2198.png

摄影一只爬行动物的美丽眼睛,蜥蜴的眼睛,蓝色和金色的瞳孔,特写视图,黑暗清晰的背景,极简主义,艺术,大气,杰作,HDR,超细节,500px

水下场景的表现非常不错,光影和水波反射的处理都非常真实。

92fbf4fc93e117343503adabb269c02b.png

水下泳池摄影,水下奔跑的马的照片,全身马,明亮,艺术,魔术时间,大气,杰作,生动的色彩,HDR,超逼真,锐利聚焦,超级细节,500px,8K,壁纸

808b90bc285f4e11d7f029eec776e31e.png

水下泳池摄影,微笑的婴儿在水下游泳的惊人照片,高速摄影,HDR,艺术,极简主义,超现实,魔术时间,日落,金色闪耀,大气,杰作,8K,壁纸

3deac83f308c19e4fb0254e507f7d4f2.png

美术摄影,美丽的眼睛,超逼真的瞳孔,特写视图,深色清晰背景,极简主义,艺术,大气,杰作,HDR,黄金比例构图,超详细,500px

d03b84af6a438b8777ff4f619a74e71d.png

摄影,一个透明的水晶立方体,高高地漂浮在天空, 动荡的大海,北冰洋,日落,魔术时间,HDR,极简主义,艺术,大气,未来派,超详细,8K壁纸,HDR,500px

c207695d02529f8413c7a7a3d973e964.png

美术摄影,祈祷之手,超级逼真,特写视图,深色清晰背景,极简主义,艺术,大气,杰作,HDR,黄金比例构图,超详细,500px

c0ec09bb249feff86516ef053f519960.png

黑桃王牌和银弹的特写镜头,在旧西方沙龙橡木桌上的一杯威士忌旁边

金属材质的渲染

e984c01c3dfa8a63ebeddc6023160319.png4cb9708eb261c4e833b6f648ba977dbe.png

液态金属,流动 飞溅,深色和金色,丝带般的光泽,逼真,工作室光线,惊人的纹理,锐利的焦点(上)| 乔治·詹森(下)的作品

黑白胶片风格和电影风格的照片生成

7a985901fcb6c93882583b0ecb6f2614.png

城市景观

d6a3f80c27e9f8b6e188c0d817da5693.png

一个穿着大衣的老人走向白雪皑皑的海滩,冬天的海洋,逼真,电影,超详细

bf97fbba6611f54234afd81aeec83411.png

令人惊叹的自然景观, 教堂

你可以用 a scene from the movie **** ,配合一个超宽的比例,生成很多电影场景,比如下面五张教父系列。

5cdb917703d48a0e11aa896b64bdf003.png

电影“教父”中的一个场景,黑色电影,自然光,富士胶片,豪华,历史,4k

307efb233cc3fb7d9e29a1ce12c3f5f1.png

b3fd75c8d8cacb81f2d82d57ecc6ac79.png99305c47231a166ed5026cd30228afac.png

街景,小教堂,黑色电影,广角镜头,胶片照明,富士胶片,豪华,电影静止图像

c4da3f19490b5f3d6feb3df7dd47e9e0.png

人像生成

51a16364a393a0c85bab0000390e42c6.png

编辑风格的照片中特写镜头,一个年轻的黑发法国女人,坐在大理石桌旁,穿着黑色连衣裙和钻石项链,在装饰艺术风格的餐厅里,天鹅绒、黄铜和镜子装饰,宝石色调调色板,西榆树,枝形吊灯,餐厅,晚上,自然采光,富士胶片,豪华,历史,4k

3a7d14ed80cb5468815cc52ce122b350.png

a04d6f47a20f22c70a0dda2de8c5274e.png

肖像,半身,超细致,高品质

支持 image split (下面的生成看起来像是两张图,但实际上是一张,在 Prompt 里使用 image split into 2,就可以得到同一角色 + 同一服饰的在不同视角的两种生成结果。你也可以尝试 2 倍 以上的 split,然后再进行高倍 upscale)。

一张近景,一张膝高镜头。

5bb1efa69b09ce6083defceaeca87fa3.png

b6743f06a964f35146efe79796f10208.png

V5 也支持 3:1 这种超宽比例,或是 1:3 超高比例。

8f6dfcd1e2f556071299422169a58094.png

4b7ab1d11d91c5e407ca8cc78d132615.png

3:1超宽比例

CG 渲染类的生成

02bba72c543904fd19caeefecac76630.png

一只和猫说话的老人,赛博朋克,电影,超细节,虚幻引擎,自由度,超分辨率,百万像素,电影照明,抗锯齿,CGI,VFX,SFX,超极简主义,超逼真,体积,逼真,全彩,写实,16K,锐利聚焦

a3fa3a9eaf403afb691adb5d9cf1cbaa.png

d81d34f7eebea34758c3c74489c15db6.png

人形脸的半机械人机器人/抱着黑猫,赛博朋克,超级细节,虚幻引擎,自由度,超分辨率,百万像素,电影照明,抗锯齿,CGI,VFX,SFX,超最大化,超现实,体积,逼真,全彩,逼真,16K,清晰聚焦

0dc072630d44d000a08c5d5191401401.png

赛博朋克战士的半身肖像,超现实,半身,HDR,鲜艳的色彩,电影,超细节,虚幻引擎,自由度,超分辨率,百万像素,电影照明,抗锯齿,CGI,VFX,SFX,超极简主义,超逼真,体积,逼真,全彩,16K, 清晰聚焦

插画风格

ae4b51a2ec4c0493edfee80fcc66b64f.png

ba88aaf37ff1331a79fab53705d62742.png

未来主义城市景观,装饰艺术风格,老爷车

c28461d003021a0050dd6e6d5517c936.png

爵士乐演奏,艺术,褪色的蓝色

9a52bb898564b159e3e6d80bcd8038bb.png

一个站在火中树前的男孩,长长的阴影,夜晚,矢量艺术,grphic风格,超详细(左)冬天,迷你主义者(右)

fb0143a053a4874778f4157114c6c8d6.png

Prompt 控制准确度的基本测试

穿白衣服的男人坐在红椅子上拿着蓝色的水杯。最常见的染色溢出问题还是很严重。

d43d88accaf9db4331decab145ee8952.png

V4 在上, V5 在下

d889c6c0c4681f1d559021ff72c90129.png

一个穿着白色西装的男人坐在红色椅子上,手里拿着一个蓝色的杯子

“抱猫的机器人”, 这个 Prompt 用 V5 跑了好几次,每次都是猫头机器人,新版本中两个对象貌似出现了比 V4 更严重的混淆问题。

dfb9dbea6bcf430a96963d77a86a9f83.png

V4 在上, V5 在下

1a3b98e8b69308cf494e4c4ed22ae01b.jpeg

抱着虎斑猫的机器人

3 个柠檬和 2 个玻璃碗,数量依然不能精确控制。不过 V5 的水彩渲染要远好于 V4,但油画风格的渲染都一样不是很好。

2ddbf88cfe7f888b943d3c4f82ce667c.png

V4 在上, V5 在下

fc86021d8356bc023323c524d0276a85.png

静物油画,2个玻璃碗和3个柠檬

c18135ae9454f31804812760bd350cd3.png

V4 在上, V5 在下

9ea44b3ff95c23424acf0f403034eeb5.png

静物水彩画,2个玻璃碗和3个柠檬

马依然不能骑宇航员

44baa9f116790cf6796d0282bafb9953.png

一匹马骑在宇航员的背上

多物体的空间关系也仍然无法精确控制,不过 V5 起码每一张都生成了一把椅子。

ffb99cee362ac8dfdf182005e62f1fa5.png

V4 在上, V5 在下

8884b1e28e3cf597c5f928d17f68a80d.png

一个球放在盒子里,盒子放在椅子下面

39de0b213ccf97e8ac01f7043f86c838.png

V5 相比 V4 的优势之处

V5 在镜头语言的控制上,相比 V4 实现了非常明显的进步,光影的渲染也更写实、自然。AI 感已经变得很弱了,几乎肉眼难辨。

POV 第一视角

e23506fcffc5616940e051d0af13b186.png

V4在上,V5在下

45a11f054a29e9fe458bb02c0fb8a4bb.png

三只猫看着POV镜头

俯拍镜头 overhead shot

5a82f198d4c14cee08337dc12eb9deef.png

V4在上,V5在下

a3311b2e5fa607e8abfe08f5f317692e.png

3只猫看着俯拍镜头

低角度镜头

V5有一张做到了非常标准,V4 基本是不太标准。

43d43a196f5b38264dcb03363a2be5fe.png

V4在上,V5在下

7ce1fcda560dd6407c193a50613e4b6b.png

3只猫看着超低角度镜头

高角度镜头

78b1d5c4ea0fd254de4ac19a4880bb43.png

V4在上,V5在下

56e947fd99f5aa7e94ed7eca27d0e964.png

3只猫看着超高角度镜头

浅景深,V5 比 V4 自然得多。

8732acec9502e3fd76493a7bca63e289.png

V4在上,V5在下

f1298ad563501b1ae7bb1c4cc5243d89.png

3只猫看着浅景镜头

深景深

8821a1f4269e06fc0413299d9e31cacf.png

V4在上,V5在下

95ab24851ceaece68aca9dd6890ade12.jpeg

3只猫看着深景镜头

V4 在生成 bird eye view 的同时还生成了 bird 和 eye。

6952eafac157b5b42ed430b43bee7fc8.png

V4在上,V5在下

2ddf9d841adf52073cf7dd1637ad4ae1.jpeg

白色沙滩的鸟瞰图,海浪泡沫

全身像。大部分时候,用 V4 生成 full body 都不是真正的全身像(没有脚部或者膝盖以下),V5 表现的更好一些。

fce631da8d9c37bf764af0d37a3c6f83.png

V4在上,V5在下

a65e57cdc251198d4fca34deee33a80b.png

僵尸新娘的全身肖像

半身像。V4 一个很严重的问题是每组 4v1 生成的结构构图都过于接近,且人像太容易出现中心对称构图。V5 是增加了每批次 4 个种子的随机变量,每批结果的构图会更多样。

下面的对比可以观察到这个结果。

a48ff37b5a8385271d52ca3389d6ebb8.png

V4在上,V5在下

2768d395170d496ab601deca87b3ce95.png

僵尸新娘的半身肖像

侧面像 + knee shot

3d4494d9829607ab76cd7d0db2be908a.png

V4在上,V5在下

19f9eb5c0a1273967809f5da302ce267.png

僵尸新娘的侧视图肖像,膝盖拍摄

广角,场景和构图更多样

1834d4012ba122b38f2ea2b06c9f2125.png

V4在上,V5在下

19e79e7b8f7d8072e92165c47152d90e.png

骑着马的牛仔在奔跑,全身,广角镜头

07922d131ecbdc5364fbdd3d39a723c2.png

V5 相比 V4 的不足之处

虽然摄影类风格的生成更写实和自然,但比较下面放大的僵尸新娘和牛仔骑马场景,可以发现 V5 的生成都像打了柔光,都笼罩上了一层影楼滤镜或电影滤镜。相比V4,虽然 AI 感降低了,但也一定程度上牺牲掉了成像的细节,清晰和锐利程度都明显下降。

d05392e5e3b3b93400becf7481d937a7.png

V4在上,V5在下

cc755495160aef248de05d69d92ba864.png

253de6ef54475e5bfd89b0e31490acab.png

V4在上,V5在下

6bd3e2bc34df327575c49b37999c454a.png

V5 倾向于照片化一切生成结果,而且有一种 “糖水感”。

7a39b98ad0b926e4840e32cc9fad0536.png

V4在上,V5在下

495b6386fab5c50d0d60c27a739ffba3.png

令人惊叹的未来主义小屋漂浮在海平面上,动荡的大海,杰作

7cec06c796485857ce18600312927d6c.png

人物,水墨艺术,侧视图

下面两组都是艺术媒介测试,铅笔素描和版画风格的弗兰肯斯坦,V5 会过度添加细节,也基本丢失了艺术媒介的特征。所以想用 MJ 生成 fine-art 类作品的 (除了水彩)。

c3b6532d0f6d144647e23bbb17de6bad.png

V4在上,V5在下

5bfb590a581e7d292abf3e25cfa13093.jpeg

弗兰肯斯坦肖像的铅笔画,艺术,详细

8075d959d432a10af9d262520c57e00d.png

V4在上,V5在下

74df663b5a43f6437a75537eb402a812.jpeg

弗兰肯斯坦肖像的美术木刻制作,艺术,杰作,详细

V5 生成构图更碎片化,同时也有明显的锐度丢失的倾向。

402ac65dc6f3c470b7b936deb098ac82.png

V5 会倾向于生成过多不必要的细节,对画面主题的美感和结构都有很负面的影响。

b0249fda4a8af27497e324dc2e4fab2f.png

V4在上,V5在下

a10b6e7ec0bc02b2f2818c94e94314d5.png

再次生成时,我去掉了 Prompt 里的 “super-detailed”,情况并没有得到改善。

0ba813ca20902faa81d57eb3fe3dd2a7.png

以上对比评测都是用同样 Prompt 在两个版本里首次生成的结果,尽量避免了人为的 cherry picking。

在生成不同主题和风格的作品时,你是会选择 V4 还是 V5?希望这个对比评测能对你有所帮助。

参考链接:

https://medium.com/@catmus2048/midjourney-v5-%E6%AF%94-v4-%E6%9B%B4%E5%A5%BD%E5%90%97-%E7%BB%BC%E5%90%88%E8%AF%84%E6%B5%8B-prompt-%E5%85%A8%E5%85%AC%E5%BC%80-bd8a1d909867

 

babce5df2c0568b20c29d5dbec691247.gif

☞Google Bard vs. ChatGPT 哪家强?结果一目了然
☞李彦宏:十年后不会写提示词或被淘汰;GitHub发布Copilot X,动动嘴就能生成代码;Vite 4.2 发布|极客头条
☞微软、Adobe 加入 AI 生成图像“内卷”大战,网友:用中译英文本之后,每次图片都有新惊喜!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44843.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

游戏陪玩系统源码中聊天室内礼物系统的实现

游戏陪玩系统源码中聊天室的礼物系统,第一步用户看到的无外乎都是礼物的列表界面 纵观主流聊天室的礼物列表应该都是使用UICollectionView实现的,所以我也不例外,下面就是各种撸代码.效果如下 看着效果还不错吧.但是但是我突然发现一个问题.游戏陪玩系统源码中礼物展示的顺序跟…

游戏陪玩语音聊天系统3.0商业升级独立版本源码

首发价值29800元的最新商业版游戏陪玩语音聊天系统3.0商业升级独立版本源码 1、增加人气店员轮播 2、优化ui界面丨优化游戏图标展示丨优化分类展示 3、增加动态礼物打赏功能 4、增加礼物墙功能 增加店员满足业绩,才能升级功能 5、增加店员等级不同,可接…

新版游戏陪玩约玩APP源码 多人连麦聊天/语音直播社交双端APP源代码 附搭建教程文档

功能介绍: 1.游戏陪练:可以选择当下火爆的游戏内容,选择游戏大神、职业玩家进行陪练,也可约附近路人玩家或是身边的小伙伴语音组队开黑,一起享受边玩游戏边吐槽的无限乐趣。 2.约玩交友:除了游戏陪玩功能&a…

用户登录很重要,实现游戏陪玩app源码注册功能

登录页面是游戏陪玩app源码非常重要的页面&#xff0c;用户注册、登录都是在这个页面完成的&#xff0c;接下来我们就看看&#xff0c;怎么实现一个简单的游戏陪玩app源码登录页面。 上图为演示画面 login.xml&#xff1a; <RelativeLayout xmlns:android"http://sch…

2022商业版游戏陪玩陪聊系统最新源码+视频教程+全套素材

网友分享给会员的&#xff0c;拿去学习研究吧&#xff0c;写法简单明晰&#xff0c;可以做项目但是一定要审核好&#xff0c;遵守好法律法规&#xff01; 提供在线聊天功能&#xff0c;在线下单功能&#xff0c;手机支持WAP&#xff0c;公众号&#xff0c;并可以封装成APP。源代…

游戏陪玩 语音聊天系统

1.增加人气店员轮播 2.优化ui界面丨优化游戏图标展示丨优化分类展示 3.增加动态礼物功能 4.增加礼物墙功能 增加店员满足业绩&#xff0c;才能升级功能 5.增加店员等级不同&#xff0c;可接dan的价格不同 6.更新&#xff1a;动态广场功能&#xff08;支持视频语音图片&…

仿TT语音,语音游戏陪玩APP源码,社交属性强大

近年来&#xff0c;全球进入电子竞技热潮。据艾瑞咨询数据统计&#xff0c;2018年&#xff0c;电子竞技产业规模突破了850亿元&#xff0c;电竞产业相关人群达4亿人。在国内来讲&#xff0c;高校纷纷开设电竞专业&#xff0c;亚运会也承认电子竞技项目的加入。在诸多大背景下&a…

小米昨天发布的新机,简直太TM牛了……

很多时候&#xff0c;小米的新品&#xff0c;确实能给大家带来惊喜。 最近&#xff0c;小米又发布了许多新品&#xff0c;咱们一起来看一下吧。 1、小米13海外版定价惊喜 最近&#xff0c;小米在WMC2023巴塞罗那展上&#xff0c;面向全球发布了最新的小米13以及小米13 Pro两款机…

人工智能,有多能?

人工智能&#xff0c;有多能&#xff1f; "AI"二字&#xff0c;相信大家并不陌生。但是&#xff0c;全力发展人工智能&#xff0c;真的合适吗&#xff1f; 六年前&#xff0c;小米发布了小爱同学。这大概是离大家最近的人工智能了。尤记得发布会上&#xff0c;雷军手…

超级简单的python爬虫详细教程!!

爬虫 爬虫是什么 爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。 爬虫的原理 如果要获取网络上数据&#xff0c;我们要给爬虫一个网址&#xff08;程序中通常叫URL&#xff09;&#xff0c;爬虫发送一个HTTP请求给目标网页的服务器&#xff0c;服务器返回数据…

chatgpt赋能python:用Python爬取电影数据

用Python爬取电影数据 作为一个Python工程师&#xff0c;有很多有趣的项目可以用Python实现。其中之一是爬取电影数据&#xff0c;这对于电影爱好者和电影行业从业者来说都是非常有帮助的。本文将介绍如何使用Python爬取电影数据&#xff0c;并对如何优化这个过程进行讨论。 …

chatgpt赋能python:Python电影分析

Python电影分析 Python在数据分析领域拥有着广泛的应用&#xff0c;其中之一就是进行电影数据分析。本文将介绍利用Python对电影数据进行分析的过程及结果&#xff0c;并提供了Python爬虫和数据可视化的代码示例。 网站选取 在进行电影数据分析之前&#xff0c;我们需要先选…

推荐一款语音识别软件

一、简介 使用接口转换需要输入的语音为文字。 给大家带来一款语音识别软件&#xff0c;想做智能识别语音设备或者想给项目增加功能的同学可以看下 这款软件是使用python写的&#xff0c;其实开发语言无所谓用其他语言也可以写 代码还是挺简单的。 这款软件主要使用接口完成识…

文本转语音最新便携版Balabolka2.15.806 + 10个左右的发音人

Balabolka 绿色中文版是一个文本转语音&#xff08;TTS&#xff09;和语音朗读程序。Balabolka 可以使用计算机系统上安装的所有语音。屏幕上的文字可以被保存为一个WAV&#xff0c;MP3&#xff0c;OGG或者WMA文件。该软件可以读取剪贴板的内容&#xff0c;可以查看AZW&#xf…

Edge-TTS 语音朗读

基于微软edgeTTS开发的语音朗读转MP3软件&#xff0c;支持实时MP3转换&#xff0c;支持角色朗读&#xff0c; 支持在线网页浏览&#xff0c;支持全文转成MP3, 从光标处转成mp3, 选择内容转成mp3.&#xff0c;支持剪切板转成MP3., 支持合并对话所生成的MP3为一个文件&#xff0…

微软TTS语音引擎实现文本朗读

科大讯飞和neospeech tts哪个更好 朋友们或许还有一个疑问&#xff0c;就是不知道科大讯飞和neospeech哪个更好。据我的体会&#xff0c;它们其实各有优点。 科大讯飞有几个语音库&#xff0c;比如小宇、小燕、还有一个粤语和英语的&#xff1b;而neospeech则有lily、liang、h…

好物推荐:文字转语音朗读软件哪个好?

不知道大家有没有像我一样的&#xff0c;对“语音播放”、“语音朗读”是又爱又恨的。有时工作繁忙&#xff0c;而同事或客户发来语音资料需要整理时&#xff0c;就会很烦躁&#xff0c;因为语音的整理起来比文字的繁琐一些。而像有时在家休息&#xff0c;还得看一些资料时&…

分享5个宝藏文字转语音配音软件,错过太可惜

经常看到有人问如何将文字转成语音&#xff0c;以及配音软件&#xff1f;什么样的配音工具可以做到堪比真人&#xff1f;文字转语音操作起来难不难&#xff1f;新手小白不会用怎么配音呢&#xff1f; 在测试了几十款款文字转语音工具后&#xff0c;最终给选出了下面这5款超好用…

文字转语音朗读如何操作?手把手教你如何将文字转语音

有些小伙伴喜欢在闲暇时间看小说来打发时间&#xff0c;特别是上下班通勤这个时间段&#xff0c;不过每当这个时候都是高峰期&#xff0c;经常出现腾不开手看小说的现象&#xff0c;所以面对这种情况&#xff0c;有声小说就是一个不错的选择。 但有时喜欢的小说比较小众&#…

[nlp] 车载语音助手

多轮对话机器之话题意图识别_Congqing He的博客-CSDN博客 https://www.csdn.net/tags/MtTakgwsMTc3MjItYmxvZwO0O0OO0O0O.html 智能座舱系列六:一文读懂车载语音系统_对话_车机_云端 车载语音助手的人机交互的流程: ASR系统,可以接受用户发起的语音对话的音频输入,并给出…