AI绘画-Midjourney基础1-突破想象的界限:掌握文本引导的图像生成技巧

Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。

目前 Midjourney 的最新模型为 v5.1 模型,新用户有25次免费额度,快去体验吧!

本文干货满满,建议收藏!!!

一、第一幅 AI 绘画作品

要使用 Midjourney 进行 AI 绘画,首先要创建一个 Discord 账号,然后加入 Midjourney 服务器。

具体如何注册 Midjourney 网上已有大量教程,还是不会注册的朋友们可以私聊博主。

1. 创作(/imagine)

在控制台输入 /imagine 指令,在 prompt 框中输入提示信息,完成后输入回车,即可创作一张 AI 绘画作品。

如我们在控制台输入 /imagin a cute cat,就会得到4张可爱的小猫咪图片:

2. 升档和变体

在使用 /imagine 指令创作图片后,会生成4张不同的图片,同时下方会出现一排按钮,接下来讲解按钮的作用。

首先,使用1、2、3、4分别对这4张图片进行编号,U1~U4 和 V1~V4 表示对对应的图片做 U 操作(upscale,升档)或 V 操作(variations,变体),重做按钮表示按刚刚的提示重新生成4张图片。

(1) 升档操作

mj 会为每条指令生成4张图片,升档操作表示从这4张图片中选择某张图片,放大这张图片并增加细节,提高清晰度。

可以看到,U1 操作即为选择了第1张图片,将其放大并增加细节,更加清晰。

下面还有3个按钮,功能如下:

Make Variations 按钮表示对这张图片进行变体操作。

Web 按钮,表示在个人主页中查看这张图片,如下所示:

右下角有个保存按钮,点击即可将其下载到我们自己的设备上了!

Favorite 按钮则表示收藏,可以在个人主页查看已收藏的图片。

(2) 变体操作

变体操作表示从这4张图片中选择某张图片,对这张图片做变体处理,按照这张图片生成4张主体一致,细节有所变化的新图片。新生成的这4张图片还可以继续进行 U 操作、V 操作和重做操作。

二、Midjourney 设置

在控制台输入指令 /settings,进入设置页面。如下图所示: 

1. 模型

配置界面第1行和第2行的选项代表使用哪个模型进行作图,只能选择一项。当前版本默认使用 v5.1 模型,分辨率更高,理解力更强,细节处理更好。

Niji 模型是二次元风格的模型,适用于生成二次元风格的图片。RAW Mode 版本是 v5.1 模型的另一种模式,会生成另一种风格的图片,适合生成电影类型的图像,在选择 v5.1 模型时才会出现这个模式。

2. 风格参数

第3行的配置项为风格参数,有low、med、high、very high四种模式,越高图片越精细。

这一行的4个选项只可以选择其中1个。

3. 公开模式 / 隐身模式

第4行的第1个选项 Public mode,选中表示公开模式,所有人都能看见你生成的图片。

取消选中则表示隐身模式,别人看不见你生成的图片。

隐身模式只有高级订阅(即60$一月)的用户才可以使用。把 Midjourney bot 机器人拉入自己的服务器虽然看起来是只有自己看到自己生成的图片,但实际上你的 prompt 和你生成的图片也被发送到 Midjourney 的公共频道,所有人都可见。

4. 快速模式 / 放松模式

第4行的第2个选项 Fast mode,选中表示快速模式,需要消耗占用 GPU 的快速时长。快速模式下不需要排队,出图速度较快。普通订阅的用户和高级订阅的用户每个月都有一部分快速时长。

取消选中则表示放松模式,需要排队作业,出图速度较慢。

5. 混音模式

第4行的第3个选项 Remix mode 代表混音模式,选中后可以对图片的局部风格进行调整,即在变体操作时调整生成图片的 prompt。

使用文本描述 A happy girl,绘画效果如下:

打开 Remix mode 后,做 v1 操作,可以看到出现一个弹窗,在弹窗中我们可以修改 prompt:

修改文本描述为 A sad girl 后,效果如下:

可以看到,混音模式下,可以对图片的局部风格进行调整,甚至可以完全改变图片的风格。

三、Midjourney 后缀参数

Midjourney 的 prompt 由文本描述和后缀参数两部分组成。文本描述推荐使用英文,Midjourney 对中文的识别能力不是很强。

由于博主英语不是很好,接下来的示例我都是使用 AI 来帮忙生成 prompt。

后缀参数可以控制图片的大小、风格、样式、质量等,可以更容易生成我们想要的图片。

后缀参数之间的顺序可以任意改变。

1. -- [模型]

-- 后跟上模型代表使用这个模型进行作图。如 -- v5.1(注意 -- 后面有一个空格)表示使用 v5.1 模型,--niji 5(注意这里的 -- 后没有空格)表示使用 niji 5模型等。

2. --ar 比例

后缀参数 ar 表示生成图片的比例。参数值为图片的宽高比,格式为 w:h,w 为宽,h 为高。

默认值为 1:1,一般的取值有 3:2,4:3,3:4 等。

网页上的图片比例一般为 16:9,来看下面的示例:

Welcome to the world :: of a future city ::2 that shines under the starlit sky. Neon lights twinkle in the distance, reflecting off the sleek, glassy surfaces of towering structures. Futuristic vehicles zoom through the air, leaving trails of light in their wake. It's a city that's awake, alive, and pulsating with energy. --ar 16:9

这条 prompt 中文本提示中有权重切分符(::),权重切分符如何使用将在 Midjourney 的进阶篇中进行讲解。

3. --style 风格

后缀参数 style 表示模型生成图片的风格。

v4 模型有 4a、4b 和 4c 3种风格,niji 5 模型有 expressive(默认)、cute 和 scenic 3种风格,v5.1 模型有默认风格和 raw 风格2种风格。

Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --niji 5 --seed 1024

如下分别为 niji 5 模型使用 expressive 风格和 cute 风格的效果:

可以看到,cute 风格下的图片显得更加可爱。

4. --chaos 多样性,变化

后缀参数 chaos 影响初始图像网格的差异程度,可以简写为 c。取值范围为0-100,默认为0。

高 chaos 值将生成更不寻常和意外的结果和构图,低 chaos 值则会产生更可靠和可重复的结果。

如下分别为 chaos 参数值为0和80时的效果:

Welcome to the world of the Rainbow Windmill Island. ::2 The island, adorned with vibrant windmills spinning joyfully, stands in the middle of a turquoise sea. ::1.5 The sky above is bright and clear, with fluffy white clouds scattered across the azure expanse. The sight of the island, so full of life and color, brings a sense of peace and tranquility.

可以看到,chaos 值越高,生成的图片越更富有想象力。

5. --seed 一致性

后缀参数 seed 表示生成图片时使用的种子,可以确保生成的图片的一致性,相近的 seed 值生成的图片的构图和风格都很接近。使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。

上面 --style 的案例中,和我使用相同的 seed 值1024,会得到和我一样的四宫格图片。

这个参数将在进阶篇详细展开。

6. --no 否定提示

后缀参数 --no 表示否定提示,表明在图像生成中不想要的东西,作用是对不需要的元素进行删除,使它们不太可能出现在输出中。

例如想生成一幅没有任何河流的风景画,可以这样写:

a landscape painting --no rivers

7. --tile 无缝贴图

后缀参数 tile 生成可以用作重复图案的图像,用于制作无缝图案、壁纸和纹理。

woodden board texture --tile

一个检查无缝贴图的网站:Seamless texture check | pycheung.com

8. --quality 质量

后缀参数 quality  影响生成图像所需的时间,即图片的质量,可以简写为 q。默认值为1,可选值有 .25、.5、1、2 四个值。

高质量的设置需要较长的处理时间并生成更多细节,更高的数值也意味着每个作业使用的GPU分钟数更多。

质量设置不影响分辨率,更高的 quality 设置并不总是更好。有时,较低的 quality 设置可以产生更好的结果,这取决于试图创建的图像。较低的 quality 设置可能最适合于手势抽象外观。更高的 quality 值可以改善从许多细节中受益的建筑图像的外观。选择与希望创建的图像类型最匹配的设置。

如下为 quality 值为1和2时的效果:

Welcome to a cityscape of the future, where skyscrapers::2 loom large against the sky, their futuristic design a testament to human ingenuity and progress::1.5. Neon lights flicker on their surfaces, painting an electrifying picture of the city night. --ar 3:2

可以看到,quality 值为2时图片有更丰富的细节。

9. --stylize 相关度

后缀参数 stylize 影响生成的图片和 prompt 的相关度,可以简写为 s。取值范围为0-1000,默认值为100。数值越小,和我们 prompt 关联度越高;数值越大,生成的图片更加高调。

如下为 stylize 值为100和800时的效果:

Step into the enchanting world ::2 of a cute magical kitten in the realm of anime ::2. With sparkling eyes and a tiny wand, it casts spells of joy and laughter. --niji 5 --style cute

可以看到,当 stylize 值为800时,图片主体都变了,上面的 prompt 的主体为魔法猫咪。

10. --iw 图文相关性

取值范围0.5 ~ 2,用于图生图控制生成图片的图文相关性。取值越高,则生成的图片参考 prompt 中“图”的比重就越高;反之,参考“文”的比重就越高。在后续图生图的文章中会详细解析。

四、Midjourney 常用指令

1. 绘图相关

(1) /imagine 生成图片

最基本的指令,用于文本生成图片,prompt后面加描绘词,即文生图。

(2) /discribe 生成文本

用于图片生成与之相关的4条英文的文本描述,即图生文。

控制台输入 /describe 指令,上传一张图片,发送,即可得到4条文本描述。

注意:这几条文本描述只是 AI 分析图片得出来的,并无法保证使用这些文本描述可以得到相同的图片。

(3) /blend 两个图片混合

将两张图片按照文本描述进行混合,即图生图。后续文章会详解讲解。

(4) /show 结合任务ID生成原图片

在聊天记录中的一个任务右上角,点击添加反应按钮,搜索 "envelope",点击这个信封图标。

这时就可以在 Midjourney Bot 给你的私信中看到这个任务的 Job ID 和 seed 值。

这个时候控制台输入 /show 指令,job_id 框中粘贴上面查看到的 job_id,就可以看到这条消息了,同时可以对这个任务继续进行升档操作和变体操作。

这个指令并不经常使用,细心的朋友已经发现,上面获取 Job ID 那里同时还获取到了 seed 值,有用的其实就是这个 seed 值。

上文已经提到,使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。现在就来试验一下:

Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --ar 1:1 --niji 5 --seed 4123671164

使用上面的 prompt,你将会得到和我相同的图片。这就是 seed 的神奇之处!

利用这个特性,我们就可以使用控制变量法对图片的细节进行微调了,进阶篇中我将详细讲解。

2. 设置相关

(1) /settings 设置

(2) /fast 切换到快速模式

(3) /relax 切换到放松模式

(4) /public 切换到公共模式

(5) /stealth 切换到隐身模式

(6) /prefer remix:切换到混合模式

3. 后缀相关

(1) /prefer suffix 指定要添加每个提示末尾的后缀

Midjourney 有很多的后缀参数,有时候在每次作图时都会添加一些固定的后缀参数,显然有点麻烦。使用 /prefer suffix 指令可以定要添加每个提示末尾的后缀:

如下面这条指令,会在每次绘图时,prompt 后都添加上 --ar 16:9 --v 5.1 --style raw --q 2 --s 800。 

接下来我输入文本描述,运行时后面会自动加上预设的后缀。

Step into the world of Zaun ::2, a city steeped in darkness and chaos. The high-tech industrial infrastructure towers above, offering a stark contrast to the disorder below

直接输入 /prefer suffix 指令,后不加任何内容,可以重置后缀预设。

(2) /prefer option set 创建自定义变量

使用 /prefer suffix 设置默认后缀参数的默认值,只能设置一条预设。如果想要设置多条后缀参数的预设,在不同情况下使用不同预设,那么就可以使用 /prefer option set 创建变量的方法。

定义变量 x 为 "--ar 4:3 --chaos 30",之后就可以直接在 prompt 中以 --x 的形式使用该变量,x 即等于 "--ar 4:3 --chaos 30"。

出现下面的提示时,即为创建变量成功!

使用变量 x 的方式如下:

Step into the vastness of the universe ::2. The sky is ablaze with countless stars, each one a distant world waiting to be discovered

如上案例中,在运行时变量 x 被自动替换为已经预设好的后缀参数。

(3) /prefer option list 列出之前设置的所有变量

控制台输入指令 /prefer option list 后回车发送,可以看到已定义好的变量。

另外,如果想要删除变量,可以使用 /prefer option set,设置空的 value 即可。

看到如下消息即为成功删除变量:

再次输入 /prefer option list 指令,可以看到已经没有了变量 x。

4. 系统相关

(1) /info 查看基本信息

如订阅状况、工作模式等。

Subscription:订阅信息,有订阅等级,订阅方式(按月 / 按年)和订阅时间。

Job Mode:工作模式,Fast(快速模式)/ Relax(放松模式)。

Visibility:可见性,Publuic(公开模式)/ Stealth(隐身模式)。

Fast Time Remaining:剩余多少快速时长。

Lifetime Usage:快速模式下生成了多少张图片,使用了多长时间 GPU。

Relaxed Usage:放松模式下生成了多少张图片,使用了多长时间 GPU。

Queued Jobs (fast):当前有多少个快速模式的作业正在排队队列。

Queued Jobs (relax):当前有多少个放松模式的作业正在排队队列。

Running Jobs:当前有哪些作业正在运行。

(2) /ask 获取问题答案

(3) /help 查看帮助信息

(4) /subscribe 管理订阅

附:使用 AI 生成 Midjourney 的提示词

我在 ZelinAI 上做了一个 AI 应用,可以根据用户输入的内容生成一条适用于 Midjourney 的文本描述,对不熟悉英文的小伙伴们非常友好。

点击这里来体验吧!

由于 Zelin AI 目前只能使用 ChatGPT 模型(即 GPT-3.5),能力不是很强。这个 AI 工具目前还无法生成完整的 prompt,只能生成英文描述,后缀参数还需要我们来手动调配。

另外,我用 GPT-4 训练了一个生成 Midjourney 提示的 AI 工具,GPT-4 相比于 GPT-3.5 强大了很多,理解能力大幅度提高,已经可以生成完整的带后缀参数的 prompt。

如下为 GPT-4 模型下 Midjourney 提示工程师 AI 工具的表现:

可以看到,生成了完整的 prompt!使用第3条 promot,效果如下:

生成的图片还是非常不错的!正文部分的各种案例图片的 prompt 都由 GPT-4 版本的 Midjourney 提示工程师 AI 工具生成。

点赞达到15个,后续我会在本专栏发一篇文章来详解讲解如何训练这个模型!

点赞达到30个,我将公开这篇文章!

三连 + 关注,在评论区回复 "AIGC!",我将把 GPT-4 版本的 Midjourney 提示工程师模型的训练咒语发给你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20596.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 与 Midjourney 强强联手,让先秦阿房宫重现辉煌!

Midjourney 是一款非常特殊的 AI 绘画聊天机器人,它并不是软件,也不用安装,而是直接搭载在 Discord 平台之上,所有的功能都是通过调用 Discord 的聊天机器人程序实现的。要想使用 Midjourney,只能进入他们的 Discord 服…

玩转ChatGPT:名单排序

一、写在前面 最近在文秘工作中,碰到一个名字排序的问题,大概的规则: (1)按照第一个汉字的首字母的英文单词排序,从A-Z; (2)若第一个字的首字母一致,则比较…

【NLP】ChatGPT 的议论文究竟写的怎么样?111 位高中教师告诉你答案

夕小瑶科技说 原创 作者 | 小戏、Python 在 OpenAI GPT-4 发布时发布的《GPT-4 Technical Report》中,其中很吸引人眼球的一部分是 GPT-4 应用于教育领域的出色表现,通过让 GPT-4 去完成美国的 AP 课程及考试,来评估 GPT-4 在多个学科中的性…

ChatGPT:在商业领域的广泛应用|小智AI

ChatGPT丨小智ai丨chatgpt丨人工智能丨OpenAI丨聊天机器人丨AI语音助手丨GPT-3.5丨OpenAI ChatGPT|GPT-4|GPT-3|人机对话|ChatGPT应用|小智ai|小智ai|小智ai|小智ai|小智AI|chatgpt小智AI 人工智能技术在商业领域的应用正日益普及,而ChatGPT作为下一代智能对话模型…

chatgpt赋能python:用Python办公自动化轻松完成繁琐重复的工作

用Python办公自动化轻松完成繁琐重复的工作 随着科技的进步,许多传统工作已经被自动化取代。而在许多职业中,办公自动化通常被认为是节省时间和减少错误的最佳方法。对于那些使用Microsoft Office,例如Excel、Word和PowerPoint等应用程序的用…

基于用户评论情感分析详细设计与技术实现

基于用户评论情感分析详细设计与技术实现 文章目录 基于用户评论情感分析详细设计与技术实现前言一、技术架构二、分析服务器构建1.1 创建flask项目1.2 编写数据库连接脚本,获取用户评论数据;1.2.1 引入库1.2.2 连接数据库获取数据1.2.3 测试 1.3 编写情…

情感分析的分类,情感分析模型有哪些,情感分析的应用场景,情感分析的发展趋势

1.情感分析的分类: (1)基于情感极性的分类:将文本的情感分为正向、负向和中性三类。 (2)基于情感维度的分类:将文本的情感分为喜欢、愤怒、悲伤、惊喜等多个情感维度。 2.情感分析模型&#x…

基于Twitter数据的情感预测与案例分析

导读 本次分享的是关于文本分析中的情感预测分析和主题分析的一个小科研项目,数据爬取自Twitter,主要内容分为3部分: 1.情感预测机器学习模型选择及建立 2.情感预测深度学习模型LSTM的介绍和建立 3.主题分析模型简介 01 # 情感预测机器学习…

CDGP认证|ChatGPT的出现,对数据治理行业冲击如何?

ChatGPT的出现对数据治理有很多好处,其中最明显的是提供了更高效、更准确和更自动化的数据处理和分析服务,可以帮助企业和组织更好地管理和利用数据资源,提高数据质量和决策效率。此外,ChatGPT还能够发现隐藏在大量数据中的信息和趋势&#x…

chatgpt赋能python:Python报错大全

Python报错大全 作为Python程序员,报错是我们经常遇到的一件事情。报错可以帮助我们定位和解决问题,但有时候错误信息并不直观,所以我们需要查找信息来帮助我们解决问题。在这篇文章中,我们将介绍常见的Python报错以及如何解决它…

GitHub开源神器,已获3k star!让你的 ChatGPT 不再报错!感受丝滑般体验!

点击上方“Github爱好者社区”,选择星标 回复“资料”,获取小编整理的一份资料 作者:GG哥 来源:GitHub爱好者社区(github_shequ) 这是GitHub爱好者社区第 71 篇原创文章 Hello,大家好&#xff0…

登高望远,一文解答 2023 年你最关心的前端热点问题

动手点关注 干货不迷路 本文预计阅读 25 min,建议先收藏后观看~ 一、刀光剑影的 2022 时光荏苒,这绝不平淡的 2022 年已经走上历史的黄页,新的一年也逐渐看不到故人回首的光影。感谢你对前端技术领域持续关注,我们一直在这里等你。…

千模大战鏖战正酣,大模型能否帮360重回巅峰?

ChatGPT问世后,互联网终于看到了变革的曙光。 回望互联网的征程,几乎每十年左右,就会因产品和技术的变革,而催生出全新的应用场景。 00年代,随着PC产品的逐渐成熟,桌面互联网成为时代的“主旋律”。在此背…

司马阅(SmartRead),最好用的中国PDF智能阅读工具!

在数字化时代,大量的信息以PDF(便携式文档格式)的形式存在。 处理和提取PDF文件中的信息可能是一项繁琐的任务,但现在有了司马阅(SmartRead),一款能够与PDF进行对话的智能工具,这一切变得更加简单和高效。…

国产开源大模型: 百亿参数“伶荔”,填补中文基础模型空白!

Datawhale开源 团队:深圳大学沈琳琳教授团队 Linly 伶荔说 中文语言大模型来啦! 大数据系统计算技术国家工程实验室副主任、深圳大学计算机与软件学院沈琳琳教授团队主持的人工智能项目“伶荔(Linly)”于今天隆重推出“伶荔说”系列中文语言大模型。 该…

Google 中文名发布 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 4 月 12 日,每年的这一天是世界航天日,全名载人空间飞行国际日;在 1961 年的 4 月 12 日,苏联空军飞行员尤里加加…

chatgpt赋能python:Python用Pi优化SEO的指南

Python用Pi优化SEO的指南 引言: 搜索引擎优化(SEO)已经成为了数字市场营销领域中至关重要的一部分。对于那些想要在数字领域获得成功的企业和个人而言,SEO是不可或缺的。Python是一种优秀的编程语言,现在,它在SEO中也变得越来越…

PDF工具Adobe Arcrobat Pro DC下载安装教程

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书,通俗易懂,风趣幽默,无广告,忍不住分享一下给大家。(点击查看学习资料) wx供重浩:创享日记 对话框发送:adobe 免费获取Adobe …

Python | Python的自我介绍(前世今生)

本文概要 本篇文章主要介绍Python这门语言的前世今生,适合刚入门的小白或者想了解Python历史的同学,文中描述很详细,具有一定的学习价值,感兴趣的小伙伴快来一起学习吧。 个人简介 ☀️大家好!我是新人小白博主朦胧的…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门AI智能问答应用场景——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门AI智能问答应用场景 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字&a…