一、前言
由于在工作中,经常会涉及到使用人物素材完成 Banner 设计的工作,于是最近开始探索关于 Midjourney 进行 AI 人物生成的相关测试,同时将这一段时间的经验分享出来。
刚开始接触和使用 Midjourney 的时候,最大的问题在于生成的人物图片无法保证人物位置的大小和视角,想要固定某一种动作,只能通过垫相同动作的图片的这种方式去解决。
后来经过一些了解摄影的朋友,通过他们了解到这些都是可以通过摄影的知识来补充的这方面短板的。
后来我去咨询了 chatgpt,它确实给了我一些很有用的方向。
根据 ChatGPT 的建议,我这里将生成 AI 人物类型图片的方向确定为一下 7 方面:
-
人物构图的视角选择
-
人物角度的选择
-
人物距离的选择
-
人物表情的选择
-
人物氛围感的选择
-
人物服装的选择
-
人物风格的选择
通过这 7 个方向,我们来进行了实验。
二、人物构图的视角选择
视角可以按照相机相对于被拍摄对象的位置,分为正面、背面和侧面。
当然,拍摄角度不仅限于这三个方向,还可以有更多不同的角度选择,这需要根据被拍摄对象和拍摄需求来选择合适的角度。
测试:不加入关键词的 AI 生成的图片会是什么样子?
生成思路:年轻的女孩
生成咒语:young girl, --ar 16:9
通过随机生成的 8 张来看,由于没有其他关键词的约束,目前随机出来默认的人物形象偏欧美风,人物视角的比例偏差也都保持在了正面和侧面,那么我们现在可以通过增加构图视角的关键词来限定人物呈现的视角。
我们来看看增加不同视角之后的样子吧。
1. 正视角
正视角是指在人像构图时,拍摄对象正对着相机的姿态,使人像呈现出正面的视角。
咒语关键词:Front view
生成思路:正视角的年轻女孩
生成咒语:young girl, front view, --ar 16:9
通过随机生成的图片来看,由于受到正视角关键词的约束,目前随机出来人物都是偏正面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。
2. 后视角
后视角是指从被摄对象的背后拍摄的视角,也就是以被摄对象的背部为主要构图元素的拍摄方式。
这种视角可以营造出一种神秘或者引人遐想的氛围。
咒语关键词:Back view angle & Back angle
生成思路:后视角的年轻女孩
生成咒语:young girl, back view angle, --ar 16:9
通过随机生成的图片来看,通过后视角关键词的约束,目前随机出来人物都是展现人物背面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。
3. 侧视角
侧视角是指观察或拍摄物体或场景时从侧面的角度观察。
在视觉艺术中,侧面视角可以用于展示物体的形状和轮廓,或者创造深度和距离的感觉,同时可以用于捕捉被摄对象的侧面,突出其特征和特点。
咒语关键词:Side view & Shoulder level view
生成思路:侧视角的年轻女孩
生成咒语:young girl, Side view, --ar 16:9
通过随机生成的图片来看,通过侧视角关键词的约束,目前随机出来人物也都是侧面的形象,结果相对来说也是较好的,那么我们就继续来看一看其它的视角。
4. 仰视角
仰视角是指观察或拍摄物体或场景时从底部的角度观察。
在人物构图中,仰视角可以用于捕捉俯瞰等场景,或者突出被摄对象的底部特征,这个视角通常会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。
咒语关键词:Bottom view & Low angle view
生成思路:仰视角的年轻女孩
生成咒语:young girl, low angle view, --ar 16:9
通过随机生成的图片来看,通过仰视角关键词的约束,目前随机出来人物的形象,结果看起来确实是仰视角,但是从摄影角度来看的话,只有第三、第四张照片构图会符合大众审美以外,其它图片的角度的图片都是有一定问题存在的,那么是什么问题造成的呢?我们一会儿深究!现在先继续来看一看其它的视角。
5. 俯视角
是指摄像机的视线从上方向下拍摄被拍摄对象,这种角度通常可以让拍摄者更好地捕捉到人物的身体语言和动作,通过强调身体语言和动作、放大视觉效果。
咒语关键词:Bird's-eye view
生成思路:俯视角的年轻女孩
生成咒语:young girl, lbird's-eye view, --ar 16:9
咦!这个生成的结果跟上面仰视角度的结果一样,生成的图片好像确实没有什么很大的问题,但是又有一种明显不对的感觉。
于是我又咨询了一下那位玩摄影的朋友,他看完之后告诉我,很多时候除了视角需要保证之外,还需要考虑人物在画面之中的位置以及拍摄的高度来呈现的视觉效果的,也就是说还需要考虑人物的角度和人物的距离,那我们接下来看看,到底是不是如此。
还有其它特殊视角,大家可以根据关键词自由尝试,例如:
-
自由视角(Free camera)
-
固定视角(Fixed camera)
-
运动视角(Dynamic)
-
透视视角(Perspective)
三、人物角度的选择
什么是人物的角度选择呢?通俗来说就是拍摄的高度。
不同的拍摄角度可以呈现出不同的情感和视觉效果,可以通过选择合适的拍摄角度可以突出被拍摄对象的特点,提高照片的表现力。
一般常用的有这 3 种角度
-
高角度:位于被拍摄对象的上方,适合拍摄俯视角度的场景,可以突出被拍摄对象的大小和高度。
-
低角度:位于被拍摄对象的下方,适合拍摄仰视角度的场景,可以突出被拍摄对象的高度和威严感。
-
平视角度:与被拍摄对象在同一高度,适合拍摄平面场景,可以突出被拍摄对象的水平线和平衡感。
1. 低角度
位于被拍摄物体的下方,可以强调物体的高度感,适用于拍摄建筑物、树木等。
咒语关键词:Low angle view
生成思路:低角度的年轻女孩
生成咒语:young girl, low angle view, --ar 16:9
这次配合使用角度生成的结果的确也比之前单纯使用仰视角生成的结果要好很多了,没有出现人物对镜头的感觉了,图片整体实现的结果还是比较和谐的,那我们继续看一看其它的角度。
2. 高角度
位于被拍摄物体的上方,可以强调物体的底部,适用于拍摄人群、城市等。
咒语关键词:High angle view
生成思路:高角度的年轻女孩
生成咒语:young girl, high angle view, --ar 16:9
从这次的生成结果上来看用俯视角+高角度生成的图片,要比单纯使用俯视角生成的结果更自然,更符合人物摄影的特征。
3. 平视角度
位于被拍摄物体高度相同,呈现出一种中性的视角,适用于拍摄人像、风景等。
咒语关键词:Eye level view
生成思路:平视角度的年轻女孩
生成咒语:young girl, eye level view, --ar 16:9
四、人物的距离选择
接下来我们继续看看人物距离的选择,在人物构图时,可能需要选择合适的焦点来突出人物,可以根据下面 6 种距离方式来确定人物的位置。
1. 局部特写
这里的特写一般是指拍摄人物头像照片的视角,通常是拍摄人物的头部和肩部,使其成为画面中的主体,其目的是展示被摄者的面容和特征。
这种构图通常采用近距离的拍摄,与头像类似,面部镜头通常侧重于展示被摄者的面容和特征,但相比头像更注重表情、眼神和情感的表达,主要会展示人物的整张脸部。
咒语关键词:Extreme closeup (ECU)
生成思路:特写距离的年轻女孩
生成咒语:young girl, extreme closeup, --ar 16:9
2. 头部以上
通常是将被摄者的面部特写拍摄得非常近,以便突出细节和表情。
咒语关键词:Headshort
生成思路:头部以上位置的年轻女孩
生成咒语:young girl, headshort, --ar 16:9
3. 胸部以上
通常是从腰部或腹部到头部的拍摄方式,可以突出被摄者的胸部线条和面部表情。
咒语关键词:Chest shot
生成思路:胸部以上位置的年轻女孩
生成咒语:young girl, chest shot, --ar 16:9
4. 腰部以上
通常是从腰部到头部的拍摄方式,可以突出被摄者的腰部线条和面部表情。
咒语关键词:Waist shot & bust portrait
生成思路:腰部以上位置的年轻女孩
生成咒语:young girl, waist shot, --ar 16:9
5. 膝盖以上
通常是从膝盖到头部的拍摄方式,可以突出被摄者的腿部线条和面部表情
咒语关键词:Medium full shot
生成思路:膝盖以上位置的年轻女孩
生成咒语:young girl, medium full shot, --ar 16:9
6. 全部身体
通常是将被摄者的全身拍摄在画面中,可以突出被摄者的身体线条和服装风格。
咒语关键词:Full length shot
生成思路:全部身体的年轻女孩
生成咒语:young girl, full length shot, --ar 16:9
五、人物表情的选择
不同的人物表情可以传递出不同的情感和意境,对于人物表情,可以选择合适的表情来表达所想要的情感和意境。
这里在「Midjourney 关键词」表格中选取几个常用表情示例一下,其它的大家可以自己选择关键词进行 AI 生成。
1. 高兴的
咒语关键词:Smiling
生成思路:正视角下高兴的年轻女孩
生成咒语:young girl, smiling, front view, --ar 16:9
前面 4 张是使用 Smiling 生成出来的,可以看出来,只是在面部表情上有一些细微的变化,后面 4 张是使用 happy 生成出来的,可以看出来,结果除了面部表情还包含着一些动作上的变化。
可以看出不同的咒语表达出来的结果也是不同的,所以有时候在没有达到我们想要的结果的时候,可以尝试换一个咒语。
2. 生气的
咒语关键词:Angry
生成思路:正视角下生气的年轻女孩
生成咒语:young girl, angry, front view, --ar 16:9
3. 哭泣的
咒语关键词:Crying
生成思路:正视角下哭泣的年轻女孩
生成咒语:young girl, erying, front view, --ar 16:9
从生成的结果上来看,只有少数结果中在哭泣的状态下有泪水的状态,说明这种表情还需要其它更多修饰性的咒语来辅助完成,才能达到一个理想的状态。
当然除了以上这些常见的表情之外,还有像更多其它类型的表情,比如:害怕的(Afraid)、嫉妒的(Jealous)、困惑的(Confused)、自信的(Confident )、厌恶的(Disgust )、厌恶的(Surprise )等等一些面部情绪上的表达都可以使用,这些大家可以自行去探索。
六、人物氛围感的选择
曾经听那位热爱摄影的朋友经常经常说:“掌握了灯光,其他一切都水到渠成。”
确实合理利用光线可以创造出丰富的表现效果,增强照片的立体感,让人物更有表现力和氛围。
这里要说明一下,我不是专业的摄影师,灯光属于摄影这门学科里的是比较重要的课程,这里的灯光的使用,只适合在 midjourney 的关键词内作为参考使用,不能作为实际拍摄中的参考。
在 AI 里面来说,一般不写灯光的描述,AI 出图也不会差到哪去,所以新手大多数人会忽视灯光这个参数。
这里我们在自己收集的「Midjourney 关键词」库中选取几个有代表性的灯光参数,来观察一下不同灯光在五官上的作用。
1. 暖光源
暖光源通常指发出较为偏黄或橙色色调的光源。
这种色调的光源通常具有较低的色温,它们能够让照片呈现出一种温暖、柔和的感觉。
咒语关键词:warm light
生成思路:在暖光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [warm light] :: 10, --ar 16:9
这里测试了暖光源下权重为 10 和权重为 1 的画面效果,可以看出这种光线权重越高的暖光源生成的画面更加有光源的质感。
有很多人习惯直接使用 warm light 的咒语也是可以的,但通过权重去控制光源的强度会是一种比较合适的做法。
2. 柔光源
柔光是指通过一种柔和的方式来照亮被拍摄物体的光线。
这种光线通常是通过对光源进行漫反射处理来实现的,使光线变得柔和、均匀和没有硬边缘。
咒语关键词:Soft light
生成思路:在柔光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [soft light] :: 5, --ar 16:9
这里测试了柔光源下权重为 10 和权重为 5 的画面效果,可以看出这种光线并不是权重越高生成的画面更加合适,反而适中的权重,画面更加有质感。
3. 轮廓光源
轮廓光源是指用于在照片中产生明亮边缘或轮廓的一种照明技术。
它通常是在被摄物体的背景或侧面照明上使用的,以使物体与周围环境产生对比。
这种技术通常需要一个强而集中的光源,如聚光灯或反射板,并且需要将光源放置在物体的背面或侧面。
咒语关键词:Rim light
生成思路:在轮廓光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [rim light] :: 5, --ar 16:9
轮廓光其实和边缘光(Edge light)很像,这两种光方便在大场景下人物能从背景里分离出来,更突出。
像很多电影海报,人物拍摄两边或者一边都会加点轮廓光。
4. 霓虹光源
Midjourney 中一种可玩性比较高的光源,经常看到大多数作品中出现这种光源,因为这个光源色彩的多样性和不规则状态,让画面中的主体可以反射出夺目的色泽。
咒语关键词:Neon light
生成思路:在红色霓虹光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket in red thriller, [neon light] :: 5, --ar 16:9
从生成的结果上可以看出,这种光源的权重越高,画面更有质感。
5. 伦勃朗光
勃朗光是一种经典的摄影和绘画技巧,得名于荷兰画家伦勃朗。
它是通过在主体的一侧投射强烈的光线,并在另一侧形成阴影,以强调主体的轮廓和表情的一种技术。
这种技术可以让照片或绘画更具有戏剧性和立体感。
咒语关键词:Rembrandt light
生成思路:在伦勃朗光下,一个正视角穿着装带着微笑的女孩
生成咒语:1 Smiling girl dressed in professional attire, front view, in [rembrandt light] :: 10, --ar 16:9
七、人物服装的选择
服装要想玩的细致,也是需要了解很多服装相关的知识点,不过这里可以使用一个万能固定句式来尝试
「主题」+「风格」+「材质」+「元素」+「玄学佐料」
主题:汉服、长羽绒服、连衣裙、礼服裙...
风格:简约、现代、复古、朋克、英伦亚文化、文艺复兴、洛可可、超现实主义...
材质:棉布、羊毛、丝绸、皮革、工艺...
元素:形状、纹理、颜色、细节、图案、配件...
感觉要学习的知识有好多好多....
服装示例
咒语关键词:Chinese dress
生成思路:一个穿着中国清代宫廷刺绣旗袍,宽袖渐变红色加上刺绣雪纺面料,镶钻工艺,上面还有金丝雀和白玫瑰元素等刺绣元素
咒语:1 girl, she was wearing a Chinese dress, wide sleeves gradient red x embroidered chiffon fabric, qing dynasty palace embroidery, canary and white roses element, embroidered hosta, x diamond-encrusted craftsmanship, elegant, fairy air, digital rendering, super lifelike, super detailed, luxury, movie lighting, super clear details, super clear materials, close-up, complex textures, octane rendering, Zbrush, 8K, Vray super lifelike,--ar 9:16
前面 4 张只使用了 Chinese dress 生成后,服装比较素也没有颜色,服装的细节也比较少。
后面 2 张添加了材质装饰细节之后,服装就比较精致。
大家可以通过这个万能的固定句式去尝试一下关于服装的细节。
八、人物风格的选择
风格类型的绘制其实是比较复杂的,因为全世界那么多艺术家的风格和流派各式各样,而且各种风格在 AI 里都是可以相互融合的,这个需要大家懂得基本的绘画风格,提高艺术鉴赏能力,才能创造更多的无限可能。下面分享一些常用好看的风格。
1. 写实人物
咒语关键词:90s Hong Kong-style street
生成思路:一对情侣在 90 年代的香港街头
生成咒语:A couple taking street snaps in a 90s Hong Kong-style street, Eye level view, Waist shot, detailed face, detailed eyes, beautiful, --ar 3:4
通过咒语的结果可以看到,这种风格不需要设定特殊的风格关键词,属于默认生成的类型,只需要描述好人物和场景,在加入一些镜头的参数即可生成比较有质感的图片。
2. 丙烯酸绘画
咒语关键词:Acrylic painting
生成思路:一个丙烯插画风格的抬头微笑的可爱女孩,有荧光色系的未来感,2d 和 3d 的结合,色彩角度不常规。
生成咒语:acrylic painting,illustration, futurism, NFT art, Fluorescent color, Laser color, A cute girl who looks up and smiles, Combination of 2d and 3d, solid color background, cel shading, Tindal effect, Non-photorealistic rendering, Transparency, Color Slant, animation, blender, geometry art。
这类型的风格就是叠加各种色彩丰富的艺术风格。
3. 轻质感 3D
咒语关键词:Popmart blind box
生成思路:一个穿着黄色连帽衫和帽子的非常可爱的女孩正在热带雨林中探索和奔跑,带一点粘土性质的泡泡玛特风格,三维渲染
生成咒语:popmart blind box, clay masterial, A very cute girl wearing a yellow hoodie and a hat is exploring and running in a tropical rainforest, 3D rendering, c4d, Octane rendering, Pixar trend, animation lighring, depth of field, ultra detailed, Hyper realistic, --ar 3:4
从生成的结果上看,盲盒感即时就有了。
4. 水墨风
咒语关键词:Ink painting
生成思路:使用水墨风的插画方式,融合一种艺术家的风格以及粗旷的笔触,生成一张正视角的金刚狼形象,在白色背景下,有红色黄色。
生成咒语:Ink painting, illustration, Wolverine, front view, white background, Yoji Shinkawa style, bold brushstrokes, Concept art, red black yellow and white, stylize, --ar 3:4
水墨风搭配艺术家风格,是不是很有意思呢。
5. 国风插画
咒语关键词:Extremelybold outline
生成思路:一个穿着中式传统服装、手持纸扇、黑发棕眼、花卉装饰、红色背景、鲜艳色彩的女王形象,用极粗的线条描边,插画风格
生成咒语:llustration, extremelybold outline, A queen dressed in Chinese traditional clothing and holding a paper fan, black hair, brown eyes, floral, red background, vivid color, acrylic painting, pixiv8kbest quality, ultra detailed, --ar 3:4
这类型的风格一定要尽可能多的中国元素,对于国风来说,画风反而是最重要了,这种风格如果缺少中国元素,最后会变成二次元,所以需要加一点国画水墨水彩来进行强调。
6. 像素艺术
像素艺术最早出自二十世纪中后期电脑应用程式的图像(Icon),以及早期的 8 位元(8-bit)电子游戏。
后来像素风格逐渐演变成了一种独立的数字艺术创作风格。
广义上的像素艺术还包括立体像素艺术(对,就是乐高那种)。
咒语关键词:Pixel art
生成思路:一家像素艺术风格的餐厅
生成咒语:[16-bit pixel art]:: 10, illustration, cozy cafe, china, --ar 3:4
不过,从结果上看 Midjourney 目前并不能创建真正的像素艺术,因为用 Midjourney 你无法获得纯净的矢量图像,知识将 Midjourney 图像“像素化”的像素艺术。
结语
好了,人物篇就暂时写到这里了,生成一张满意的人物类型的图片我们需要输入的文字越精准,才能到越合心意的图片。
这里我们总结一下关于生成人物的万能固定句式,一个越和心意的人物结果需要包含「人物的客观描述」+「视角」+「角度」+「距离」+「表情」+「服装」+「风格」+「光源」这些内容,当然你也可以只取其中部分的也会得到一个还不错的结果。
同时,Midjourney 要想达成自己期望的效果,可能不是只用一段魔法就能达成效果,可以多次逐步完成自己的效果,以前总想着一步达成目标,就去堆积好多的关键词在一段魔法里面,很多生成的结果很多次都不尽人意,尝试分步骤拆开之后,结果就好很多。
Midjourney进阶教程!7大方向快速生成合心意的AI人物形象 - AI人工智能 - 执刀人的工具库