和 dalle2 配合生成故事绘本
在之前章节中,我们已经尝试过让 ChatGPT 来生成一些故事情节,不管是影视剧还是小说还是游戏都可以。这时候,自然而然的可以联想到:那我们可不可以一步到位,把 ChatGPT 编出来的故事情节,再画成连环画、甚至生成动画视频呢?
事实上,ChatGPT 和 Dalle2 配合完成故事绘本,完全有可能。由 ChatGPT 完成故事,并抽象每一节的场景描述为绘图 Prompt,导入到 Dalle2 中,按照需要设定绘本风格,生成图片。最后加上一点基础的 PS 操作,给图片补上文案就行了。
国外著名的 reddit 社区上,就有人在 openai 频道分享了自己这样制作出来的克苏鲁风格漫画,一共耗时 2 小时:https://www.reddit.com/r/OpenAI/comments/1161bpr/chatgpt_story_dalle_2_artwork_i_just_put_it/。
这里我们不尝试复现网友的绘本,用一个更简单有趣的场景,来尝试完成自己的故事。
第一步,让 chatgpt 生成一个程序员笑话:
编一个简短的程序员笑话。要体现中国、美国、日本三个国家和国民性格的特色。笑话的背景是三国程序员修复了网站的死链接问题,然后设计一个长期方案让未来也不再出现这个问题。
第二步,考虑做成一个四格漫画。继续让 ChatGPT 生成 prompt:
大致思路就是用keyboard、app、paper 来做核心区分。我们稍作调整,尝试在免费的 bluewillow 频道上运行 prompt 生成图片,最终得到如下结果:
随机种子的效果还是千差万别的,不过总体来说,变体 2 的大致布局可以接受。那么点击 V2 按钮,在这个布局基础上重新生成:
选择一个合适的图,可以点击 U2 进行高清细节绘制,并复制 url。
然后根据四格漫画的特点,接下来两个同样应该采取类似布局,取得一个"找不同"的反差效果。所以我们进入图生图的环节,在新的 prompt 前附加上一格选定效果图的 url:
重复前几步操作,调整 prompt 中的关键词,就可以得到每一格子内的插画了。
最后,我们把生成的插图,拼接成四格漫画。此处可以直接借用现成的工具,比如 PS、美图秀秀等。我们这里直接使用美图秀秀的四格拼图功能来完成,加上统一的蒙版,保证黑白风格。为了表达更清晰,还可以给每个图的人物加上对话框文字。为了更风趣,三国程序员应该用三国文字,利用 ChatGPT 的语言翻译功能,得到日文,加入图中:
一张风趣有意思的四格漫画就基本完成了。对效果要求更高的,还可以对其中细节做调整,比如显示屏上改成 IDE 或者 dashboard,墙上乱码字母改成有意义文字等等。AI 画图目前还缺乏对文字的理解,这一步还是需要手动编辑加入的。
整体操作下来,包括重复生成挑选效果,包括 prompt 中个别关键字的调整尝试,一共花费大概一个小时时间。对非专业美工而言,可以非常满意了。