有主题的图文内容创作

有主题的图文内容创作 | AIGC实践

话说，昨天我发布了第一篇，内容由ChatGPT和Midjourney协助完成的文章：胡同与侏罗纪公园的时空交错 | 胡同幻想

在这篇文章中，大约70%+图文内容由ChatGPT和Midjourney输出。我个人参与的部分，主要是提出指令（Prompt），审核AI应用输出的图文内容，并完成文章的最终编辑和发布。

由此不禁感叹，得益于科技发展，才有此机会，将头脑中超现实的幻想加以呈现。

那么今天就来简单复盘和分享一下，我的第一次AIGC实践。

操作说明

制作这篇文章的主要操作思路是这样的：

策划与编辑发布

由于第一次实践AIGC缺乏创作经验，过分沉迷于通过AI应用输出文本和图像的过程，造成策划部分相对薄弱，直接导致在编辑发布阶段，发现AI应用输出的文本和图像存在不满足的情况，因此人为地进行了比较大的调整，包括但不限于：

手动编写Midjourney指令，补充图像。
根据ChatGPT输出文本，重新编写文章标题、正文和图像说明。

后续实践，会更加重视策划环节，提升Prompt和AIGC输出的质量，减少后期编辑发布的工作。

本文主要介绍AIGC操作（输出图片/文本）的部分，策划与编辑发布的部分会在后续的实践中改进后，再做复盘分享。

输出图片

步骤1：输入ChatGPT指令【Prompt1】，生成图像描述。

ChatGPT指令：

我想让你充当Midjourney人工智能程序的提示生成器。你的工作是提供详细和有创意的描述，以激发人工智能的独特和有趣的图像。请记住，人工智能能够理解广泛的语言，并能解释抽象的概念，所以请自由发挥想象力和描述力，尽可能地发挥。例如，你可以描述一个未来城市的场景，或一个充满奇怪生物的超现实景观。你的描述越详细，越有想象力，产生的图像就越有趣。

请以北京胡同为背景，构思1条与恐龙有关，具有科幻色彩的场景描述。要求：

- 恐龙的种类有所区别，包括但不限于：霸王龙；迅猛龙；角鸟龙；暴龙；三角龙；剑龙。

- 画面的景别有所区别，包括：广角；全景；中景；近景；特写。

- 画面细节尽可能丰富；描述中应包含“北京胡同”作为关键字。

说明：

在此可以要求ChatGPT同时输出多条描述，但出于缩减篇幅的考虑，在此仅以输出1条描述作为举例。
指令包含2个部分。第一部分来自于网络；后面补充上我的具体要求。
具体要求已尽可能地包含了当时想到的全部，但从输出结果来看，仍有进一步细化和提高的空间。

ChatGPT输出：

广角全景：在北京胡同的拐角处，一只巨型蜥蜴类恐龙正在穿越狭窄的巷道。它的长尾巴拖过石板路，传出震天动地的声响。街道两旁的房屋被它的龙尾扫倒，墙体上裂出了深深的痕迹。

步骤2：从ChatGPT输出的图片中，选取自己比较感兴趣的描述，进行必要修改。

修改包括但不限于：

删除冗余信息。例如，“传出震天动地的声响”这种对于声音的描写，个人认为无法通过画面表现，因此删除。
添加元素和细节描写。例如，增加“路人惊恐地望着这一切”与主体形成对比。
添加风格说明等。例如，我个人比较偏好纪实摄影，为公众号策划内容时，会考虑希望能够延续以往的拍摄风格，因此增加了“纪实照片风格”。

于是图像描述修改为：

广角全景：在北京胡同的拐角处，一只巨型蜥蜴类恐龙正在穿越狭窄的巷道，它的长尾巴拖过石板路，街道两旁的房屋被它的龙尾扫倒，墙体上裂出了深深的痕迹。路人惊恐地望着这一切。纪实照片风格。

步骤3：输入【ChatGPT】指令【Prompt2】，将修改后的图片描述翻译为英文。

ChatGPT指令：

翻译：【步骤2中修改后的图像描述】

ChatGPT输出：

Wide-angle panoramic view: At the corner of a hutong in Beijing, a giant lizard-like dinosaur is crossing the narrow alley. Its long tail drags on the stone pavement, making a deafening sound. The houses on both sides of the street are knocked down by its dragon tail, leaving deep marks on the walls. The style of the photograph is documentary.

说明：实际上，部分AI应用可以支持中文输入，如ChatGPT；部分不支持，如Midjourney；或者支持得不好，如BlueWillow。所以，对于Midjourney和BlueWillow而言，把中文指令翻译为英文指令，往往可以获得更好的输出结果。

步骤4：将翻译结果作为指令【Prompt3】输入【Midjourney】，并输出图像。

说明：个人认为，Midjourney的出图效果已经很好了。如果想调整描述，多次尝试，重复步骤2~3。

输出文本

步骤5：输入【ChatGPT】指令【Prompt4】和【Prompt5】，分别输出标题和文章的文本内容。

ChatGPT指令：

假如你是一个资深的新媒体创作者，请基于给定主题，和参考内容，概括主要内容，输出一段文章的开头。

要求：不少于300字；采用口语风格；语言风格轻松活泼。

给定主题：如果胡同变成侏罗纪公园，会是什么样子？

参考内容：【步骤2中修改后的图像描述】

ChatGPT输出：

如果胡同变成侏罗纪公园，那么会是什么样子呢？想象一下，你走在胡同里，突然听到震耳欲聋的吼声，转过身却发现一只巨型的蜥蜴类恐龙正在你面前穿越狭窄的巷道。这是不是很惊险刺激？或者，你正要进入一家小店，门口却站着一个小男孩与一只小型的肉食龙对峙，男孩紧握着骨头棒，显得异常勇敢。这是不是很可爱有趣？这些场景都来自于想象力丰富的艺术家们的创作，如果胡同真的变成了侏罗纪公园，场景可能会更加生动，也许你会在胡同的屋顶上看到一只远古的飞龙正在展翅飞翔，或者在胡同的中央看到一只巨大的暴龙在巨大的石头上休息。这些景象让人眼前一亮……

ChatGPT指令：