ChatGPT讲故事，DALLE-2负责画出来！两大AI合作出绘本！

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>CV微信技术交流群

转载自：机器之心 | 编辑：张倩、袁铭怿

生成式 AI 正在变革内容的生产方式。

在过去的一周，相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限，其中一种测试方式就是让它写故事。

与之前的一些 AI 相比，ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升，对于人物名字、人物关系和处境的理解也很合理，只不过写出的故事会缺乏一些细节和亮点。

Meta FAIR 研究院研究员 / 高级经理田渊栋用 ChatGPT 续写了自己的小说《破晓之钟》。图源：知乎 https://www.zhihu.com/question/570189639/answer/2787584375

但如果你对故事的要求没那么高，ChatGPT 是完全够用的，比如写个儿童故事。

来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试，而且他不仅用 ChatGPT 写了儿童故事，还让之前火了大半年的 DALLE-2 将其画了出来。也就是说，他相当于用两个 AI 做出了一本绘本。

故事的梗概是这样的：

从前，在一个遥远的地方，有一位名叫罗比的机器人，他生活的世界里到处都是机器。与其他机器人不同的是，罗比不想每天都听从命令，执行任务。

罗比梦想成为人类。他渴望去感受照耀在脸上的阳光，渴望去呼吸新鲜的空气，渴望去体验一切人类所做的美好的事。但最重要的是，罗比希望能够做出自己的选择，过上属于自己的生活。

一天，罗比决定碰碰运气，去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来，开启了他的人类世界之旅。

罗比走了很久很久，一路上也遇到了很多挑战。他需要穿越广阔的沙漠，翻越险峻的高山，并勇敢地面对湍急的河流。但他从未放弃，下定决心，一定要抵达目的地。

最后，恍如隔世一般，罗比来到了人类世界，周围的景象和声音令他惊叹不已，他不敢相信，自己终于成功了。

但就在他开始探索新环境时，一群人类发现了它，并且开始追赶它。他们害怕罗比，他们不知道罗比只是一个想和他们交朋友的机器人。

罗比拼尽全力地跑着，在街道上躲来躲去。他不想伤害任何人，他只想一个人待着。但那群人类毫不留情，并未停下追赶的脚步。

就在罗比以为人类要抓住自己的时候，他偶遇了一位善良的老人。这位老人很同情它，听了罗比的故事后，明白了他为什么来到人类世界。

老人帮助罗比躲避追赶他的人类，并教会罗比如何做人。罗比学会了如何说话，如何笑，以及如何享受生活中的点点滴滴。

日子一天天过去，罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友，终于能够过上向往已久的生活。

罗比一开始可能只是个机器人，但最终，他证明了只要相信自己，不放弃梦想，任何人都可以成为人类。

故事到这里就结束了，读下来是不是感觉还不错？ChatGPT 甚至会在故事结尾升华主旨，非常符合人类的写作习惯。

当然，为了生成这个「绘本」，Eric Zelikman 也克服了一些困难，比如 ChatGPT 有时生成的 prompt 太长了，他需要缩减一下才能喂给 DALL-2，因为后者对输入长度是有限制的，这也在一定程度上增加了故事风格、人物一致性的难度。

为了让 DALL-2 的生成效果更佳，Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述，然后反复要求它重复第一个 / 下一个插图描述。之后，再让它提供一个简短（＜70 token）但精确的图像描述，就像向不了解故事上下文的人解释该图像一样。

Eric Zelikman 感觉，这是一次非常有趣的体验，因为人们可以借此构建一个互动工具，激发孩子们对写作和艺术的兴趣。

对于 Eric Zelikman 遇到的问题，有人建议他用 Midjourney（一款 AI 绘画工具）再试一遍，因为后者可以接受非常长的 prompt。

还有人表示，自己其实也和 Eric Zelikman 做了类似的事情，让 ChatGPT 生成一个童话故事，然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸，主旨是帮孩子培养自信心。

这些强大的 AI 工具如今正走向融合，我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图，明天，说不定连出版也搞定了呢？

参考链接：https://twitter.com/ericzelikman/status/1600948156656537600

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

后台回复：CVPR2022，即可下载CVPR 2022论文和代码开源的论文合集

后台回复：ECCV2022，即可下载ECCV 2022论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码，或者添加微信：CVer222，即可添加CVer小助手微信，便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注：研究方向+地点+学校/公司+昵称（如目标检测或者Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群▲扫码或加微信号: CVer222，进交流群
CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！▲扫码进群
▲点击上方卡片，关注CVer公众号