ChatGPT讲故事,DALLE-2负责画出来!两大AI合作出绘本!

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>CV微信技术交流群

转载自:机器之心 | 编辑:张倩、袁铭怿

生成式 AI 正在变革内容的生产方式。

在过去的一周,相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限,其中一种测试方式就是让它写故事。

与之前的一些 AI 相比,ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升,对于人物名字、人物关系和处境的理解也很合理,只不过写出的故事会缺乏一些细节和亮点。

c442d82d4a0e4bb4bb80b147436d10f3.pngMeta FAIR 研究院研究员 / 高级经理田渊栋用 ChatGPT 续写了自己的小说《破晓之钟》。图源:知乎 https://www.zhihu.com/question/570189639/answer/2787584375

但如果你对故事的要求没那么高,ChatGPT 是完全够用的,比如写个儿童故事。

来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试,而且他不仅用 ChatGPT 写了儿童故事,还让之前火了大半年的 DALLE-2 将其画了出来。也就是说,他相当于用两个 AI 做出了一本绘本。

db999edcc4c35ceed8f065bc88fcdcc7.png

故事的梗概是这样的:

从前,在一个遥远的地方,有一位名叫罗比的机器人,他生活的世界里到处都是机器。与其他机器人不同的是,罗比不想每天都听从命令,执行任务。

e4690f7bfbe9e6a9f125e63b44bb94ec.jpeg

罗比梦想成为人类。他渴望去感受照耀在脸上的阳光,渴望去呼吸新鲜的空气,渴望去体验一切人类所做的美好的事。但最重要的是,罗比希望能够做出自己的选择,过上属于自己的生活。

6287a2b36551be4aad302e6e5e519af6.jpeg

一天,罗比决定碰碰运气,去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来,开启了他的人类世界之旅。

94f6980b930815980e8ce834e1ef2953.jpeg

罗比走了很久很久,一路上也遇到了很多挑战。他需要穿越广阔的沙漠,翻越险峻的高山,并勇敢地面对湍急的河流。但他从未放弃,下定决心,一定要抵达目的地。

304372cfe8ed03ab0b465a1795c61735.jpeg

最后,恍如隔世一般,罗比来到了人类世界,周围的景象和声音令他惊叹不已,他不敢相信,自己终于成功了。

040cf9d54f2c11c7e1667da678271c22.jpeg

但就在他开始探索新环境时,一群人类发现了它,并且开始追赶它。他们害怕罗比,他们不知道罗比只是一个想和他们交朋友的机器人。

350d38ffff5b38d91afc2c8d2e0067e0.jpeg

罗比拼尽全力地跑着,在街道上躲来躲去。他不想伤害任何人,他只想一个人待着。但那群人类毫不留情,并未停下追赶的脚步。

988aa4d02563dc1551c88f9406d42e91.jpeg

就在罗比以为人类要抓住自己的时候,他偶遇了一位善良的老人。这位老人很同情它,听了罗比的故事后,明白了他为什么来到人类世界。

7cd26ce68448b7737b1e007057cfe7e0.jpeg

老人帮助罗比躲避追赶他的人类,并教会罗比如何做人。罗比学会了如何说话,如何笑,以及如何享受生活中的点点滴滴。

2ab57b18ded441850ba69248f965e249.jpeg

日子一天天过去,罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友,终于能够过上向往已久的生活。

d77e1a2191c3696281c04ed0eddc52f6.jpeg

罗比一开始可能只是个机器人,但最终,他证明了只要相信自己,不放弃梦想,任何人都可以成为人类。

48de43e1a97685788450b2baff1bcac8.jpeg

故事到这里就结束了,读下来是不是感觉还不错?ChatGPT 甚至会在故事结尾升华主旨,非常符合人类的写作习惯。

当然,为了生成这个「绘本」,Eric Zelikman 也克服了一些困难,比如 ChatGPT 有时生成的 prompt 太长了,他需要缩减一下才能喂给 DALL-2,因为后者对输入长度是有限制的,这也在一定程度上增加了故事风格、人物一致性的难度。

为了让 DALL-2 的生成效果更佳,Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述,然后反复要求它重复第一个 / 下一个插图描述。之后,再让它提供一个简短(<70 token)但精确的图像描述,就像向不了解故事上下文的人解释该图像一样。

6f198d2f1512064c791b6bed5dce7d6b.png

Eric Zelikman 感觉,这是一次非常有趣的体验,因为人们可以借此构建一个互动工具,激发孩子们对写作和艺术的兴趣。

408b3b0737f263c615ccb1bc404a23c2.png

对于 Eric Zelikman 遇到的问题,有人建议他用 Midjourney(一款 AI 绘画工具)再试一遍,因为后者可以接受非常长的 prompt。

12fb4689e3b5af2c182b55d8125699ca.png

还有人表示,自己其实也和 Eric Zelikman 做了类似的事情,让 ChatGPT 生成一个童话故事,然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸,主旨是帮孩子培养自信心。

c9916110c30b0d32389baf933032eb16.png

这些强大的 AI 工具如今正走向融合,我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图,明天,说不定连出版也搞定了呢?

75c44e721ec1104a9ccaf86d0cb5ddbc.png

参考链接:https://twitter.com/ericzelikman/status/1600948156656537600

 

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

 

后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20893.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT绘本故事,引领孩子探索神奇世界!

现在很多家长忙于工作,无暇陪伴孩子,老人或者身边的带小孩的家人不会给孩子读绘本故事怎么办? 这时ChatGPT的出现就派上大用场了,只要有手机,不会读绘本的大人们及孩子们都可以轻轻松松地进入童话世界,同时…

iPhone、Mac上都能跑,刷屏的Llama 2究竟性能如何?

来自:机器之心 进NLP群—>加入大模型与NLP交流群 虽然性能仍不及ChatGPT 3.5,但开源的力量是无法估量的。 昨天凌晨,相信很多人都被 Meta 发布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示,「对于人工智…

谜题科技发布Enigma Alpha平台,开启AI生成决策动作篇章!

近日,上海数字大脑研究院孵化的独立初创企业谜题科技(Enigma Tech)发布了 AIGA(人工智能生成动作)系统 Enigma Alpha,实现了自然语言对话交互、工具增强的自然语言对话交互、以自然语言为接口的物理/虚拟世…

马斯克:用AI干掉AI

数据观 2023-04-17 14:48 发表于贵州 ❑ 导 读 马斯克呼吁暂停人工智能开发!然后,他成立了一家人工智能公司... 全文共计3189字,预计阅读时间7分钟 来源 | 数据观综合(转载请注明来源) 编辑 | 蒲蒲 OpenAI大型预训练人…

阿里开业项目chat2DB-人工智能SQL分析介绍

1. chat2DB简介 1-1. 简介 ​ chat2DB是一款有开源免费的多数据库客户端工具,支持windows、mac本地安装,也支持服务器端部署,web网页访问。和传统的数据库客户端软件Navicat、DBeaver 相比Chat2DB集成了AIGC的能力,能够将自然语…

探索AI对话技术的未来发展趋势

文章目录 一、chatgpt是什么?二、世界对于chatgpt的看法三、chatgpt会是拉普拉斯妖么?四、革命?现实意义存在么?五、人工智能总结 一、chatgpt是什么? 我们来看看其它人工智能给它的定义 在我看来chatgpt是一种对话方…

GPT 应该存在吗?

GPT是否应该存在呢?Scott Aaronson 认为在掌握更多信息之前,我们应该按兵不动。 作者 | Scott Aaronson 译者 | 弯月 出品 | CSDN(ID:CSDNnews) 我记得90年代,关于 AI 哲学的讨论无休无止,图…

从 Linux 安全看,eBPF 的出现是“天使”还是“恶魔”?

【CSDN 编者按】eBPF 目前已经成了安全研究人员和黑客手中强大的工具,亦正亦邪,取决于使用者的选择。 作者 | 许庆伟 责编 | 王子彧 出品 | OpenAnolis(龙蜥) 启示录 新约圣经启示录认为:恶魔其实本身是天使&#x…

182-问chatGPT想一点游戏职业

问了一下chatGPT帮我想出一些游戏职业 1.精灵剑士- 长着修长耳朵、娇小玲珑的精灵女孩,手持一把细长的剑,身穿华丽的绿色铠甲。 2.亡灵法师-看起来非常阴森恐怖的法师,蓝色的长袍下暗藏着黑色的甲胃,手中握着一根水晶魔杖. 3.火焰…

基于Spark的FPGrowth(关联规则算法)

转载请标明出处:小帆的帆的专栏 例子: 总共有10000个消费者购买了商品, 其中购买尿布的有1000人, 购买啤酒的有2000人, 购买面包的有500人, 同时购买尿布和啤酒的有800人, 同时购买尿布的…

Matlab隐藏彩蛋

Matlab中的彩蛋实现与Matlab的版本有着重要关系,像Android一样,不同的版本对应不同的彩蛋。这里以Matlab 2016A为例。 1.最著名的一个,命令行窗口输入“image”,就会出现一张倒置的小孩脸,不知情的使用者很可能会被吓…

“男医生,女护士?”消除偏见,Google有大招

编译整理 | 若奇 出品 | AI科技大本营 如何消除 AI 带来的性别偏见是个令人头疼的问题,那究竟有没有方法去解决? 12 月 6 日,Google 宣布他们迈出了减少 Google 翻译中性别偏见的第一步,并且还详细介绍了如何为 Google 翻译上的性…

71个外贸工具集合!2023年外贸业务员开发客户必备!

即时通讯工具 国际电话 叮咚:查找或添加成为叮咚好友,可以免费拨打电话,发送消息,语音对话。需要打开梯子网络下载,登陆的时候建议用Facebook账号登录。 链接: http://dingtone.me/and/fl/cn/a/?i Ringo&#xff1a…

ChatGPT工作提效之生成开发需求和报价单并转为Excel格式

ChatGPT工作提效之生成开发需求和报价单并转为Excel格式 一、提出需求如何撰写百度地图标注开发的需求文档 二、针对性地连续提问推荐下一下百度地图标注文档的详细需求列表如何撰写百度地图标注开发的技术规范如何确定百度地图标注开发后的部署计划... 三、生成报价单四、运营…

外贸报价后如何跟进客户?winseeing可快速报价展示样品

外贸公司的业务人员获取了高质量的询盘,若是不细心维护会有与大单和大客户失之交臂的可能。那外贸业务人员常容易犯的错误有哪些? 总结了以下几点: 1、仓促回复询盘:由于回复的太快,缺乏了对客户提出问题的分析过程&a…

PPT Cookbook by Eric

1. 快速生成背景和配色 1.1 ChatGPT 闪击PPT [blog] 1.2 ChatGPT MindShow [blog] 2. 图形和图像 2.1 绘制图形 水平倾斜图形(边框为平行四边形) 图形的效果是这样的: 就是这里最下方的图像,不过这里该怎么进行绘制呢&am…

快速生成ppt的新方法

1、对着chatgpt输入: 生成一份大纲,主题是:如何做好PPT插件程序编写。请用Markdown语言生成。 chatgpt反馈: 如何做好PPT插件程序编写 引言 PPT插件在现代演示文稿中扮演着非常重要的角色,能够帮助演讲者快速制作高…

放屁模拟器v1.0手机版

软件介绍: 对于喜欢恶搞网友来说,绝对是个好玩的软件。模仿真实放屁声音,多种声音可以选择! 软件版本:1.0 支持系统:安卓 软件大小:3.6MB 软件下载: https://lanzoui.com/ioQ5qisaz3e

2022全新恶搞放屁小程序源码

正文: 这小程序的是属于云开发的,暂时没有发现后端源码,安装方法跟其它小程序一样,直接用开发者工具编译上传审核就可以了,这源码还是比较好玩的。 下载方式: lanzou.com/icGNT03h4k4j

js实现Tom猫

效果 HTML&#xff1a; <img class"bg" src"./assets/img/Animations/eat/eat_00.jpg"><img class"drink" src"./assets/img/Buttons/drink/drink.png"><img class"eat" src"./assets/img/Buttons/eat/…