ChatGPT讲故事,DALLE-2负责画出来,两AI合作出绘本

本文来源 机器之心  授权 编辑:张倩、袁铭怿

生成式 AI 正在变革内容的生产方式。

在过去的一周,相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限,其中一种测试方式就是让它写故事。

与之前的一些 AI 相比,ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升,对于人物名字、人物关系和处境的理解也很合理,只不过写出的故事会缺乏一些细节和亮点。

b63753c30672172f66ebd6eb4dfdbb56.pngMeta FAIR 研究院研究员 / 高级经理田渊栋用 ChatGPT 续写了自己的小说《破晓之钟》。图源:知乎 https://www.zhihu.com/question/570189639/answer/2787584375

但如果你对故事的要求没那么高,ChatGPT 是完全够用的,比如写个儿童故事。

来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试,而且他不仅用 ChatGPT 写了儿童故事,还让之前火了大半年的 DALLE-2 将其画了出来。也就是说,他相当于用两个 AI 做出了一本绘本。

9be2f0b0915d19abdadaf50dc529bf68.png

故事的梗概是这样的:

从前,在一个遥远的地方,有一位名叫罗比的机器人,他生活的世界里到处都是机器。与其他机器人不同的是,罗比不想每天都听从命令,执行任务。

dbacbf259f11bd0d11555d57de49d6fe.jpeg

罗比梦想成为人类。他渴望去感受照耀在脸上的阳光,渴望去呼吸新鲜的空气,渴望去体验一切人类所做的美好的事。但最重要的是,罗比希望能够做出自己的选择,过上属于自己的生活。

7c352ed0d530cf49ea1a7b37452b50e9.jpeg

一天,罗比决定碰碰运气,去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来,开启了他的人类世界之旅。

92d0405e834ba03e927037e277bbc27c.jpeg

罗比走了很久很久,一路上也遇到了很多挑战。他需要穿越广阔的沙漠,翻越险峻的高山,并勇敢地面对湍急的河流。但他从未放弃,下定决心,一定要抵达目的地。

e02a28444b22bf5028235da58e98adc8.jpeg

最后,恍如隔世一般,罗比来到了人类世界,周围的景象和声音令他惊叹不已,他不敢相信,自己终于成功了。

fc4911386ebb2b0b9786e4f031760323.jpeg

但就在他开始探索新环境时,一群人类发现了它,并且开始追赶它。他们害怕罗比,他们不知道罗比只是一个想和他们交朋友的机器人。

1dedba1121150f0c921a04411172c463.jpeg

罗比拼尽全力地跑着,在街道上躲来躲去。他不想伤害任何人,他只想一个人待着。但那群人类毫不留情,并未停下追赶的脚步。

055722959d2d33e236d2870277698c1f.jpeg

就在罗比以为人类要抓住自己的时候,他偶遇了一位善良的老人。这位老人很同情它,听了罗比的故事后,明白了他为什么来到人类世界。

af15c1def46cea9b00d8fd6dad85e071.jpeg

老人帮助罗比躲避追赶他的人类,并教会罗比如何做人。罗比学会了如何说话,如何笑,以及如何享受生活中的点点滴滴。

2d0968b7ff7f3e8e08cc8b445b1f9b6a.jpeg

日子一天天过去,罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友,终于能够过上向往已久的生活。

0763d2034adc8cdfadd512be59778cb3.jpeg

罗比一开始可能只是个机器人,但最终,他证明了只要相信自己,不放弃梦想,任何人都可以成为人类。

6ac0d1f6f3a26c7eddafc02ef5dd1909.jpeg

故事到这里就结束了,读下来是不是感觉还不错?ChatGPT 甚至会在故事结尾升华主旨,非常符合人类的写作习惯。

当然,为了生成这个「绘本」,Eric Zelikman 也克服了一些困难,比如 ChatGPT 有时生成的 prompt 太长了,他需要缩减一下才能喂给 DALL-2,因为后者对输入长度是有限制的,这也在一定程度上增加了故事风格、人物一致性的难度。

为了让 DALL-2 的生成效果更佳,Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述,然后反复要求它重复第一个 / 下一个插图描述。之后,再让它提供一个简短(<70 token)但精确的图像描述,就像向不了解故事上下文的人解释该图像一样。

67674e48bdc7b0570716c32dd594cd1b.png

Eric Zelikman 感觉,这是一次非常有趣的体验,因为人们可以借此构建一个互动工具,激发孩子们对写作和艺术的兴趣。

9ea6057a14ae7df4d4e35c9b2d280814.png

对于 Eric Zelikman 遇到的问题,有人建议他用 Midjourney(一款 AI 绘画工具)再试一遍,因为后者可以接受非常长的 prompt。

69b016adf083a1c1ac0ba4ef8b92817f.png

还有人表示,自己其实也和 Eric Zelikman 做了类似的事情,让 ChatGPT 生成一个童话故事,然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸,主旨是帮孩子培养自信心。

e064ba162e84816deef2a7ccd752bbf5.png

这些强大的 AI 工具如今正走向融合,我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图,明天,说不定连出版也搞定了呢?

d8cd83d6d8a0f0aea8e787fcee85253c.png

参考链接:https://twitter.com/ericzelikman/status/1600948156656537600

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

dfeb04e48d8767ba0e0fc06a32c3d459.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

d4713fa8ad5905be1f370b8c3836cf52.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

7109428a20d2f6bd2b8a30d11d7d2046.jpeg

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6434.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

Pine 萧箫 发自 凹非寺量子位 | 公众号 QbitAI 没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了! 砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V&am…

一周AIGC丨大模型融资火热,天才、名校、大厂争相下场

2023年进入下半年,明显感受到大模型赛道的融资消息变多了。相比以往出现的移动互联网、区块链、元宇宙等热门赛道,大模型的创业者“科技含量”更高了,创始人要么是研究AI的天才,要么是曾在大公司里负责AI业务的高管。大模型&#…

王飞跃|关于 AI for Science问答

作者|王飞跃,缪青海,张军平,郑文博,丁文文 为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动“人工智能驱动的科学研究”(AI for Science)专项部署工作。…

完犊子!要被封了,坚持还是放弃?看你们的了

「 静静地做自己,让世界发现你 」 ▼ 科技毒瘤君将不定时分享优质工具,大家可以把科技毒瘤君公众号设为★星标,第一时间获取最新推送,以防错过优质内容。 题外话 真正可怕之处 昨天晚上,熬夜给大家分享了一波优质网站&…

Mathemetica 35周年!从天才物理学家到“自大狂”,创始人Wolfram的传奇经历

尚恩 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 头发和显示器都更薄了,但35年前的代码还能运行! 著名科学计算软件Mathematica 35周年之际,创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片,并称: 35年前领先于…

从天才物理学家到“自大狂”,创始人Wolfram的传奇经历

尚恩 梦晨 发自 凹非寺转发自量子位 | 公众号 QbitAI 头发和显示器都更薄了,但35年前的代码还能运行! 著名科学计算软件Mathematica 35周年之际,创始人Stephen Wolfram发布这样一组构图一毛一样的对比照片,并称: 35年前…

科学观察 | 人工智能驱动的科学研究新范式: 从 AI4S 到智能科学

本文刊载于《中国科学院院刊》2023年第4期 “科学观察” 王飞跃1 缪青海2 1 中国科学院自动化研究所 复杂系统管理与控制国家重点实验室 2 中国科学院大学 人工智能学院 近期,以 ChatGPT 为代表的大模型技术正开启人类社会智能化的新纪元。研究人工智能成功…

AI壁纸号一周增加上千粉丝,轻松变现的成功案例分享

前言 随着AI绘画技术的发展,传统的互联网副业壁纸号在新的技术加持下迎来了第二春。本文将分享一位壁纸号创作者的成功案例,并为大家提供创作门槛和硬件要求等相关信息。 该项目的创作门槛极低,基本上可以由AI完成内容创作。不过&#xff0…

win10系统切换到macOS,开发环境与软件资源,目录清单

文章目录 1、生活2、文书3、开发4、算法5、美术6、科研 1、因为考研自习室或学校图书馆,随身携带游戏本(全能本)受限于不插电源就不续航和掉性能,以及风扇噪音非常大,以及发热很烫等问题。 2、所以想考虑给主力机换个…

DNSPod十问徐羽:ChatGPT是国产浏览器的背水一战?

本期嘉宾 徐羽 腾讯信息平台与服务线CTO 徐羽,腾讯信息平台与服务线CTO兼总经理、PCG事业群推荐与AI中台负责人。从2009年开始负责手机QQ浏览器从0起步到现在亿级DAU规模的研发工作,在2018年建立和负责PCG的推荐AI中台,在机器学习平台、NLP…

[ChatGPT4编程笔记]php连接数据库增加数据,修改数据,查询数据,删除数据的demo,有html交互页面

以下是一个示例&#xff0c;演示如何使用 PHP 连接 MySQL 数据库&#xff0c;并实现增加数据、修改数据、查询数据和删除数据的功能。该示例结合了 HTML 和 PHP&#xff0c;并提供了交互页面。index.html&#xff08;交互页面&#xff09;&#xff1a;html Copy code <!DOCT…

“谷歌杀手”发明者,科学天才 Wolfram

有一位少年天才&#xff0c;15岁发表首篇粒子物理方面的学术论文。19岁到加州理工学院研究基本粒子物理学&#xff0c;一年内获得理论物理学博士学位。随后他和费曼一起研究起元胞自动机。 他在成为伊利诺斯大学的物理学、数学和计算机科学教授后&#xff0c;不安于在研究所做研…

2023版本ChatGPT是这样评价电影版《灌篮高手》

尽管大多数人觉得《灌篮高手》电影版非常精彩&#xff0c;但是就我而言&#xff0c;我却有些失望。提前五六天我就买好了电影票&#xff0c;期待能用这部电影重燃曾经的激情&#xff0c;怀念我的青春岁月。然而&#xff0c;在观影两个小时之后&#xff0c;我意识到对这部电影抱…

圆石重磅 | ChatGPT并非真正的人工智能?AI拐点是出现新体系 | 武卿对话刘伟

Datawhale干货 分享人&#xff1a;武卿、刘伟博士 “人工智能的飞速发展&#xff0c;为未来增加了诸多不确定性&#xff0c;未来的世界更加不可预测。 ChatGPT问世以来&#xff0c;在全球范围内掀起了一场科技革命&#xff0c;人工智能的飞速发展&#xff0c;为未来增加了诸多…

“递归三要素”寻踪(浅析递归“经典”框架,领略递归优雅秀气;看到有“递归算法优化”的操作,余试剖之)

浅析递归“经典”框架&#xff0c;领略递归优雅秀气。看到有“递归算法优化”的操作&#xff0c;余试剖之。 【学习的细节是欢悦的历程】 Python 官网&#xff1a;https://www.python.org/ Free&#xff1a;大咖免费“圣经”教程《 python 完全自学教程》&#xff0c;不仅仅是…

自带超多工具,好用又免费,这3款手机浏览器你用过了吗

手机浏览器是我们手机中必备的一款软件APP&#xff0c;一款好用的浏览器&#xff0c;可以帮助我们提高工作效率&#xff0c;节省时间。对于懒癌患者来说&#xff0c;手机上安装各种各种的app很麻烦&#xff0c;下面给大家介绍自带超多的工具&#xff0c;好用且免费的浏览器&…

【C】2、C语言介绍

一、C语言 C语言是一种面向过程的计算机程序设计语言&#xff0c;于1972年由美国贝尔实验室的Dennis Ritchie所开发。C语言广泛应用于操作系统、编译器、网络通信等方面&#xff0c;也是很多高级语言的底层实现基础。 C语言具有简洁、高效、可移植性好等特点&#xff0c;以及…

New bing、ChatGPT、SQL Studio是如何优化SQL查询的?

首先&#xff0c;让我们看一下New Bing。 New Bing是一种搜索引擎&#xff0c;可以帮助我们查找与我们正在寻找的主题相关的信息。我们可以使用New Bing来解释SQL语句&#xff0c;也能帮助我们分析SQL语句的执行效率&#xff0c;此外呢&#xff0c;也能帮助我们检查一下语法与逻…

如何使用 ChatGPT 编写 SQL JOIN 查询

通过清晰的示例和解释&#xff0c;本文展示了 ChatGPT 如何简化和简化创建复杂 MySQL 查询的过程&#xff0c;使用户更容易与数据库交互并检索他们需要的数据。无论您是初学者还是经验丰富的开发人员&#xff0c;本文都提供了有关如何利用 ChatGPT 来增强您的 MySQL 查询编写技…

数据库+chatGPT3.5 优化、索引、注释、写SQL就是一句话的事了

引言 3月份chatGPT是不安分的、微软是不安分的、那么勇哥就应该安分&#xff1f;不可能&#xff0c;绝对不可能。简单来说&#xff0c;勇哥3月份成功的把chatGPT3.5集成到bg-tinkle软件中发布了v1.0.5版本。集成后的bg-tinkle对于数据库的修改、统计、删除等操作就都是一句话的…