ChatGPT和DALLE-2级联后,输出效果震撼了…

b7655ae69d1a5542cc0bca9b0b449aaf.jpeg

源|机器之心 

文|张倩、袁铭怿

生成式 AI 正在变革内容的生产方式。

在过去的一周,相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限,其中一种测试方式就是让它写故事。

与之前的一些 AI 相比,ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升,对于人物名字、人物关系和处境的理解也很合理,只不过写出的故事会缺乏一些细节和亮点。

986fec2232edd0d84acacd5e1bd7485d.png

Meta FAIR 研究院研究员/高级经理田渊栋用ChatGPT 续写了自己的小说《破晓之钟》[1]。但如果你对故事的要求没那么高,ChatGPT 是完全够用的,比如写个儿童故事。

来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试,而且他不仅用 ChatGPT 写了儿童故事,还让之前火了大半年的 DALLE-2 将其画了出来。也就是说,他相当于用两个 AI 做出了一本绘本。

2fc08463317199f034cb8143029caad2.png

故事的梗概是这样的:

从前,在一个遥远的地方,有一位名叫罗比的机器人,他生活的世界里到处都是机器。与其他机器人不同的是,罗比不想每天都听从命令,执行任务。

1c54c4abd499ae24a91beaaf4c5ef1a0.jpeg

罗比梦想成为人类。他渴望去感受照耀在脸上的阳光,渴望去呼吸新鲜的空气,渴望去体验一切人类所做的美好的事。但最重要的是,罗比希望能够做出自己的选择,过上属于自己的生活。

8357992f2325da2c1e78645d1eb5de2f.jpeg

一天,罗比决定碰碰运气,去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来,开启了他的人类世界之旅。

8e469ec917d17417f2c7c6a06a6a5d79.jpeg

罗比走了很久很久,一路上也遇到了很多挑战。他需要穿越广阔的沙漠,翻越险峻的高山,并勇敢地面对湍急的河流。但他从未放弃,下定决心,一定要抵达目的地。

dac1a86ce4cf73cc3d2d7f533e9d51d4.jpeg

最后,恍如隔世一般,罗比来到了人类世界,周围的景象和声音令他惊叹不已,他不敢相信,自己终于成功了。

c7e119159dc5a91c037ccfea8a50e1b9.jpeg

但就在他开始探索新环境时,一群人类发现了它,并且开始追赶它。他们害怕罗比,他们不知道罗比只是一个想和他们交朋友的机器人。

bce9e6d340285a23799e02efd492123f.jpeg

罗比拼尽全力地跑着,在街道上躲来躲去。他不想伤害任何人,他只想一个人待着。但那群人类毫不留情,并未停下追赶的脚步。

8e4bd18ce2bb1031d32eab3b2f138883.jpeg

就在罗比以为人类要抓住自己的时候,他偶遇了一位善良的老人。这位老人很同情它,听了罗比的故事后,明白了他为什么来到人类世界。

17d59e38337a778323f1f9d96980dab2.jpeg

老人帮助罗比躲避追赶他的人类,并教会罗比如何做人。罗比学会了如何说话,如何笑,以及如何享受生活中的点点滴滴。

28535baedbe42ddfb9e710babb3381fd.jpeg

日子一天天过去,罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友,终于能够过上向往已久的生活。

654e1ab151def7dbcb2530df190e24d0.jpeg

罗比一开始可能只是个机器人,但最终,他证明了只要相信自己,不放弃梦想,任何人都可以成为人类。

8ee5df5f031ca0fac477d61c6d517b1a.jpeg

故事到这里就结束了,读下来是不是感觉还不错?ChatGPT 甚至会在故事结尾升华主旨,非常符合人类的写作习惯。

当然,为了生成这个「绘本」,Eric Zelikman 也克服了一些困难,比如 ChatGPT 有时生成的 prompt 太长了,他需要缩减一下才能喂给 DALL-2,因为后者对输入长度是有限制的,这也在一定程度上增加了故事风格、人物一致性的难度。

为了让 DALL-2 的生成效果更佳,Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述,然后反复要求它重复第一个 / 下一个插图描述。之后,再让它提供一个简短(<70 token)但精确的图像描述,就像向不了解故事上下文的人解释该图像一样。

df2186c35230b2f15fda1cd7dedb915d.png

Eric Zelikman 感觉,这是一次非常有趣的体验,因为人们可以借此构建一个互动工具,激发孩子们对写作和艺术的兴趣。

4d526bdc7a471f8e4c686e48abe5abe5.png

对于 Eric Zelikman 遇到的问题,有人建议他用 Midjourney(一款 AI 绘画工具)再试一遍,因为后者可以接受非常长的 prompt。

1ef5353f8edf39cf8e4937638053585e.png

还有人表示,自己其实也和 Eric Zelikman 做了类似的事情,让 ChatGPT 生成一个童话故事,然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸,主旨是帮孩子培养自信心。

d5b945c92e9b3ae87510e64ee6e580a3.png

这些强大的 AI 工具如今正走向融合,我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图,明天,说不定连出版也搞定了呢?

88822d5e0e2b34290b61152eb6aa3361.png

b2a4d81b8e90710be6fabcd188c000ee.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

2350210e61ccad23d83a1a2c597200a0.png

[1]https://twitter.com/ericzelikman/status/1600948156656537600_/2787584375

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7865.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 的能力上限将被突破

最近,一篇名为《Scaling Transformr to 1M tokens and beyond with RMT》的论文在 AI 界引起了广泛热议。 该论文提出一种名为 RMT 的新技术,如果能够成功应用,那将把 Transformer 的 Token 上限扩展至 100 万,甚至更多。 GitHub…

ChatGPT 的 10 种集成模式:从开源 AI 体验平台 ClickPrompt 中受到的启发

和国内外的很多公司一样,在 Open AI 公司开放了 ChatGPT API 接口之后,我们也在探索如何去结合到业务中。而在探索的过程中,我们发现了一个问题,大部分的业务人员并不了解 AI 的能力,所以我们开源构建了 ClickPrompt&a…

聊天新纪元:通过和ChatGPT聊天就能开发自己的Chrome插件

文章目录 1. 前言1.1 ChatGPT是什么1.2 ChatGPT能干什么1.3 我要让ChatGPT干什么 2. 环境准备3. 交互过程3.1 发送需求3.2 询问执行3.3 继续提问3.4 加载代码3.5 执行插件3.6 执行插件 4. 生成的代码4.1 manifest.json4.2 popup.css4.3 popup.js4.4 popup.html 5. 总结 1. 前言…

学术科研专用ChatGPT来了!

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达 【导读】最近,一位开发者在GitHub上开源的「科研工作专用ChatGPT」项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。 自从ChatGPT发布之…

今天,小呆呆第一次尝新ChatGPT,并小火了一把

前言 你盼世界,我盼望你无bug。Hello 大家好!我是霖呆呆。 当我们遇到技术难题或生活困惑时,往往会寻求专业人士的帮助或者在网络上搜索相关问题。但你是否曾想过,如果有一种AI程序能够帮你解决问题,理解人类语言的含义…

ChatGPT真的有那么牛吗?

ChatGPT真的有那么牛吗?ChatGPT真的有那么牛吗? 作为一款大型语言模型,ChatGPT确实具有很高的自然语言处理和生成能力,可以生成流畅、准确和有逻辑性的语言,而且能够理解和回答广泛的问题。 它是目前最先进和最强大的…

大型语言模型用例和应用 Large Language Models Use Cases and Applications

目录 Large Language Models Use Cases and Applications大型语言模型用例和应用 What are large language models and how do they work什么是大型语言模型及其工作原理 Large language model examples 大型语言模型示例 Large language model use cases 大型语言模型用例…

WIKIBON:大模型炒作中,有哪些云与AI的新趋势?

进入2023年以来,以ChatGPT为代表的大模型喧嚣引发了AI的新一轮炒作热潮,堪比当年的加密货币。不同的是,以微软、NVIDIA、AWS、Google等为代表的云与芯片大厂纷纷实质性入局大模型,为大模型AI注入持续的生命力。因此ChatGPT可类比于…

chatGPT爆火让我们反思——人工智能是新的加密货币吗?

核冬天技术末日到来了,只有人工智能幸免于难。峰值 AI 指标无处不在。它能保持加密失去的信念吗? 作者:John Luttig 翻译: Chainwise 核冬天技术末日到来了:软件、SPAC、金融科技和加密货币都进入了深度冻结状态。AI 可能是唯一穿…

这AI二维码也太酷炫了!谷歌生成式AI学习路径;媒体的AI炒作套路报告;使用GPT-4自动化制作短视频 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 新鲜出炉!2023人工智能10大分类排行榜 这是根据2023年6月德本咨询、eNet研究院和互联网周刊联调的人工智能排行榜&#xf…

从“XML一统天下”聊聊我所经历的技术炒作

【编者按】身处技术圈我们,时常会听到“XX 已死,XXX 将一统天下”的论调,本文作者分享了自己入行以来,所经历的各种技术炒作。 原始链接:https://www.bitecode.dev/p/hype-cycles 未经允许,禁止转载&#x…

对话DataFocus创始人:大模型会颠覆ToB行业吗?

​编者按:年初ChatGPT引爆了AIGC,GPT几乎成了软件从业者最高频的话题了。如今时过半载,子弹仍然在飞舞,显然这波浪潮还远远没有到平息的时候。这是一次内部分享,我们有幸和DataFocus创始人JET畅聊了大模型的天南海北&a…

人工智能革命|是疯狂炒作还是大势所趋?

近期关于人工智能的话题与炒作激增。如果你看看过去五年“AI”一词的搜索量,就会发现它一直停滞,直到2022年11月30日,OpenAI 凭借 ChatGPT 引发了人工智能革命。 Google 趋势 — 过去 5 年“AI”搜索量 短短六个月内,究竟发生了…

被“错用”的开源软件许可!

大多数人习惯于忽视软件许可,就像在安装新程序或注册服务时一样。但在 AI 领域工作时,考虑这些因素很重要,因为我们使用的所有工具的默认设置都是开源的,而且通常我们会协作工作,在别人的劳动成果之上构建自己的产品&a…

ChatGPT 成功背后的技术原因及其对生命科学领域的启发

文章目录 一、前言二、主要内容三、总结 一、前言 2023 年 2 月 19 日看见一篇关于 ChatGPT 成功背后的技术原因及其对生命科学领域的启发的思考的优质文章,分享于此。 原文链接:DrugFlow | ChatGPT 成功背后的技术原因及其对生命科学领域的启发 作者…

当 ChatGPT 热度不再,下一个 AI 寒冬会来到吗?

ChatGPT 的出现,显然掀起了 AI 发展的新一轮热潮,但人们是否设想过:未来狂欢散场,是否意味着下一个 AI 寒冬即将到来? 原文链接:https://www.erichgrunewald.com/posts/the-prospect-of-an-ai-winter/ 未经…

商汤给元宇宙理了理“三观”

杨净 发自 凹非寺量子位 | 公众号 QbitAI 元宇宙,正在野蛮生长,比以往任何时候更甚。 一面是持续看好的市场表现。据麦肯锡数据显示,今年上半年有超过1200亿美元投向元宇宙,已是去年570亿美元投资额的两倍多。 而DIffusion、ChatG…

全栈深度学习工程师之路(一)为什么要学深度学习及全栈

文章目录 前言为什么要学深度学习以及为什么要了解深度学习的全栈知识 人工智能的发展过程学术界和工业界的区别学术界工业界 专栏的范围 前言 为什么要学深度学习以及为什么要了解深度学习的全栈知识 机器学习是一门人工智能的分支,它研究如何让计算机从数据中学习…

罗永浩进场之后,苹果入局之前:XR又寒冬了吗?

科技圈的悲欢并不相通。 ChatGPT狂飙之际,XR领域正在迎来至暗时刻。 岁末年初,就在罗永浩重返高科技创业,计划进军XR(扩展现实)类领域的时间段前后,接连出现了押注元宇宙的Meta裁员,Meta旗下VR工作室Ready …

chatgpt赋能python:基于PythonSOM的数据挖掘技术

基于Python SOM的数据挖掘技术 在数据挖掘领域中,SOM(Self-Organizing Map,自组织映射)作为一种非监督学习算法,被广泛应用于数据聚类、分类、可视化等方面。本文将介绍基于Python SOM的数据挖掘技术及其在SEO上的应用…