自动生成马斯克的推特几乎无破绽!MIT用GPT-2模型做了个名人发言模仿器

铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI

模仿各路名人的推特行文,现在可以分分钟做到。

MIT的研究科学家、深度学习课老师Lex Fridman做了一个新应用:

DeepTweets,能通过一个人以往的推特内容进行内容模仿,自动生成新的伪推特。

发布10小时,500多人在网友Lex Fridman的研究下点赞,网友@ArthDubey表示,从某种程度上来说,你搜索、查询和发推的时候很容易推断出你的倾向,基于大量数据形成了预测。

效果展示

来看看DeepTweets的假推特实际生成效果。

就拿常年活跃在推特的“网红”马斯克来举例,此前马斯克曾发过一条的关于多层隧道的推特:

640?wx_fmt=png

多层隧道的根本优势在于,你可以在任何方向上任意选择车道,就像折叠空间一样从城市的一部分连接到另一部分。

OK,现在该DeepTweets发挥了,它模仿歌星Justin Bieber的口吻,发了假回复推特:

640?wx_fmt=png

多层隧道的根本优势在于,你不必担心交通或者路面积水,多层隧道让我们很安全。

没错呀,无论是语言连贯度还是内容上的逻辑,这条假推特有点天衣无缝了。

再看一条,来自美国饶舌歌手Kanye West:

640?wx_fmt=png

多层隧道的优势在于,机器人不惧怕不可知的因素,伊隆加速啊。

可以,这一条连与楼主的互动都用上了。

继续往楼下看,美国女歌手Kate Perry也来凑热闹了:

640?wx_fmt=png

多层隧道的优势在于……一分钱一分货,宝宝你说呢?

DeepTweets可真是掌握了每个人的用词习惯啊……

这样的例子还有很多,比如让它以“生命的意义是”开头,模仿名人的推特:

640?wx_fmt=png

小哥Lex Fridman表示,目前已经训练了不少名人的推特回复模型,比如特朗普、奥巴马、马斯克(Lex Fridman经常与其互动),脱口秀主持人柯南·奥布莱恩,艾伦·德杰尼勒斯等,这些模型将会陆续发布。

GPT-2又立功

作者小哥表示,DeepTweets是在已经开源的语言模型GPT-2上训练的。GPT-2在语言建模任务中,简直是逆天般的存在。

640?wx_fmt=png

作为一个没有经过任何领域数据专门训练的模型,它的表现比那些专为特定领域打造的模型还要好,横扫各大语言建模任务。

640?wx_fmt=png

 GPT-2在不同语言建模任务上的测试结果(从左到右:数据集名称、指标类型、GPT-2测试结果、此前最好结果、人类水平)

简单来说,GPT-2就是基于Transformer架构的大规模模型。

GPT-2是GPT算法“进化版”,比GPT参数扩大10倍,达到了15亿个,数据量扩大10倍,使用了包含800万个网页的数据集,共有40GB。

这个庞大的算法使用语言建模作为训练信号,以无监督的方式在大型数据集上训练一个Transformer,然后在更小的监督数据集上微调这个模型,以帮助它解决特定任务。

640?wx_fmt=png

上图左部分,是研究中使用的Transformer架构以及训练目标。右边部分,是针对特定任务进行微调。将所有结构化输入转换为token序列,由预训练模型处理,然后经过线性+softmax层处理。

就GPT-2而言,它的训练目标很简单:根据所有给定文本中前面的单词,预测下一个单词。

一开始,OpenAI只放出了117M的小型预训练模型,被网友调侃为“ClosedAI”。OpenAI表示,不是不开源,而是时候未到。

上个月,OpenAI宣布将其345M的预训练模型开源,外加其Transformer的1.5B参数。

传送门

最后,附上GPT-2相关学习资料。

GitHub代码地址:
https://github.com/openai/gpt-2

GPT-2数据集地址:
https://github.com/openai/gpt-2-output-dataset

OpenAI介绍主页:
https://openai.com/blog/better-language-models/#update

Lex Fridman的GPT-2讲解视频(需要科学前往):
https://youtu.be/O5xeyoRL95U

作者系网易新闻·网易号“各有态度”签约作者

AI社群 | 与优秀的人交流

640?wx_fmt=jpeg

小程序 | 全类别AI学习教程

640?wx_fmt=jpeg 640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 ! 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35297.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么别人家的ChatGPT比我家的更聪明?

文章目录 引子使用技巧技巧1:使用分隔符技巧2:结构化输出技巧3:整理操作步骤技巧4:做示范技巧5:给定具体的步骤技巧6:生成摘要技巧7:情感分析 好问题的三要素总结 引子 你有没有发现&#xff0…

【突破想象】AI绘画能否超越艺术家的创造力?

突破人类想象!AI绘画能否超越艺术家的创造力? 冲击还是机遇?AI绘画能否超越艺术家? 近年来,AI绘画工具迅速崛起,悄然挑战着艺术家的地位。以惊人的技术发展速度,AI绘画在艺术领域迅速引起轰动。…

我用ChatGPT 七分钟生成一个Spring Boot项目,一点代码都没写

我的《用ChatGPT生成一个SpringBoot应用》保姆级教程上线了。教程的核心是:思路和ChatGPT提示语,已经更新到我的知识星球专栏,目前已经累计实战项目60,目标500 看看ChatGPT生成的项目,Maven结构完整,可正常…

chatgpt赋能python:Python社群——你的Python学习和进阶的首选

Python社群——你的Python学习和进阶的首选 Python社群是一个不断发展壮大的社区,提供了一个互相交流和分享任何关于Python的话题的平台。在Python社群里,你可以遇到志同道合的朋友,学习最新的技术和方法,提出疑问和建议&#xf…

essential-copying and pasting from Stack Overflow原文和翻译

Introduction Inspired by this cover. The book is written in a deadpan manner. 根据封面的启发,这本书是在面无表情的方式下编写 cutting corners to meet arbitrary management deadlines. 投机取巧 来满足任意管理期限 Code Licensing Issues[编码许可问题] B…

初创软件除了做开源,难道就别无选择了吗?

别无选择 酒香不怕巷子深,就请问酒香怕不怕无人岛?初创软件需要打开市场,除了产品自身,市场可能更为重要。 知名度或称为流量,流量在信息时代对于初创软件的重要性,不排第一至少也能排第二。 再好的东西…

使用python爬取携程网旅游信息(包含景点、酒店、美食)

其中本次爬虫的主要思想是:首先是找到携程网url的编写规律,然后根据规律使用beautifulsoup4对所需的html语言中的信息提取,最后就是封装处理。爬取的信息只是用来本次毕设的研究非商业用途。对于毕设的相关总结在:旅游推荐系统毕业…

基于PHP的旅游资讯管理系统

有需要请私信或看评论链接哦 可远程调试 基于PHP的旅游资讯管理系统 一 介绍 此旅游资讯系统基于原生PHP开发,数据库mysql,前端bootstrap,前后端分离。系统角色分为用户和管理员,用户可注册登录,预订旅行行程&#x…

旅游网站、旅游系统

旅游网站 摘要:在社会快速发展的影响下,旅游网站继续发展,大大增加了旅游的数量、多样性、质量等等的要求,使旅游网站的管理和运营比过去十年更加简单化。依照这一现实为基础,设计一个快捷而又方便的网上旅游网站是一项…

麒麟水乡,IU酒店进驻云南旅游咽喉之地曲靖

曲靖位于云南省东北部,是云南连接内地的重要陆路通道,素有“滇黔锁钥”、“入滇门户”、“云南咽喉”之称,是仅次于昆明的云南第二大城市。曾入选“中国十佳宜居城市”榜单10次的城市,拥有3000多年的文明史,早在三国魏…

Python抓取全国旅游景点以及小吃数据,想做旅游攻略?Python助你事半功倍。

前言 疫情自从来了之后已经很久没有出去旅游过了,蹭着这段疫情好转,那肯定是要出去走一走的,这一篇其实是全国旅游中的一站,因为每个城市能玩的地方太多了,一篇文章下来肯定是写不了的,所以今天就抓取一下—…

对去哪儿旅行(功略库)的数据分析

选题背景 去哪儿旅行网站上有丰富的图片,旅行数据以及评论数据,用这些大量的数据来学习数据采集及可视化分析是一个不错的选择 网页分析 可以获取的数据 通过翻阅这些攻略我们可以观察到网站上展示了以下共有的数据:文章标题,…

基于Python的云南旅游景点分析

作为一名云南人,作为一名数据分析人员,我将在本次用Python来给大家介绍云南的相关景点! 欢迎大家来云南旅游哦!资料含各地景点的数据,希望大家学习之后进行相关的练习,学有所成! 所需的资料我…

Android程序员面试5分钟自我介绍法

有简历,为何还要自我介绍? 要回答这个问题,首先搞清楚为什么面试官要请你做自我介绍?面试官通过自我介绍想考察被面试者什么?只有了解面试官的目的,被面试者才能做好自我介绍。 面试官通过被面试者自我介绍…

刷完这份2023年Android中高级最全面试真题答案解析,拿到offer几率提升50%

前言 今年以来,经济回暖,但行业岗位缺口紧缩的趋势恢复还需一段时间。尤其对于Android开发而言,想要跳槽到一个高薪岗位更是难上加难。 因此,想要杀出重围,必然要有万全的准备。除了一份美观的简历,刷一刷…

靠这份35w字Java面试题,终于收到字节Java开发岗满意Offer了!

靠这份35w字Java面试题,终于收到字节Java开发岗满意Offer了! 前天面Java PDD一面挂 美团一面挂 寄 美团全程Java八股文 字节40分钟八股文10分钟算法题,算法题是个普通的middle,没啥问题。 但是,八股跨度大且精细,寄。…

7个实用的Python自动化代码

关于Python有一句名言:不要重复造轮子 但是问题有三个: 1、你不知道已经有哪些轮子已经造好了,哪个适合你用。有名有姓的的著名轮子就400多个,更别说没名没姓自己在制造中的轮子 2、确实没重复造轮子,但是在重复制造…

创建用户账户

这一节内容我们来一起学习Linux中有关于用户身份及文件权限的内容。在windows中,我们可以通过图形化界面去创建及管理用户,但在Linux系统中,我们习惯用命令的方式去创建以及管理用户。 以上两图是windows系统中,如何创建用户以及管…

跨境电商卖家应该知道的3个社交媒体营销策略

关键词:跨境电商卖家、社交媒体营销 社交媒体是获取、吸引和留住客户的强大营销渠道。普通人拥有超过八个社交媒体帐户,使用每个平台参与社区,发现新产品并与朋友和家人保持联系。 社交媒体最强大的方面是,您的目标受众只需点击几…

人工智能时代,职场中的你是否真不可替代?用Python玩转ChatGPT

最近一段时间,ChatGPT在网络上很火。小伙伴们在感叹这款神奇的聊天机器人强大功能的同时。不知不觉会发现,我们已经被莫名其妙地带入到一个人工智能时代。 不管你愿不愿意承认,实事就是如此。相信很多小伙伴都很想体验一把这个智能应用&#…