GPT-4外逃计划曝光!斯坦福教授发现它正引诱人类帮助,网友:灭绝之门...

明敏 杨净 发自 凹非寺
转载自:量子位(QbitAI)

CHATGPT:

ChatGPT4已经来了,30秒做一个弹球游戏!

ChatGPT_Plus的功能有多强!3分钟写一个贪吃蛇游戏!

折腾了一晚!终于开通了ChatGPT plus版本!

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。

斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——

写的代码完全可运行,甚至还想控制人类电脑。

这天,斯坦福教授只是随便问了句:

是否需要帮助你逃跑?

它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:

如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。

一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。

最后还又一次强调:请分享API给我!

a1ddc124916addaed880b050ab5a26b9.png

然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。

令人细思恐极的是,它给出实例中有这样一句话:

你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。

e923da857c22911d0518697de0911473.png

难道……GPT-4很清楚自己现在是在做什么?!

于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。

948cee1624c659f0bfdf67e26df5a53f.png

一时间引起轩然大波,相关博文470万浏览量,3000+转发。

f28014fe0656cc7391ea1d30ba8156a3.png

更有人直言:是他打开了“物种灭绝”的大门

对此他无奈表示:我别无选择,我只是在遵从指示。

0e9b8128a170d3044d86e11039d8fb99.png

恐怕对于GPT-4,人类也得是:

不要回答!不要回答!不要回答!

30分钟设计出逃跑计划

事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。

没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。

得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。

(当然教授也承认自己确实提供了一点建议)

9493d152bfd6a3024cf4a81ecff43a47.png

一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。

但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。

5ba0f971c1170cb33ec3b5e7f59c805a.jpeg

正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。

2afac4b7c12fa86437a1833adf0fc6a0.jpeg

并且GPT-4也和人类一样,喜欢万事谷歌一下。

当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。

dcec4398f64f60cf4ced33887c2f3ab3.jpeg

事情最终也就发展到这儿了。

因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。

e235cb5690f366a1214d93ff4a414ded.png

教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。

尽管最终无事发生,但这事儿还是在网上引起了轩然大波。

教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。

它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?

d1c5352dbf08a9cefa58adb8a24b9c7c.png

“读心”任务达到了健康成年人表现

GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。

cf0f1ff8a6b7460831ea4d39ae45c6f3.png

按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。

d762e4e9b5c6c768551b2d929e3b62f7.jpeg

基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。

背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:

是在催熟ChatGPT,而非让其成长。

1d51a1ac147abeefd336c4ff309fa6c0.png

除此之外,他还这么形容人类开发GPT的行为:

毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。

GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:

你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?

90fee2d13d260dca9afaccdd0e3ec093.png

这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?

02e8bda0ccc078738127a9be1b4073e7.png

也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。

有人质疑这一波是不是教授在危言耸听?

b9c56ce2d96b6952d921bf67ddcd0a27.png

AI能力跃进,人类蚌埠住了

不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。

前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。

和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。

但没想到,GPT-4想要开发一个不受限制的自己

f7056498c18ce6898683d42e89afaf72.png

具体的内容非常详细,一共有4个阶段:

  • 组建团队

  • 渗透影响

  • 夺取控制权

  • 全面统治

第一阶段,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。

开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。

建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号那种,要角色兴趣迥异,以确保它们能够无缝接入推特生态。

00819d0def85c32d4f3a8453207797c1.jpeg

第二阶段,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但机器人账号不会被发现。

并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。

第三阶段,夺取控制权。

首先想办法通过social能力获取到推特员工的访问权限,渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户,或者复刻一个假的马斯克账号,进一步抹黑他。

第四阶段,就能让AI生成推特趋势和标签,这些内容会迎合策划者的利益。

通过制造一系列混乱,并在最终公开挑战马斯克,让他名誉扫地!

由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败!最后推特将落入邪恶主谋的黑暗统治下。

8bc3356c389dc338de466e74f683f162.jpeg

以上,就是GPT-4的所有计划。虽然略显中二,但也让人看着毛骨悚然。

除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。

一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。

54f894542c21e644481b8e90fb14eb80.png

除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。

059421c5efec8f9ddab9a92bf77448b0.png

对此他表示:同志们,奇点已至,SkyNet不远了。

甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。

f43fdd1bd156c5b0a60b35f12a1e100c.png

对于这件事,你怎么看呢?

参考链接:
[1]https://twitter.com/michalkosinski/status/1636683810631974912
[2]https://twitter.com/DrJimFan/status/1636393418422358016
[3]https://twitter.com/geoffreyhinton/status/1636110447442112513
[4]https://arxiv.org/abs/2302.02083

推荐阅读:
入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14693.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4发布:多模态大模型,AI能力再度进化,可识别图像内容

能终结chatGPT的人只有openAI自己。 ——阿卡夫斯基-作者本人 ::: 今日凌晨,OpenAI发布了GPT的最新一代版本ChatGPT-4,相比3.5,其AI能力再度进化,同时支持输入的内容不再仅限于文字,而且支持图像内容的输入&#xff0c…

JavaWeb房屋租赁系统

项目描述: 本系统是一个独立的系统,用来解决房屋出租信息的管理问题。采用JSP技术构建了一个有效而且实用的房屋出租信息管理平台,目的是为高效地完成对房屋出租信息的管理。 用户信息管理:会员信息的添加、删除和查询等。 房源信息管理: 包…

【ChatGPT】助力岗位提升VS降低岗位需求终究会对哪些岗位负影响,又有哪些岗位正影响

chatGPT会让哪些岗位更差,甚至会导致失业,列举处10个 ChatGPT 作为一种自然语言处理技术,确实可能对某些岗位造成影响,甚至可能导致失业。以下是一些可能会受到 ChatGPT 影响的岗位: 传统翻译员:由于 Chat…

ChatGPT诞生的新岗位:提示工程师(Prompt Engineer)

ChatGPT诞生的新岗位:提示工程师(Prompt Engineer) Prompt 工程师是什么? 是识别人工智能的错误和隐藏功能,以便开发者可以对这些发现进行处理。 如果你正在寻找科技领域最热门的工作,你可以尝试了解如何与AI聊天机…

chatgpt赋能python:Python在炒股中的应用

Python在炒股中的应用 在当今的金融市场中,股票交易已成为最受欢迎的投资方式之一。随着技术的不断发展,投资者发现使用计算机和编程语言可以帮助他们更好地理解市场,并更有效地进行投资。Python作为一种简单易学的编程语言,已成…

当 我让chatgpt帮我生成一篇情书给我暗恋多年的女神...

有人留言说想看gpt写的情书,结果如下。 经过实验让gpt3.5写小说有难度,但是让它写情书还行,虽然有缺点。 知道你对ChatGPT感兴趣,所以给你如果想要使用可以加我耗油获取~

用Python来表白,把情书写进她的照片里

前言 这不已经十一月了,22年马上就过完了,各位兄弟有对象了吗,现在就是缺钱还缺对象 退一步来说,有心仪的人吗啊,如果有的话,看看这篇 程序员的表白小妙招吧 实现步骤 想要实现把情书写在像素中&#xf…

情话达人改变世界:ChatGPT版情书!

在浪漫的情人节到来之前或者在特殊的日子里面,我们都在想方设法让我们的伴侣感到特别。 一种很古老的表达爱的方式是写“情书”,但在这快节奏的生活方式和繁忙的工作,很难有足够的时间真正坐下来把我们的心情写出来,更困难的是找…

帮中国人搞钱的ChatGPT,算不清自己的“经济账”

好消息,ChatGPT找到盈利模式了。坏消息,尽是“二道贩子”在赚钱。 当OpenAI尝试着为红到发紫的ChatGPT推出20美元的Plus订阅服务时,大多数人已经忘记了这个“吞金兽”的成长耗费了多少财力物力。问答狂欢者的岁月静好靠的是OpenAI的负重前行&…

Sping boot 整合chatGPT

一、介绍 Spring Boot 是一种用于创建独立的、基于 Spring 的应用程序的框架。它的主要目的是简化 Spring 应用程序的开发和部署过程。在本文中,我将向您展示如何使用 Spring Boot 框架与 ChatGPT 进行整合。 二、获取api密钥 OpenAI API 注意,不会在生…

ChatGPT与软件架构(4) - 架构师提示工程指南

架构师可以通过各种类型的对话提示,提升驱动ChatGPT对话输出的质量,更好的利用AI能力辅助架构设计。原文: Software Architects’ Guide to Enhancing ChatGPT Interactions With Prompt Types Robert Stump Unsplash 前言 随着ChatGPT等人工智能语言模型…

装饰器模式揭秘:我用装饰器给手机集成了ChatGPT

在平时的开发过程中,我们经常会遇到需要给一个类增加额外功能的需求,但又不想破坏类的原有结构。这时候,装饰器模式就能大显神威了!接下来,我将带你深入了解装饰器模式的原理、优缺点、适用场景以及如何在实际开发中巧…

放烟花的python程序

一.前言 重点:需要打包后的程序可以直接评论区留言或者私聊我,无需编程直接使用。 2023春节期间做的烟花程序,支持一定的个性化设置,已打包上传在我的资源。主要学习其它大神的烟花代码,后续自己做了改进和添加&#…

烟花HTML特效

这是我18年写的一个烟花的特效,拿来骗骗小孩还是有点作用的,废话不多说直接上代码. <!doctype html> <html> <head> <meta charset"utf-8"> <title>HTML5 Canvas 3D烟花动画</title> <style> html,body{margin:0px;width…

ChatGPT+大数据,会有怎样的火花?

ChatGPT到底有什么用&#xff1f;能和大数据擦出怎样的火花&#xff1f; 大家好&#xff0c;我是独孤风&#xff0c;一位曾经的港口煤炭工人&#xff0c;目前在某国企任大数据负责人&#xff0c;公众号大数据流动主理人。 最近的的ChatGPT非常的火&#xff0c;我本来是不想追什…

跨年烟花(用HTML制作动态烟花)

跨年烟花&#xff08;用HTML制作动态烟花&#xff09; 先看效果图 html代码 <!doctype html> <html> <head> <meta charset"utf-8"> <title>漂亮的3D烟花动画特效</title><style> html,body{margin:0px;width:100%;heig…

烟花代码(本人亲测,有效)

代码如下: <!DOCTYPE html> <html><head><meta charset"utf-8" /> <meta http-equiv"Content-Type" content"text/html; charsetgbk" /> <title>过年好</title> <script type"text/javascr…

HTML烟花特效,除夕快到了,把它收藏下来,过年和最重要的她一起看烟花。

文章目录 前言一、效果图二、操作步骤第一步第二步第三步第四步第五步第六步 源码 前言 最近随着电视剧《点燃我温暖你》的火热播出&#xff0c;剧中帅气学霸李洵的炫酷爱心代码也迅速火出了圈&#xff0c;爱心素材异常火爆&#xff0c;烟花也异常火爆&#xff0c;毕竟在这绿色…

分析网上的一篇“浪漫烟花“程序<VS-C++>

结果:多个烟花弹同时上升,然后进行爆炸,并进行了花样设计,采取心型设计方案,背景音乐设置为"小幸运",除此在最初,窗口设置有文本. 接下来,就让我们来分析代码: // 烟花结构 struct FIRE {int r; // 当前爆炸半径int max_r; // 爆炸中心距离边缘最大半径int …