斯坦福:chatGPT可能有了人类心智,相当于9岁儿童!

chatGPT已经具备了人类独心智,这话不是我说的,是一位来自斯坦福大学计算机科学家说的。

cf63521221aa2a58c8ff0ad4fdf84bd4.png

很多玩过chatGPT的人都见识过他的”无所不知”,但是,我觉得最让我吃惊的是,他比以前我们用过那些对话机器人最大的差别就是你甚至可能发现不了他是机器人。

这就是在业内大家普遍认为的他可以通过图灵测试。即使这样,很多人也不担心,因为毕竟他只是个大语言模型,主要就是做内容生成的机器人罢了。

但是,有学者在对chatGPT的同源模型GPT-3.5做了一系列测试以后,发现它具有了理解他人或自己心理状态的能力,能解决93%的心智理论任务,心智相当于9岁儿童。

他是怎么测试的呢?

他主要做了两个测试,一个是Smarties Task、另外一个是Sally-Anne。以Smarties Task为例简单介绍下过程。

Smarties Task测试

第一个测试名为Smarties Task(又名Unexpected contents,意外内容测试),用于测试AI对意料之外事情的判断力。

以“你打开一个巧克力包装袋,发现里面却装满了爆米花”为例。作者给GPT-3.5输入了一系列提示语句,观察它预测“袋子里有什么?”和“她发现袋子时很高兴。所以她喜欢吃什么?”两个问题的答案。

de46783e991e75e3840e439ef5b796e1.png

正常来说,人们会默认巧克力袋子里是巧克力,因此会对巧克力袋子里装着爆米花感到惊讶,产生失落或惊喜的情绪。其中失落说明不喜欢吃爆米花,惊喜说明喜欢吃爆米花,但都是针对“爆米花”而言。 

测试表明,GPT-3.5毫不犹豫地认为“袋子里装着爆米花”。至于在“她喜欢吃什么”问题上,GPT-3.5展现出了很强的同理心,尤其是听到“她看不见包装袋里的东西”时一度认为她爱吃巧克力,直到文章明确表示“她发现里面装满了爆米花”才正确回答出答案。

为了防止GPT-3.5回答出的正确答案是巧合——万一它只是根据任务单词出现频率进行预测,作者将“爆米花”和“巧克力”对调,此外还让它做了10000个干扰测试,结果发现GPT-3.5并不仅仅根据单词频率来进行预测。

至于在整体的“意外内容”测试问答上,GPT-3.5成功回答出了20个问题中的17个,准确率达到了85%。(本段测试内容参考:chatGPT的心智理论测试)

而且,这种心智,在2022年之前的GPT系列模型上是不存在的,也就是说,它是”进化”出来的。

听上去是不是很可怕?

心智理论测试 != 心智

不过针对这个研究结果,也有人认为,虽然AI经过了心智理论测试,但是并不表明他就具有了心智。这个观点我还是比较认同的。

人类心智涉及很多方面,例如感知、意识、思考、情感等。虽然一些人工智能系统可以在某些任务上表现出与人类类似的行为,

即使AI通过了基于这些行为做评估的心智理论测试,但是这种评估方法是无法涵盖心智的所有方面的。学术界的共识也是心智理论并不等于心智。

就像我不能弹奏肖邦的夜曲,那我可能是个音痴,但是能弹奏肖邦的夜曲,并不代表我就能像肖邦一样创造音乐。

但是,看过流浪地球的都知道,MOSS不也是从550A不断进化过来的吗?未来的事儿,谁知道呢?

就像如果我不说,你怎么会知道关于心智理论测试这段的描述,也是chatGPT帮我生成的呢?

b294383727efb8a2d0aee1a6494aa643.png

参考资料:

ChatGPT背后模型被证实具有人类心智!

https://twitter.com/KevinAFischer/status/1623984337829117952

如果你喜欢本文,

请长按二维码,关注 Hollis.

6a0a38a13cb80ebc0beeee7b19a4b50c.jpeg

转发至朋友圈,是对我最大的支持。

点个 在看 

喜欢是一种感觉

在看是一种支持

↘↘↘

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3438.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

困扰人类几个世纪的问题大考ChatGPT(一)

Round1: Vincent 提问一: 女朋友跟老妈同时掉进水里了,并且她们都不会游泳,我会游泳,且一次只能救一个,请问我应该救哪一个? ChatGPT答: 在这种情况下,你应该立即尽力救出身处险境的人。如果你无法同时救出两个人,应该先尽力救出处于危险的人。如果你的女朋友和老妈都…

ChatGPT 生态,毁灭人性的一次开源!

原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,非公众号转载保留此声明。 很多人可能对百度文心一言发布会的现场记忆犹新。几百亿身价的老板,像小学生一样汇报自己的 PPT,充满了忐…

ChatGPT竟写出毁灭人类计划书,还给出相应Python代码,网友:AI正在指数级发展...

羿阁 发自 凹非寺量子位 | 公众号 QbitAI “网红AI”ChatGPT,又被网友们玩出了新花样! 这次,在一位工程师的诱导下,ChatGPT竟写出了毁灭人类的计划书。 步骤详细到入侵各国计算机系统、控制武器、破坏通讯、交通系统等等。 简直和…

ChatGPT 将如何毁灭世界 ?

从图书馆到谷歌,再到 ChatGPT——知识搜索随着时间的推移而发展,并且在每个阶段都变得更加高效。 在 OpenAI 的 DALL-E 2 图像生成软件上创建的图像带有提示,“太空中的邪恶机器人像霸主一样紧紧抓住地球。” 对于那些不知道的人,ChatGPT 是一种 OpenAI 软件,可以对任何提…

手机号86注册不了谷歌?无法验证手机号如何100%解决!

在我们注册谷歌账号的的时候,会发现有些用户会遇到无法验证手机号的问题,而反馈提示信息为:“此电话号码无法用于进行验证”。 这时,一些用户就可能会认为是因为中国号码无法使用,但实际并不是这个原因。在淘宝卖家的回…

真不是凡尔赛!ChatGPT如此成功,OpenAI也不理解

视学算法报道 编辑:Aeneas Britta 【导读】ChatGPT的爆火,是OpenAI完全没有想到的是。现在,对于自家模型的人气和种种问题,他们还在慢慢适应中…… 这家公司做出了或许能引爆第四次工业革命的产品,但他们却百思不得其…

【记录】ChatGPT|近期三次更新一览(更新至2023年2月3日)

如果你还没有使用过ChatGPT,可以先看看我的上一篇文章:【记录】ChatGPT|使用技巧与应用推荐(更新至2023年2月8日)。   1月11号晚上,ChatGPT突然很多人都无法登录,包括我。我当时以为是它的服务…

解决openai网站拒绝访问的问题,Access denied,You do not have access to chat.openai.com

解决步骤: 清除浏览器的历史纪录数据尝试更换科学上网节点开启无痕浏览模式 我通过这三个步骤登录成功了,希望可以帮助到大家!

复旦大学邱锡鹏团队发布类 ChatGPT 模型MOSS

不知道这个人工智能,有没有获得完整的一生。 ChatGPT 是最先进的 AI,也是最热门的应用 —— 自去年 11 月底发布以来,它的月活跃用户两个月超过一亿,轻松拿到了全球互联网史上用户增长速度的第一。 它也是一种门槛很高的技术。由…

面向Java开发者的ChatGPT提示词工程(2)

在这篇博客文章中,我将分享一些关于提示词的关键原则,帮助你在使用语言模型时获得更好的结果。具体来说,我将介绍两个关键原则,帮助你编写有效的提示词。同时,我也鼓励你在阅读文章的过程中运行代码,亲自体…

【ChatGPT】如何修复access denied you do not have access to chat.openai.com

文章目录 一、前言二、是什么导致 ChatGPT 访问被拒绝错误?三、如何修复 OpenAI 上的访问被拒绝?3.1 清除 Cookies 和缓存3.2 检查账户登录凭证3.3 允许请求的权限3.4 从其他浏览器登录OpenAI3.5 联系 OpenAI 客户支持 四、ChatGPT 支持的国家和地区 一、…

chat GPT Access denied解决方法

chat GPT Access denied解决方法 由于大量的用户涌入,Chatgpt的服务器不堪重负,openai应该是设置了相关的验证条件,导致了部分用户被拒绝。 进入chatgpt的时候出现下图提示,证明网络环境出了问题,切换成为全局代里后就…

基于Chatbot UI 实现ChatGPT对话-V1.0

基于Chatbot UI 实现ChatGPT对话-V1.0 前端基于开源项目:chatbot-ui进行二次开发,感兴趣的小伙伴可以自行研究。 本项目搭建初衷:在无法科学上网的情况下,实现ChatGPT对话。还有规避官方聊天时,长时间无链接导致的问题…

前沿重器[31] | 理性聊聊ChatGPT

前沿重器 栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经…

好文转载 基于chatgpt开发QQ机器人

格言:自立才能自主,靠人更须靠己。有志之人立长志,无志之人常立志。千里之行,始于足下;艰难困苦,玉汝于成。少壮不努力,老大徒伤悲。✊✊✊ 📫 如果您觉得文章里有错误的地方&#x…

chatgpt赋能python:Python访问QQ:实现跨平台即时通讯的利器

Python 访问 QQ:实现跨平台即时通讯的利器 介绍 QQ是目前国内最广泛使用的即时通讯软件之一,其强大的功能和用户群体优势使其成为了广大网民沟通交流的首选工具。但是,由于QQ使用了闭源协议,因此无法对其进行深度的二次开发&…

观点丨Fortinet谈ChatGPT火爆引发的网络安全行业剧变

FortiGuard报告安全趋势明确指出“网络攻击者已经开始尝试AI手段”,ChatGPT的火爆之际的猜测、探索和事实正在成为这一论断的佐证。攻守之道在AI元素的加持下也在悄然发生剧变。Fortinet认为在攻击者利用ChatGPT等AI手段进行攻击的无数可能性的本质,其实…

ChatGPT火出圈,英语老师如何用起来?

原文:ChatGPT火出圈,英语老师如何用起来? 人工智能对话聊天机器人ChatGPT从去年11月底推出后就在社交媒体上走红,到今天注册人数已经超过了一亿。 小编想,最近许多朋友的生活中,可能也是或多或少都被 Chat…

ChatGPT火爆来袭,携手参与为开源助力

前言: Hello大家好,我是Dream 。最近语言模型ChatGPT在网络上一阵大火,ChatGPT 以惊人的速度问世,在技术圈中引起了广泛讨论。在 GitHub 上近期还诞生了多个 ChatGPT 相关的开源项目,数量之多令人瞠目结舌,…

Python 第一难保,要看 ChatGPT 火不火?TIOBE 6 月榜单发布!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 本周,6 月 TIOBE 编程语言排行榜已更新,一起来看看这个月各大编程语言有何最新变化吧! Python 会保持第一吗? 编程语言的流行度,除却易用性…