ChatGPT死活不认27能被3整除,网友:不是说AI要统治世界了吗?

Alex 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

让众人疯狂的网红AI ChatGPT,原来也有明显的短板?

一段“网友调教这只AI”的聊天记录,在网上传开了。

可以看到,AI起初居然说27是个质数。

c679d0d090f8fcaf64f0116a2ea74496.png

在网友向其提出质疑后,AI仍嘴硬称“27不能被3整”。

bdd02fd7e6914ff018163e0f640ce22f.png

网友不得不和AI“大战几百回合”,最后在人类锲而不舍的教导下,AI才终于终于低头认错。

973f163572cffcc71cf66af9f9d4351e.png

上述图源:微博@沙雕文案 援引网友空间截图

有一说一,AI的认错态度倒是很好。

fdf346df3cddcb6733a06aefb5d15219.jpeg

有围观者看完后调侃:AI不是都要统治世界了吗,怎么会输给一道简单的数学题?

6fb4499aa75ccb67007a15a3aecbebee.jpeg

不过,也有很多人为ChatGPT说话:这么坦诚的认错态度,不比某些人强多了b37674b17f8259a53ab43f46a02213e9.png

6528f037445d7c0e4dfc2a492c5d7e46.jpeg
a552e7264e385b594779a6503a7011a8.jpeg

数学水平拉胯,还贼固执

具体事情是这样的:

网友在和ChatGPT互动的过程中发现,这只AI数学水平过于拉胯,连27是不是质数这种简单问题都能搞错——而且还是在知道质数定义的情况下……

1409aeceb4a4eded97e4e96e0fa0cbc4.jpeg

于是网友让ChatGPT证明它给出的结论,没想到,AI居然说27不能被3整除。

网友表示无语,但还是耐着性子又问了一遍,结果AI依然嘴硬,偏把9说成是9.0。

无奈,网友只能搬出代码,试着用Python来教会AI。

结果AI还真学会了!而且人家还主动承认了刚才的错误。

21a1354324383a09ab691d72b4c2f26d.png

有意思的是,我们刚才也去问了ChatGPT“27是不是质数”,发现它已经改过来了。

79ab60d88504e21ba2aa28041833b5a9.png

然后我们又拿了几个数字去问AI,结果在这一回合中,它都正确地判断了一个数到底是不是质数。

9efc15296ef6d1404a166d782cc0b214.png

不过仔细一看,AI并没提到35能被7整除,于是我们又专门问了一遍。然鹅……

b89ed393b69cfe55e700dba63884a919.png

这岂不是一本正经地胡说八道嘛?

于是我们也只好搬出Python教教它,但这回,连python似乎也没能让AI承认自己的错误……

86dbbbbe5cd529b3b20a5c8b05607df3.png

所以这只AI为啥算术水平如此堪忧,而且还如此固执?

e631af0d60cfdaa4898104ccb466c587.jpeg

其中一个重要的原因就是,ChatGPT是个语言大模型,根据Open AI的GPT-3.5的模型微调而成,它擅长逻辑推理,但并不能执行标准的计算机算法。

而且与搜索引擎不同,它目前也没有网页浏览功能,无法调用在线计算器。

此前,ChatGPT其实已经向用户坦言,它不懂算术。两位数的乘法或许还凑乎,但遇到三位数的乘法,人家直接不干了。

e94aedafc7b208b51ff6a123b473db10.png

我们也去问了一遍,现在AI到是直接给了个答案,不过是错的。(正确答案为186524)

16f94ded667168019b91c4ecb34d31b6.png

另外,ChatGPT一般不会根据用户的反馈来纠正自己的答案,但如果用户提出了额外的信息,有时也能辅助AI优化答案。

290f4ffc5db0eb2e0b7b384d7b16f80d.png

所以,我们暂时没有成功地“教育”AI,大概也许可能是运气不太好……

除了数学其他都很全能

尽管ChatGPT有时会展现出“人工智障”的一面,但不得不说,大多数时候它的表现还是很优秀的。

比如,哥伦比亚大学教授、谷歌工程师Kenneth Goodman就分享,ChatGPT已经做好成为律师的准备了!

律师执业考试中,ChatGPT的正确率高达70%(35/50)。

bf39e743b1b97458e4a813f74ae8b398.jpeg
b25c65006408b93b10995205b4b2da39.jpeg

不仅是法律方面,Goodman还让ChatGPT参加了其他不同领域的各种考试,都取得了很高的成绩。

包括美国医师执照考试(USMLE),拿掉其中的图像选择题后,ChatGPT同样做到了70%的正确率。

f04c141b03a903eeb40fdce982ecefc7.png

为了防止ChatGPT的训练数据中包含这些题目,Goodman还特意选取了纽约州2022年8月最新化学注册考试

去除5个图片选择题,ChatGPT的正确率为77.7%(35/45)。

edcef4e1a575e562f8d8e13cd40b34ee.png

同样批次的英语考试中,ChatGPT的正确率甚至达到了91.6%(22/24)

86e97e5a044091cede1b08a5bd716035.png

有网友已经开始预测,或许我们每个人都将拥有自己的律师AI了,咨询律师的费用也会大大下降。接下来就是医生AI、营养师AI……

0fd8986d52da2dce344c5ae85693b0e0.png

怎么样,你看好ChatGPT的未来应用吗?(或者你有让它学好数学的建议吗?47044ea1a0bcfc2e20a0a1075e0d0619.png

参考链接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256

量子位「MEET2023智能未来大会」

倒计时2日,即将线上直播

326b951525382d72cb30766a077fc78c.jpeg

点这里关注我 👇 记得标星噢 ~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33281.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 重磅更新 变得更强啦 | 包括更多可控的 API 模型、函数调用能力、更长的上下文和更低的价格

文章目录 一、前言二、主要内容三、总结 🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一、前言 OpenAI 官网:https://openai.com/blog/function-calling-and-other-api-updates 功能调用和其他 API 更新。OpenAI 宣布更新,包…

自己写的一段预测双色球号码的Java代码

原理是根据双色球开奖的历史数据,根据各种易经八卦,天时等随机因素预测下一期的双色球号码。 完整代码在我的github上: MainFrame.java是主程序: package ball;public class MainFrame {public static void main(String[] args) …

20211217使用python3通过最近6期的双色球开奖结果预测新一期的号码

20211217使用python3通过最近6期的双色球开奖结果预测新一期的号码 酬金/劳务费用:小奖请吃饭。 大奖给你技术支持费用! 按照你如今加班工资的2倍计酬! 第一步,希望2周完成,大概完成时间2021-12-15: a1*x1…

《LSTM神经网络和双色球预测例子》

前言: 书接上回,通过把历年来的双色球蓝球数据爬取,可以看出,每期双色球蓝球之间并无任何关系,但仍存在问题: 决定蓝球数字可能并非取决于上一期蓝球的数据,可能取决于当期红球的数据&#xff0…

《基于LSTM神经网络的双色球蓝球数字预测》

结论:没有任何作用,基本可以断定这是真正随机的数字。 LSTM神经网络,单步预测,循环2000次,100个神经元,无dropout。 蓝线:最近50期蓝球数字 橙线:LSTM网络预测数字 绿线&#xff1a…

数学建模预测模型实例(三)---双色球概率预测模型

双色球概率预测模型 数学建模预测模型实例(一)—大学生体测数据模型 数学建模预测模型实例(二)—表白墙影响力量化模型 python预测算法—线性回归 双色球概率预测模型 前言 最近新晋彩民佩瑞对于双色球产生了极为浓厚的兴趣&am…

AIGC 工具推荐:利用 AI 提高工作效率的利器

人工智能(AI)正在改变我们的生活,使我们的工作更加高效和智能化。在这个快速发展的领域中,有许多 AI 实用工具可以帮助我们更好地完成工作。在未来熟练使用各种 AI 工具优化你的工作流并提高工作效率将是每个人的必备技能&#xf…

Ubuntu Go语言环境配置【GPT-4版】

目录 go语言的培训网课安装goGPT-4给出的过程在VSCode里怎样正确配置好Go的调试相关设置?如果我在Visual Studio Code中安装Go语言的相关工具总是失败怎么办?我已重启Visual Studio Code,接下来应该怎样检查日志?如果我还是不能成…

Monica - 你的 GPT-4 人工智能助手

Monica介绍 官方地址:https://monica.im/?cX0OHBN1S (仅限今天,通过这里注册可免费获取100次Monica查询) Monica 是一款由 ChatGPT API 提供支持的扩展程序,它可以与您讨论任何事情,使用 80 多个模板生成文…

初学者使用Auto-GPT入门:设置和使用

初学者使用Auto-GPT入门:设置和使用 简介:1. 快速演示2. 要求3. 设置OpenAI使用限制(可选)4. 安装Python5. 安装Git6. 安装 virtualenvwrapper(可选)6.1 使用 pip,您可以轻松地在 Python 环境中…

最近热门话题-Auto GPT 初学者Auto GPT 入门:设置和使用

Auto-GPT 是一个实验性的开源应用程序,展示了著名的 GPT-4 语言模型的功能。 它使用 GPT-4 执行复杂的任务并实现目标,而无需太多人工输入。 Auto-GPT将OpenAI的GPT模型的多个实例链接在一起,允许它做一些事情,比如在没有帮助的…

GPT国内使用

国内可用的 ChatGPT 替代 列表 功能和使用 顺便推荐 列表https://chatgpt.qdymys.cn/ :三小时只能用10次 https://alllinkai.com/:体验完,要登录,不推荐 https://gpttalk.live/ :每天限制使用次数 https://chatgpt-…

信息收集----浏览器,网络空间搜索引擎

目录 一.浏览器搜索 1.什么是Google Hacking 2.高级搜索 3.示例 4.工具 二.网络空间搜索引擎 1.什么是网络空间搜索引擎 2.Shodan的使用 3.Censys,Zomeye,Fofa介绍 1.Censys 2.zoomeye 3.fofa 4.总结对比 5.基于网络空间搜索引擎的工具 一.浏览器搜索 1…

VC++实现双人对决的围棋程序,阿尔法狗围棋

可以双人对决的VC围棋程序,送给我梦中的情人。虽然程序不很复杂,但必竟是我自己亲手写噢,而且还得到了女朋友的夸张,通过编写这个小程序,让我对VC有了更深层的了解,想要的下载。游戏打开后可以选择适合15、…

训练策略网络和价值网络

阿尔法狗2016版本使用人类高手棋谱数据初步训练策略网络,并使用深度强化学习中的REINFORCE算法进一步训练策略网络。策略网络训练好之后,使用策略网络辅助训练价值网络。零狗(AlphaGo Zero)使用MCTS控制两个玩家对弈,用…

计算机永远无法超越人类——从李世石与阿尔法的人机大战中想到的

转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/52214884 本文出自【我是干勾鱼的博客】 大家好!我是海东。前一阵子李世石与谷歌阿尔法的围棋人机大战引起了大家的广泛关注,今天我们就来聊聊计算机与人类的较量。 首先海…

机巧围棋(CleverGo)项目总览及介绍

1. 项目简介 2016年3月,阿尔法狗以4:1战胜围棋世界冠军李世石。自此开始,深度强化学习受到空前的关注并成为AI领域的研究热点,彻底引爆了以深度学习为核心技术的第三次人工智能热潮。 机巧围棋利用PythonPygamePaddlePaddle基于AlphaGo Zer…

算法高级(45)-阿尔法狗到底有多厉害?

1997年5月11日,一台名为“深蓝”的超级电脑将棋盘上的一个兵走到C4位置时,人类有史以来最伟大的国际象棋名家卡斯帕罗夫不得不沮丧地承认自己输了。世纪末的一场人机大战终于以计算机的微弱优势取胜。 当然,国际象棋这样的棋类比赛&#xff…

什么是阿尔法和贝塔?

不管是买基金进行投资的基民,还是专业挑选基金经理的各种机构,都会面临这么一个问题: XX基金在过去X年涨/跌了X%,它的表现如何?算好,还是不好? 要把这个问题讲清楚,我们就需要向大…

谷歌计算机围棋程序,阿尔法狗教你下棋 谷歌上线AlphaGo围棋教学工具

【PConline 资讯】看起来AlphaGo在围棋界真的是无敌了,如果这么强大聪明的AI变成了围棋老师,对于人类来说是不是又是另一种体验呢?12月13号,谷歌旗下的DeepMind上线了这款在线AlphaGo围棋教学工具(点击此访问)。放心点进去&#x…