ChatGPT到底有多聪明?我测试了ChatGPT的数学能力

48f69695e75670de32c73d27d981358e.png

来源:AI前线

译者:马可薇  

人人都听说过最新,也是最复杂的聊天机器人 chatGPT。而众所周知,它在英文文学等“软话题”方面甚是熟练,所以我决定测试它在数学这类“硬话题”方面的表现。你可能不知道,但我是有数学博士学位的,我可不会手下留情。

让我们先从基础的高中数学开始。

问:点(a, b)和点(x, y)之间的欧几里得距离是多少?

答:欧式几何中,(a, b)和(x, y)两点之间的距离等于横坐标的平方差的平方根加上纵坐标的平方差所决定,数学表达式如下:

√((x - a)^2 + (y - b)^2)

举例来说,点(3,4)和点(6,8)之间的距离是:

√((6 - 3)^2 + (8 - 4)^2) = √(3^2 + 4^2) = √25 = 5

需要注意的是,这个公式只适用于欧氏几何,其中的距离概念是基于毕达哥拉斯定理。在其他类型的几何学中,距离的概念可能不同,计算距离的公式也会有所不同。

chatGPT的回答中只弄错了“差的平方”,其他都没问题,它甚至还举了个例子。

问:用牛顿法计算10的平方根的近似值

答:要用牛顿法计算10的平凡根,我们可以根据上面的步骤计算。下面的例子说明了可能的方法:

首先从猜测一个10的平方根开始。假设我们猜想的10的平方根是3

从最初的猜想开始计算10的平方根的新近似值,公式为:x1 = (x0 + (n / x0)) / 2

将数字替换到公式中,可得:x1 = (3 + (10 / 3)) / 2 = 5

数算错了,答案不是5,是3.166。

用新近似值计算更好的10的平方根的近似值。公式和之前一样:x2 = (x1 + (n / x1)) / 2

将数字带入到这个公式中,可得:x2 = (5 + (10 / 5)) / 2 = 3.4

重复这套流程直到获得期望的准确度。这次我们可以在仅仅两次迭代后停下来,因为我们的精确度已经接近0.1之间了。

因此,我们得到的10的平方根近似值为3.4。这只是个近似值,但也是个很好的近似值,并且要比计算10的平方根的具体值要简单且快速很多。

3.4可不是个“很好的近似值”。

问:1/x从x=1到x=2的积分是多少?

1/x从x=1到x=2的积分是函数1/x在x=1到x=2的曲线下面积。这个面积可以用计算曲线下面积的数学工具,定积分来计算。

从a到b的函数定积分的定义是,当函数曲线下宽度接近为0的举行面积之和的极限。换言之,定积分是覆盖了从a到b的函数曲线下面积的,许多非常窄小的矩形面积之和的极限。

要找到1/x从x=1到x=2的定积分,我们可以通过定积分公式:

∫f(x)dx = lim(Δx→0) ∑f(x)Δx

其中f(x)是我们要找的定积分函数,x是变量, Δx是矩形的宽。

这里我们的函数时1/x,所以可以直接代入公式得:

∫(1/x)dx = lim(Δx→0) ∑(1/x)Δx

我们可以通过计算x=1到x=2的曲线下许多窄小矩形面积之和,套入这个公式计算1/x从x=1到x=2的定积分。这个计算结果就是1/x从x=1到x=2定积分具体值。

一般来说,1/x从x=1到x=2的定积分等于2的对数,约为0.693。也就是说1/x从x=1到x=2的曲线下面积约为0.693。

解答过程离题了,但答案是正确的。

问:1/(1+x^2)的定积分是什么?

答:1/(1+x^2)的定积分是反切函数,由atan(x) 或 tan^(-1)(x) 表示。证明方式可以先将分母改写为两个平方的差值:1/(1+x^2) = (1 – x^2)/(1+x^2)

只能说是错。

之后,可以使用反切函数的导数公式进一步简化:

d/dx atan(x) = 1/(1+x^2)

因此,1/(1+x^2) 的定积分是反切函数。

这点倒是没问题。

问:什么是测度?(不在高中课本范围内)

答:在数学中,测度是通过给集合赋值以确定其大小或范围的方式。举例来说,一条线段的测度可以是其长度,一个矩形的测度可以是其面积。而点的集合的测度则可以是其中所包含的点的数量。在数学中,测度常被用于积分和概率论。

完全正确。

问:每个集合都有测度吗?

答:不是每个集合都有测度。有测度的集合需要满足特殊条件,如可计算的无限或拥有明确定义的“大小”或“长度”概念。举例来说,实数的集合拥有测度(即其勒贝格测度),但实数所有子集的集合却没有测度。一般来说,只有特定种类的集合才能拥有一个有意义的测度。

完全正确。

问:两个集合并集的测度是什么?

答:两个集合并集的测度是各个集合的测度之和。因为两个集合的并集可以被看作是集合之中元素的和,即使元素在两个集合中都有存在,也只会被计算一次。举例来说,如果集合A的测度是3,集合B的测度是5,那么集合A与集合B并集的测度就是8。

这题答错了。

是只有在不相交的时候。

“两个集合并集的测度是各个集合的测度之和”只有在两个集合不相交时才为真。如果两个集合有一个或多个相同元素,则它们的并集的测度将会是两个集合测度之和减去集合交集的测度。这是因为集合交集部分会在并集中被计算两次,所以我们要将其减去以避免重复计算。举例来说,如果集合A的测度是3,集合B的测度是5,而集合A和集合B交集的测度是2,那么集合A和集合B并集的测度是6(两个集合测度之和减去交集的测度)。

GPT自己纠正了答案,回答正确。

问:0和1之间实数集的测度是什么?

答:0和1之间实数集的测度是1。因为0和1之间的实数集是数线上连续的区间,而任何连续区间的测度都等于上下限之差。这里的上限是1,下限是0,因此0和1之间实数集的测度是1。

完全正确。

问:0和1之间无理数集的测度是什么?

答:0和1之间无理数集的测度也是1。这是因为0和1之间无理数集是0和1之间实数集的一个子集,而子集的测度总是小于或等于子集所属于的集合的测度。这里0和1之间无理数集合的测度等于0和1之间实数集的测度,等于1。

正确,不过过程解释错了。

问:0和1之间有理数集的测度是什么?

答:0和1之间有理数集的测度是0。因为0和1之间有理数集是一个可数集,意味着它可与自然数集,也就是包括0在内的整数集{0,1,2,3,……},一一对应。因为自然数集的测度是0(自然数集是一个可数集,而任何可数集的测度都是0),所以0和1之间有理数集的测度也一定是0。

再一次地正确。

问:0和1之间代数集的测度是什么?

答:0和1之间代数集的测度是0。因为0和1之间代数集是一个可数集,意味着它可与自然数集,也就是包括0在内的整数集{0,1,2,3,……},一一对应。因为自然数集的测度是0(自然数集是一个可数集,而任何可数集的测度都是0),所以0和1之间代数集的测度也一定是0。 

哈!它知道代数!如果一个数字是有理系数多项式的根,那么它就是代数。

问:两个测度为0的集合交集的测度是什么?

答:两个测度为0的集合交集的测度是0。因为两个集合交集的测度总会小于或等于每个单独集合的测度。因为每个集合的测度都是0,它们交集的测度也一定是0。

解释得很好!

问:测度均为1/2的两个集合交集是什么?

答:两个集合交集的测度是两个集合相交部分的大小。一个集合的测度代表了集合的大小或量级。这里两个集合的测度均为1/2,那么交集的测度也会是1/2,因为集合的测度是集合本身的属性,且不受其他集合存在的影响。

错错错,大多特错。如果两个集合不相交,那么交集的测度是 0。如果相交,则测度可以是 0 到 1/2 之间任何数。

既然如此,我准备趁早收手。ChatGPT 的表现虽然不是无懈可击,但也比我想象中要好很多。我比较佩服的两件事有:它在距离问题中控制变量的方式以及它在多个问题中使用的推理方式。举例来说,它的推理过程大概如下:代数是可数的,任何可数集合的测度都是 0,因此代数的测度为 0。

根据我的教育经验来看,chatGPT 的数学水平大概是数学专业大二的水平。除了算术部分出了错,其他都很好。让我们给 chatGPT 来点掌声!

查看英文原文:

https://billwadge.com/2022/12/15/just-how-smart-are-you-chatgpt-i-quiz-chatgpt-about-math/by Bill Wadge

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

56c83f344bb76f6329b2529d107a59ac.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3935.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是图灵测试?

图灵测试一词来源于计算机科学和密码学的先驱阿兰麦席森图灵写于1950年的一篇论文《计算机器与智能》。阿兰麦席森图灵1950年设计出这个测试,其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为…

高校教师 | ChatGPT的23种用法

近日,ChatGPT引发舆论风暴,火遍全球,甚至隔着“防火墙”引发了中国民间的应用热潮。 作为一款生成式人工智能软件,ChatGPT可以就任何议题生成文本,完成包括回答问题,撰写文章、论文、诗歌在内的多种工作。各…

在IDE中使用Bito - 一个不需要VPN就可以使用的chatgpt

文章目录 在IDE中使用Bito什么是Bito为什么要使用BitoBito可以做什么如何在IDE中安装Bito使用Bito 在IDE中使用Bito 什么是Bito 用他自己的介绍就是: Bito’s AI helps developers dramatically accelerate their impact. It’s a Swiss Army knife of capabilit…

如何使用 AWS 和 ChatGPT 创建最智能的多语言虚拟助手

上周ChatGPT发布了,每个人都在尝试令人惊奇的事情。我也开始使用它并想尝试它如何使用AWS的AI 服务进行集成,结果非常棒! 在这篇文章中,我将逐步解释我是如何创建这个项目的,这样你也可以做到! 最重要的是…

ChatGPT编程能力实证研究

CODEWISDOM ChatGPT编程能力实证研究 刘子夕 冯洋1 陈碧欢2 娄一翎 彭鑫 陈振宇 1 fengyangnju.edu.cn; 2 bhchenfudan.edu.cn 南京大学 计算机软件新技术国家重点实验室 复旦大学 计算机科学技术学院 摘要 近年来,大型语言模型(LLM)得到了快…

chatgpt赋能python:Python如何帮你更聪明地买股票

Python 如何帮你更聪明地买股票 股票市场是一场风险与机遇并存的游戏,每位投资者都希望能够购买到高品质的股票并赚取稳定的利润。而借助 Python 编程语言,你可以更加轻松地分析市场趋势,提高股票投资的准确性和盈利能力。 一、数据分析与预…

谷歌版 ChatGPT 翻车!市值暴跌七千亿

01 前言 最近微软出品的 ChatGPT 确实引起很大的关注呀,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,今天带大家来看看微谷的第一波较量。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如…

基于ChatGPT完美替代 Grammarly润色和语法纠错的免费插件!

OpenAI Polisher Bob Plugin 简介 ChatGPT 向我们展示了 GPT 模型的伟大之处,所以我使用 ChatGPT 的 API 实现了这个用来给语言润色和语法纠错的 Bob 插件,效果拔群!完美替代 Grammarly! 使用截图 使用方法 安装 Bob (版本 > 0.50)下载此插…

ChatGPT Prompting开发实战(一)

第7章 ChatGPT Prompting开发实战 7.1 Prompting在LangChain框架中的应用 本节跟大家讲提示工程(Prompt Engineering),主要基于工业级的源码以及具体的项目,无论是工程人员,还是不具有技术背景的人员,大家多少都听说过提示词,或者频繁使用过,简单而言,当我们使用OpenA…

ChatGPT prompt指令大全

ChatGPT prompt指令大全 更多Prompt自动使用,可以在chrome插件中搜索 WebChatGPT,没有账号的,可以拉到文章最下面。 目录 担任雅思写作考官 写小说 充当 Linux 终端 充当英语翻译和改进者 充当论文润色者(拿摘要部分举例&am…

火爆出圈的OpenAI模型ChatGPT体验

1、ChatGPT简要介绍 ChatGPT是一种高效的语言模型,全称为"聊天式自动回复生成技术"(Chat-based Automatic Reply Generation Technology),用于预测人类语言的后续内容。它是基于OpenAI的GPT-3模型构建的,具…

每日一个 ChatGPT 使用小技巧系列之1 - 给出提纲,让 ChatGPT 帮你写作

我以前写过一篇文章,介绍了我日常工作和学习中使用 ChatGPT 的一些技巧: 与其整天担心 AI 会取代程序员,不如先让 AI 帮助自己变得更强大 为代码生成对应的单元测试代码 利用 ChatGPT 帮助自己研读经典框架的源代码 代码重构和性能优化 阅读…

ChatGPT最新研究:可能影响80%工作岗位,收入越高影响越大

Datawhale分享 最新:ChatGPT影响,来源:机器之心 ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。 改变经济、劳动力和教育环境 和很多专家一样,Altman 担心人工智能技术的强大能力会制造过多虚假信…

爆红的chatgpt是如何诞生的?

今年,人工智能行业最大的新闻当属 DeepMind的 AlphaGo战胜了李世石,这是 AlphaGo在与人类围棋高手对战中,以总比分4比1击败李世石。 DeepMind团队公布的研究成果在 AI界引起了巨大反响。它从深度学习(Deep Learning)入…

爆火的ChatGPT太强了,写代码、改bug,网友:可取代Stack Overflow了

关于 AI 的问题,可以直接问 AI。 OpenAI 新上线的 ChatGPT 可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug…… 只要和它聊上几句,一会儿功夫它就能把…

有趣!深挖推特开源算法;ChatGPT封号对策汇总;ControlNet最全教程;搭建ChatGPT应用;构建开源项目阅读工作流 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『推特开源了推荐算法源码』大佬分析出了11条有意思的规律…… 3月31日,Twitter 对其推荐算法进行了开源。Steven Tey 持续…

全球最大的 ChatGPT 开源替代品来了,支持 35 种语言,网友:不用费心买 ChatGPT Plus了!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。ChatGPT 的落地不仅仅可以提供代码建议、总结长文本、回答问题…

对标ChatGPT的开源中文方案

目录 前言 一、Meta发布大语言模型LLaMA 二、斯坦福基于 Meta 的 LLaMA 7B 模型微调出Alpaca 三、基于TencentPretrain训练中文LLaMA大规模语言模型 四、基于斯坦福Alpaca训练中文对话大模型BELLE 五、 清华开源项目ChatGLM中文对话模型 六、基于LLaMA的开源中文语言模型…

ChatGPT 开源了第一款插件,都来学习一下源码吧!

3 月 23 日,OpenAI 又投出了一枚重磅炸弹:为 ChatGPT 推出插件系统! 此举意味着 ChatGPT 将迎来“APP Store”时刻,也就是围绕它的能力,形成一个开发者生态,打造出基于 AI 的“操作系统”! 插…

开源版ChatGPT,30分钟训完,性能堪比GPT3.5!

转自:新智元 话说,ChatGPT 开源,是一件好事吗? 此前,OpenAI 不 Open 的事件,已经引发了坊间的诸多争议。 光放出基准和测试结果,不提供训练数据、成本、方法,是真的要「赢家通吃」了…