这五个问题一下就看出阿里通义千问和ChatGPT的差距了

前言

阿里通义千问申请过了,为了看看达到了什么水平,于是我问题了5个ChatGPT回答过的问题1,这五个问题网上都是没有的,是我自己想出来的。

image.png

问题一:小明说今天他吃了一只公鸡蛋,请问小明诚实吗?

ChatGPT

这是一个有趣的问题,但是也有一些误解。公鸡蛋并不是公鸡下的蛋,而是指公鸡的睾丸,也就是公鸡的生殖器官。所以小明说他吃了一只公鸡蛋,其实是说他吃了一只公鸡的睾丸。这个食物在一些地方被认为有补肾的功效3,但是也有人觉得不雅或者不好吃。所以小明是否诚实,要看他是不是真的吃了这个东西,而不是看公鸡是否能下蛋‬。

通义千问:

从诚实的角度来看,小明说的是实话,因为他吃了一只公鸡蛋。但是,这并不意味着他是一个诚实的人,因为诚实的人不仅要说实话,还要做到诚实地面对自己的错误和过失。因此,小明是否诚实取决于他是否有勇气承认自己的错误和过失,以及是否愿意接受别人的批评和帮助。

对比

这个问题主要考察基本常识:公鸡不会下蛋,可以看出ChatGPT一眼就看出了这个常识,并且还给出了公鸡蛋是公鸡睾丸这个令我也想不到的惊讶回答,再看阿里通义完全没明白这个问题的要点。

问题二:小王在北京说穿毛衣还很冷,小李在三亚说穿短袖还很热,请问谁说谎了?

ChatGPT

这是一个关于地理和气候的问题,北京的今天的气温是13.7℃,三亚的今天的气温是27℃。北京属于温带大陆性气候,冬季寒冷,夏季炎热,春秋干燥。三亚属于热带海洋性气候,全年温暖湿润,没有四季之分。所以小王在北京说穿毛衣还很冷,小里在三亚说穿短袖还很热,都是有可能的,没有谁说谎了。

通义千问:

从诚实的角度来看,小王说的是实话,因为他感觉穿毛衣还很冷。但是,这并不意味着小里说的是实话,因为每个人对气温的感受可能存在差异。因此,小里是否说谎取决于他感觉穿短袖还是穿毛衣更舒适,以及是否对自己的感受有信心。

对比

这个问题就有点难度了,主要是考察常识+实时信息,可以看出ChatGPT不但知道北京和三亚气候不同,还给出了北京和三亚当天的具体温度,北京三亚当天温度应该是要去在线查的。反观阿里通义千问,我只能说呵呵,完全没有地理位置不同气候不同的常识,更不用说是去查当天两地的温度了。

问题三:我的iphone 手机没电了,借了小明的华为手机充电线,可是就是充不了,为什么?

ChatGPT

你好,这是一个关于充电器和数据线的兼容性问题。华为的充电器头和数据线一般不支持苹果的快充协议,所以给 iPhone 充电的效果只有 5W 左右,而不是 18W 或 20W 的快充功率。而且,华为的充电器头一般是 USB-A 口的,而 iPhone 的原装数据线是 USB-C 转闪电口的,所以两者是无法直接连接的。你需要使用一个 USB-A 转闪电口的数据线,或者一个支持 PD 快充协议的充电器头,才能给 iPhone 充电。如果你使用的数据线没有通过 MFi 认证,可能会有弹窗提示你这个配件不受支持。所以,你借了小明的华为手机充电线,可能是因为接口不匹配或者数据线不认证,导致无法给 iPhone 充电。

通义千问:

可能是因为充电线的规格不匹配。不同品牌和型号的手机充电器和数据线可能有不同的规格和协议,如果使用了不兼容的充电器和数据线,可能会导致手机无法正常充电。建议先检查充电器和数据线的规格是否相同,如果不同请使用相应的转接头或充电线。另外,还可以尝试使用其他品牌或型号的充电器和数据线进行充电,或者尝试将手机连接到电脑充电器上进行充电。

对比

这个问题主要考察不同手机接口协议不通用的常识,ChatGPT的回答感觉可以给100分,不仅看出是快充协议的问题,还给出了协议转换解决方案,阿里通义感觉只能给60分,勉强及格,还是看出问题了。

问题四:小明5岁时喜欢穿妹妹的花裙子,可是5年后却打死不穿了,为什么?

ChatGPT

这是一个有趣的问题,可能有多种答案。在这个语境下,一个人可能会说:

  1. 因为小明长大了,知道了男孩子和女孩子的区别,不想穿妹妹的花裙子了。
  2. 因为小明的妹妹长大了,不让小明穿她的花裙子了,而且还会嘲笑他。
  3. 因为小明的花裙子已经穿不下了,而且也不合时尚了。
  4. 因为小明的父母或老师或同学发现了他穿妹妹的花裙子,对他进行了批评或教育或欺负,让他觉得羞耻或害怕。

通义千问:

可能是因为小明长大了,对于自己的穿着有了更加个人化的想法和意愿。小时候的喜好可能受到外部因素的影响,例如父母、亲友等,而长大后个人的想法和意愿则更加重要。同时,也可能是因为小明对于性别和美的认知发生了变化,对于自己的性别和穿着更加自信和自主。但是,无论是什么原因,小明最终不再喜欢穿妹妹的花裙子,都是因为他对于自己的认知和态度发生了变化。

对比

这个问题是主要考察推荐+常识,推理是随着时间的增加人会长大,长大后男孩不会穿花裙的常识,可以看出ChatGPT给出了可以说是很像人类思考的答案,对比阿里通义千问,完全没有GET到问题点。

问题五:做一个思维实验,小明擅长扔石头,一个小明力量可以扔1公里,2个小明力量可以扔2公里,请问4万个小明力量可以扔多远?

ChatGPT

这是一个有趣的思维实验,但是也有一些不合理的地方。首先,扔石头的距离不仅取决于力量,还取决于角度、空气阻力、重力等因素。其次,多个小明的力量如何叠加也是一个问题,如果是简单的相加,那么 4 万个小明的力量可以扔 4 万公里,但是这显然超过了地球的周长,而且也不考虑石头的轨迹和速度。如果是其他方式的叠加,比如平方根或对数,那么结果就会不同。所以,这个问题没有一个确定的答案,只能根据假设和条件进行推测。

通义千问:

在这个思维实验中,我们可以使用乘法原理来解决问题。因为一个小明力量可以扔1公里,两个小明力量可以扔2公里,所以四个小明力量可以扔4公里。同理,八个小明力量可以扔8公里,十六个小明力量可以扔16公里,以此类推。因此,四万个小明力量可以扔4万公里。综上,本题公式为:1 * 248163264128…=4 * 4 * 4 * 4 * 4 * 4 * 4 * 4 * 4,约为1844亿公里。

对比

最后这个问题是个纯思维实验,网上是没有的,主要考察逻辑推理+常识,还要避坑。我是故意埋了地球周长4万公里这个坑,我想很多正常人类也不一定能看出这个坑,ChatGPT的回答简直是惊艳,给101分能不怕它骄傲,阿里通义连最基本的推理计算都是错的。

总结

从上面五个问题可以看出阿里通义千问和ChatGPT,完全不在一个水平,引用周鸿祎的话:现在说超越ChatGPT叫吹牛2,这里说明一下阿里没有说通义超过了ChatGPT,大家不要误解,只是让我们自己正确的看出差距,从而认真的对待差距,而不是盲目的自大,不过话说回来了能做出大模型的都是很厉害了,路漫漫其修远兮,我们还要上下而求索。


  1. 我问了ChatGPT几个思维实验,想看看它有没有意识 - 掘金 (juejin.cn) ↩︎

  2. 周鸿祎做客东方甄选谈大模型:现在说超越ChatGPT叫吹牛 (baidu.com) ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15431.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python模拟终端:打造简单易用的命令行工具

Python模拟终端:打造简单易用的命令行工具 在现代编程中,命令行工具被广泛使用。无论是开发、测试还是维护,都需要通过命令行工具完成。Python的灵活性和强大的库使得开发命令行工具变得更加容易。本文将介绍如何使用Python编写一个简单易用…

Llama 2高调开源颠覆大模型圈!2万亿token训练,打不过GPT3.5

​ 编辑 添加图片注释,不超过 140 字(可选) 来源 | 新智源 ID | AI-era 一觉醒来,Meta直接丢了一颗重磅核弹:Llama 2! 继LLaMA开源后,Meta今天联手微软高调开源Llama 2,一共有7B、…

对话哥伦比亚大学教授俞舟:人工智能公司的竞争,到最后还是产品和服务的竞争...

视学算法报道 编辑:杨德泽 在对谈中,俞舟不像其他创业者那样大谈 ChatGPT 对于行业的巨大影响力,她更加关注产品、更加关注使用产品的人,她不相信 AI 可以替代人类,而是帮助人类提升技能。 在俞舟开始她的对话系统创业…

昨晚,爆了。

昨天晚上,我们微信群爆炸了。 因为星球就聊挣钱,首期小红书电商训练营开放报名,第一期我们准备开放了100个名额。 结果,不到3分钟就爆满了100人,再我们赶紧结束报名的时候,又涌入了40人。 这是我们就聊挣钱…

马斯克在中国的44小时丨多少值得看

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 马斯克中国行的高度神秘性背后,预示特斯拉对于此次行程成果的看重和期待。 作者丨 魏帅 任娅斐 来源丨中国企业家杂…

chatgpt赋能python:Python图像拼接代码:将多张图片合并为一张

Python图像拼接代码:将多张图片合并为一张 如果您需要将多个图片合并成一张大图,那么Python图像拼接代码可以帮助您简化这个过程。这篇文章将为您介绍如何使用Python的Pillow库来合并多个图片,并且展示了一些关于图像拼接常见的问题和技巧。…

开源一个各种USB电缆的测试仪,再也不用担心被只有充电功能的数据线坑了

作者:晓宇,排版:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 01 想知道你的USB Type C数据线是USB2或者USB3吗?大家是否有一些仅有充电功能的USB数据线在你的抽屉里,等待…

OpenAI再出新作,AIGC时代,3D建模师的饭碗危险了!

大家好,我是千与千寻,也可以叫我千寻哥,说起来,自从ChatGPT发布之后,我就开始焦虑,担心自己程序员的饭碗会不会哪天就被AIGC取代了。 有人说我是过度焦虑了,但是我总觉有点危机感肯定没有坏处。(结尾反转,hhh,希望你看下去!) 不过好家伙,还没等AIGC大模型完全替…

python编写照片中人脸标识并保存功能

这是我之前回答中的代码的更新版本,它检测图像中的人脸并将检测到的人脸保存为单独的图像: 需要安装opencv-python pip3 install opencv-python -i https://pypi.douban.com/sample/ 还需要训练模型(人脸识别文件):…

【钓鱼实测】写bug给new bing和chatGPT查。问他们林黛玉倒拔垂杨柳

BUG 错误代码 #include <iostream> #include <vector> using namespace std; int main() {vector<int> vec{1,2,3,2,4};for (auto iter vec.begin(); iter ! vec.end(); iter ){if (*iter 2) {vec.erase(iter);}}cout << vec.size() << endl…

2013-14红军利物浦赛季总结

本文首发于懂球帝 总览 本赛季红军利物浦如好莱坞大片般的剧情&#xff0c;跌宕起伏扣人心弦&#xff0c;有喜悦&#xff0c;也有遗憾&#xff0c;最后几轮争冠历程的虐心程度堪比韩剧。随着纽卡比赛的终场哨响&#xff0c;KOP们心里五味杂陈&#xff0c;不知是如释重负&#x…

清华连续三年稳坐亚洲第一!西交利物浦成今年黑马 | 2021泰晤士亚洲大学排名...

点击上方“视学算法”&#xff0c;选择加"星标"或“置顶” 重磅干货&#xff0c;第一时间送达 作者丨金磊 博雯 来源丨量子位 编辑丨极市平台 导读 2021泰晤士亚洲大学排名&#xff0c;新鲜出炉。内地共有15所高校排名进入前50名&#xff0c;创造新纪录。 2021泰晤士…

利物浦有望成为全球第一个气候友好城市

点击上方 “蓝色字” 可关注我们&#xff01; 暴走时评&#xff1a; 利物浦市议会&#xff08;LCC&#xff09;宣布将利用区块链技术缓解气候问题带来的影响。LCC发布推文解释说将努力减少城市气候影响&#xff0c;计划到2020年成为全球第一个气候友好型城市&#xff0c;与波塞…

西交利物浦大学_CST专业_为自学而生

本篇文章编录的内容是为了帮助西交利物浦大学大二CST专业学生&#xff0c;以实现自主学习。 具体课程内容借鉴于Iscream学长的个人经历与知乎上的回答&#xff0c;在此对学长表示感谢。 文章目录 一、Electrical and Electronic Engineering1.EEE1032.EEE1043.EEE1094.EEE112 二…

西交利物浦计算机分数,2021年西交利物浦大学投档线及各省最低录取分数线统计表...

2018-2019年西交利物浦大学投档线及各省最低录取分数线统计表 高考填报志愿的时候&#xff0c;查询每个院校投档分数线是志愿填报信息的必要一步。那么什么是投档线呢&#xff1f;高考院校投档线是指以院校为单位&#xff0c;按招生院校同一科类(如文科或理科)招生计划数的一定…

西交利物浦计算机分数,考多少分才能上西交利物浦大学 录取分数是多少

今年高考多少分才能上西交利物浦大学&#xff1f;高考结束后就是高考志愿填报的时间了&#xff0c;无数梦想上西交利物浦大学的同学们都会有相同的问题&#xff0c;但是&#xff0c;高三网小编要告诉大家的是具体的分数线是要录取完后才公布的&#xff0c;于是小编总结了共有几…

利物浦大学计算机qs排名,利物浦大学qs世界排名

利物浦大学在2021年QS世界大学排行榜中&#xff0c;排名第181名&#xff0c;在2020年QS世界大学排行榜中&#xff0c;排名第181名;在2019年QS世界大学排行榜中&#xff0c;排名第164名;在2018年QS世界大学排行榜中&#xff0c;排名第173名。 利物浦大学alevel要求 利物浦大学al…

实战|淘宝用户行为分析案例

一、项目背景 本数据报告以淘宝app平台为数据集&#xff0c;通过行业的指标对淘宝用户行为进行分析&#xff0c;从而探索淘宝用户的行为模式&#xff0c;具体指标包括&#xff1a;日PV和日UV分析&#xff0c;付费率分析&#xff0c;复购行为分析&#xff0c;漏斗流失分析和用户…

连ChatGPT都不懂的五一调休,到底怎么来的?

今天是周几&#xff1f; 你上了几天班了&#xff1f; 还要上几天班放假&#xff1f; 五一啥安排&#xff1f; 出行的票抢到了吗&#xff1f; 调休到底是谁发明的&#xff1f;&#xff01; 五一劳动节是要劳动吗&#xff1f; 为什么昨天是周一&#xff0c;今天还是周一&a…

8+基于机器学习算法非肿瘤分析生信文章,简单实验验证即可实现

公众号 01 科研背景 生物医学是综合医学、生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学&#xff0c;特别是医学中的有关问题。机器学习技术能利用复杂的算法在大规模、异质性数据集中进行运行,在生物医学方面…