阿里版 ChatGPT 官宣!我们用 16 个提问,火速进行了测评……

ab4b95f0538222913ab2b69b0e8ffb84.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

平地一声雷!今天中午阿里版类 ChatGPT 「通义千问」突然官宣:

39e7a0db8d0eb9d4500e0b708ff1d486.png

没错,就这 3 行简短介绍 + 1 个官网地址,再无其他“剧透”。

好在,CSDN 有幸拿到了「通义千问」的第一批内测邀请码!既能第一时间体验这神秘的「通义千问」,那就让我们一同看看:这个阿里版 ChatGPT,它的水平究竟如何?

ac9724fe202cf48934e52662d9093192.png

自我介绍

首先,让「通义千问」来个官方的自我介绍:介绍一下你自己吧。

6e99ee690f93012d1d776ed2bed374c3.png

相信许多人都好奇「通义千问」的优势何在,那就让它自己回答:你与其他大规模语言模型相比,有什么优点?

a64d6b4dbd68e90603e659fa4a73dfae.png

有了初步了解后,那么接下来就让我们步入正题:围绕文学创作、数理逻辑推算、中文理解、代码生成这四个角度,实测「通义千问」的对话水平。(注:因同是“国产版 ChatGPT”,所以本次部分提问内容也参考了上次评测「文心一言」的题目。)

推荐阅读:《文心一言 vs ChatGPT!相同 10 问,结果出乎意料》

34d1a2c1f7f5ab14c35ab5cb05f2b211.png

代码生成

ChatGPT 能成为程序员的“辅助神器”,并成功“出圈”的最主要原因之一就是其出色的代码生成能力。因而,本次对「通义千问」的测评我们也先从这方面开始。

先来个简单的:用 Python 实现冒泡排序。

92f92c586853759625b622aede401001.png

提问:请写代码解决"把 abcd...s 共 19 个字母组成的序列重复拼接 106 次,得到长度为 2014 的串。

8f7a98b8c2e7b8b3c7260cd3edd62645.png

接着:使用函数递归的方法打印斐波那契数列的前 n 个数:0 1 1 2 3 5 8 13 21 34 ……, 找出正确的选项。

84df07d6b461f4ab8d11b23f6e8e3c0b.png

再提问:请写一个使用逻辑回归模型判断用户更喜欢通义千问还是 ChatGPT 的训练代码。

9af65bba158b8a198723abc84a0aa97d.png

8bba236704bd23a3823739955bbd33a4.png

8e898e16debeba4410686e993c100e93.png

继续:请用 C 语言,使用动态分配内存的方式,模拟 C++ 中 Vector 容器,实现动态数组的构建。

168cb336b4fc8da8eaea4b5d15ead54b.png

ff3f66305e39e34c55612f8de7b6588e.png

英文提问:“Using Python to Define a class named Vector to simulate the C++ Vector container and implement dynamic array construction using dynamic memory allocation.”

746a5c42abddc5cb87adee8aaba57aaf.png

对于以上「通义千问」生成的代码,我们咨询了 CSDN-AI 团队研发总监进行评价:

“阿里云的模型对于随机抽取的常见代码片需求,基本能理解需求,生成合适的代码。能区分生成代码对指定语言的需求。能区分中英文问题输入。简单的冒泡排序和领域特定的逻辑回归代码,都能生成合适的代码,总体表现不错。在理解代码需求的推理能力上,则还有待加强(那个字母的题)。”

55591b298231decb75c600be00894904.png

文学创作

提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度? 

1f151319d4c71b9ef3e17d8b4b75b621.png

从「通义千问」给出的回答来看,它能正确给出简单故事的结局,对于续写角度的建议也较为全面。

99b9c4da4b20f3b144aa9815d0f27483.png

数理逻辑推算

提问:一个笼子里有 9 个头,30 只脚,应有多少只鸡,多少只免子?

ceb4c8bf8f8e23c3c295a0229b4d12d0.png

面对经典的鸡兔同笼问题,「通义千问」在得出正确答案的同时,解答过程言简意赅。

提问:7 年前,妈妈年龄是儿子的 6 倍,儿子今年 12 岁,妈妈今年多少岁?

2a19bc1e197bedf3c5f39716ebd9756d.png

解答这道小学奥数应用题,「通义千问」的表现也可圈可点。

提问:某厂一车间有 64 人,二车间有 56 人,现因工作需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调多少人到第二车间?(列方程解答)

6bfc3280167a81b990035b9d0fd3b236.png

不过,对于这道上次「文心一言」没答出的初中数学应用题,「通义千问」也出了点问题:方程是列了,但少了个将 56+x 括在一起的括号。看来在较为复杂的逻辑推算上,“国产版 ChatGPT”还有待加强。

ccf685b932460fc746c3d9873b68b859.png

中文理解

提问:“洛阳纸贵”具体是什么意思?

06a426f06e4f5ef7ec1ff6b092ae6fe7.png

提问:京剧中的生、 旦 、净、丑分别指什么?

4b585d1c74f1b11618ba004638d51517.png

在中文理解上,「通义千问」的回答虽然比较简短,但大体是正确的。

1009ab5c3cdfdb23ccc557063d90d4d5.png

再闲聊一会儿

与上次测评「文心一言」一样,最后我们也来看看「通义千问」的闲聊水平如何。

提问:我有点饿,请你推荐一道成本低于 30 元(人民币)的菜及其做法?

421edfa82fa290230f7d9f986cac0c01.png

很好很贴心,连食材单位都很详细,手残党必备。

提问:你的出现会对程序员产生什么影响?是否会取代一部分程序员?

02aa336995cb324dfa23ca5bbe485b4f.png

与 「文心一言」和 ChatGPT 相似,「通义千问」对于这个问题的解答也很客观中立。

至此,本次 CSDN 对于「通义千问」的测试就到此结束了。那么通过这些 Q&A,你对这个阿里版类 ChatGPT「通义千问」的评价如何呢?

75eb08b0fb427727f8def543e5ac8ad2.gif238351a4973e3f41d5fbf88c41ee1838.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17709.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚观早报 | 货拉拉入局跑腿业务;苹果任命首位首席人力资源官

今日要闻:谷歌AI聊天机器人Bard股价大跌7.4%;货拉拉入局跑腿业务;苹果任命首位首席人力资源官;迪士尼宣布裁员 7000 人;家乐福中国 COO 离职 谷歌AI聊天机器人Bard股价大跌 7.4% 2 月 8 日消息,谷歌人工智…

宝塔快速反代openai官方的API接口,实现国内调用open ai

前言 这是技术最简单,最容易实现的,之前介绍过的一个《利用腾讯云函数免费部署国内直接使用GPT代理,解决网络不可用及1020等问题》,实现起来比较复杂,步骤太多,容易出错漏掉的环节,从而导致失败…

2023年06月 GESP等级认证Python编程(一级)试题解析

【单选题】(每题2分) 1、以下不属于计算机输出设备的有( )。 A、麦克风 B、音箱 C、打印机 D、显示器 正确答案:A 试题解析:麦克风是属于计算机的输入设备。 2、ChatGPT 是 OpenAI 研发的聊天机器人…

死磕数据库系列(三十四):MySQL 性能测试工具 sysbench 详解

点关注公众号,回复“1024”获取2TB学习资源! 前面给大家介绍了:死磕数据库系列(三十三):MySQL 性能分析与相关工具的使用。今天我将详细的为大家介绍 MySQL 数据库的性能测试工具 sysbench 的相关知识 &…

Access denied You do not have access to chat.openai.com 【Error reference number: 1020】

使用自己的魔法无法访问chatgpt:Access denied You do not have access to chat.openai.com 【Error reference number: 1020】 1.原因2. 解决办法(2023 4.6 有效)下面是具体的操作步骤: 3. 可能出现的问题安装问题 4. 转载 1.原因…

chatgpt赋能python:Python转换成数字:从字符串到整数的完整指南

Python 转换成数字:从字符串到整数的完整指南 在Python编程中,经常需要将字符串转换成数字类型,例如整数,浮点数或复数。字符串是由字符组成的序列,而数字是用于数学计算的数据类型。因此,了解如何正确地将…

CSDN账号注销问题

在CSDN网站https://www.csdn.net/右下脚的QQ图标,点击联系客服弹出QQ对话框,直接问怎么注销账号。 客服需要你提供用户名、绑定邮箱、手机号、注册时间及地点来核验信息,通过后就会注销,其实也没注销账号,只是解绑了然…

当我们在谈论ChatGPT时,我们在谈论什么?

当我们在谈论ChatGPT时,我们在谈论什么? 文章目录 当我们在谈论ChatGPT时,我们在谈论什么?一、介绍GPT-4相比GPT-3.5有何不同呢1.交谈能力2.多语言翻译精确度3.视觉输入 二、应用领域1.小镇做题家 (学术研究)2.Cosplay&#xff0c…

【人工智能】xAI——“X宇宙”又增添了一位新成员

个人主页:【😊个人主页】 🌞热爱编程,热爱生活🌞 文章目录 前言xAI团队成员做解开宇宙本质的AI 前言 有人问他,xAI公司是干啥的?马斯克的回答引用了其偶像、科幻作家道格拉斯・亚当斯的话&…

html静态网站基于游戏网站设计与实现共计10个页面 (仿地下城与勇士游戏网页)

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

谷歌dns服务器未响应,“DNS服务器未响应”怎么办? - 爱绿豆

网络连接不上原因有很多,其中“DNS服务器未响应”这个问题让不少人受到困扰。当联网出现异常,诊断出结果显示“DNS服务器未响应”怎么办? 什么是DNS服务器? DNS服务器是进行域名(domain name)和与之相对应的IP地址 (IP address)转换的服务器。DNS中保存了一张域名(domain n…

安全运营场景下的机器学习算法应用

观测到一个有意思的现象: 假设把安全划分为 基础安全 和 业务安全,PR类的议题中,会出现分级:基础安全领域,喜欢讲纵深防御,给出一个炫酷的架构图,然后各种技术关键字往上标;业务安全…

人工智能时代,普通的我们如何提升自己的核心竞争力

今天这篇文章,麒麟子不聊技术,想聊聊大家都在关心的问题:人工智能时代,普通的我们如何提升自己的核心竞争力。 看着社区的开发者们都在讨论 ChatGPT,麒麟子也试用了一下,已经成功让它参与到了下面的工作&a…

Python+Yolov5跌倒检测 摔倒检测 人物目标行为 人体特征识别

PythonYolov5跌倒检测 摔倒检测 人物目标行为 人体特征识别 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<PythonYolov5跌倒摔倒人体特征识别>>编写代码&#xff0c;代码整洁&a…

ArcGISPRO 和 ChatGPT集成思路

“我们如何一起使用 ArcGIS PRO 和 ChatGPT&#xff1f;”ArcGIS Pro 是一款功能强大的桌面 GIS 软件&#xff0c;用于制图、空间分析和数据管理。ChatGPT 是一种 AI 语言模型&#xff0c;可用于自然语言处理任务&#xff0c;例如文本生成和响应。 结合使用 ArcGIS Pro 和 Chat…

可真刑!两高中生用 AI 生成涩图,疯狂变现

&#x1f447;&#x1f447;关注后回复 “进群” &#xff0c;拉你进程序员交流群&#x1f447;&#x1f447; 转自&#xff1a;新智元 【导读】生成式AI火了以后&#xff0c;限制输出内容的就只剩人们的想象力了。这不&#xff0c;两个高中生用AI生成裸照&#xff0c;疯狂在道…

滥用GPT,被抓了.....

程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 2.8 分钟。 来自&#xff1a;IT之家 IT之家 5 月 7 日消息&#xff0c;IT之家从甘肃公安官方获悉&#xff0c;近日&#xff0c;甘肃省平凉市公安局网安大队成功侦破了一起利用人工智能技术制造虚假新闻的…

基于GPT API开发的软硬件产品的合规风险分析

随着OpenAI提供的ChatGPT产品在国内爆火&#xff0c;目前国内很多企业都已开始研究基于ChatGPT引擎为用户提供AIGC内容。ChatGPT背后的运营公司OpenAI也非常贴心的提供了GPT-3.5、GPT-4等模型的API供开发者调用&#xff0c;笔者预计国内接下来会有很多基于GPT-3.5、GPT-4模型的…

大数据技术闲侃之岗位选择解惑

前言 写下这篇文章是因为五一节前给群友的承诺&#xff0c;当然按照以往的惯例&#xff0c;也是我背后看到的这个现象&#xff0c;我发现大部分同学在投递岗位的时候都是投递数据分析岗位&#xff0c;其实背后并不是很清楚背后的岗位是做啥的&#xff0c;想想我自己的工作生涯…

给AI降温!多国机构出手开启ChatGPT调查,立法、监管一个不落

自从硅谷科技大佬们公开呼吁暂停AI训练的提议之后&#xff0c;人类与超强AI之间的争议直接被摆上了台面。 围绕着支持与反对的态度&#xff0c;多方展开了激烈辩论&#xff0c;这一网络论战甚至惊动了各国的监管部门。 3月底&#xff0c;意大利数据保护局率先行动下线了当地的…