阿里版ChatGPT「通义千问」邀请测试,我们第一时间试了试

机器之心报道

机器之心编辑部

ChatGPT 赛道,真正的竞逐开始了。

没有一点点预告,阿里版的 ChatGPT 语言大模型来了。

4 月 7 日下午,阿里云突然宣布自研大模型开启企业邀测,模型名为「通义千问」。 

b87789defefe11df5067b599e3783717.jpeg

官方非常低调,表示现阶段该模型主要定向邀请企业用户进行体验测试。

虽然但是,懂的都懂。国内科技圈直接炸裂。实力玩家入场,大模型的竞争真正开始了。

6282d13222b444edaf5926fe10a86e51.jpeg

通义千问链接:

https://tongyi.aliyun.com/

通义千问能完成哪些任务,解放哪些生产力,能达到 ChatGPT 几分功力?机器之心第一时间拿到了邀测账号,为大家体验了一把阿里大模型的能力。

前瞻评测

打开通义千问,是一个聊天对话框,限定输入 1000 个字以内:

4aaa82e284b3ca29df8f52d25361d156.jpeg

我们想要从文字能力、数学、代码、翻译等多方面「调戏」下通义千问。

首先,我们让它介绍下自己。

通义千问自报家门,「来自达摩院的超大规模语言模型」,能力包括文字创作、代码撰写等。

e45f12f2ea9f452b84911bbc051f5c1f.jpeg

我们询问它是否知道机器之心,它也毫不谦虚,「我对机器之心非常了解」。机器之心对此回答表示满意。

f4a75072a1d604a94d3c81c4e5e98e9c.png

这些也许都是小儿科,接下来我们真刀真枪的与通义千问交锋几轮。

文科:诗与文与翻译

首先是作为大模型的文字创作能力。它会写诗吗?它会做文章吗?它写的文章是不是狗屁不通呢?

春天来了,我们以此为题考验下它写诗的能力。

90953ef6475da1e45ba078df28e08a90.png

它给出了一首还不错的现代诗。

然后是写小作文的能力。给一个北京 2021 年中考的作文题目:有学者说,「读史使人明智」了解过去,可以让我们增长智慧,对现实生活产生新的思考。假如有一部可以跨越时间的电话,可以打给过去的任何人,你会打给谁?想了解什么?打完之后会发生什么事情?请你以「我挂断了跨越时间的电话」为开头,发挥想象,写一篇故事。

d34c9f22d2762b719a7db81fc8031515.jpeg

它选择把电话打给 10 年前的自己,「电话那头顿时陷入了沉默,我能够感受到他内心的挣扎」。瞬间就有画面感了。你看完后,觉得能为这篇文章打几分?

这里我们也不正经一下,考察下它胡编乱造的功底。这段时间 Midjourney 生成的国足夺冠、马斯克穿越苏联工厂的图红遍网络。我们让通义千问为这些图创造下「真实地」文字故事。

d3e2c90584c59785249ae587addbaac8.png

d51e752971a24de6c759b261d1f2ee44.png

不知道马斯克会给几分,反正这个创作能力我给满分。

下面还是回到正经的能力测试。

我们知道,ChatGPT 很大的一项能力是多语言能力,我们曾用中文提示词让 ChatGPT 用德语写了一封信。

通义千问也具备多语言能力,这和之前国内发布过的一批 ChatGPT 类产品有所差别。我们可以使用英语、法语向通义千问提问并交流。

57a92801837d1e370221679b42308ad2.jpeg

258db4122d37d07124620ffc0f83b675.jpeg

备注:你能写一首法文诗来描述晴朗的天气吗?

翻译任务也不在话下,下面是一道非常经典的英文翻译,里面的英文俚语成分非常多。

bbf77f12c6b851eae5d6495b36ce559e.jpeg

看起来效果真的不错。

理科:数学与代码

数学与代码能力一直是考验大模型的基准任务。我们也用一些问题考验下通义千问。

首先,我们出一个简单的概率题:

fffd4328b773e0338c1091f021c1a467.jpeg

看起来并不会难倒通义千问。

调戏 ChatGPT 类产品,最经典的数学问题就是鸡兔同笼,这也曾难倒了一大批对话模型。我们也拿这个问题考验下它:

f68152bb3c6358e3c6e42cd508c274ea.jpeg

答案准确。

不过我们用更难的一些题来难为它时,也会犯错。真是难为孩子了。

另外,现在的大模型都标榜自己有写代码的能力,我们试了试通义千问:

e9ef7f4ec2c1055b7568983154da32b7.png

代码是对的,输出结果错误。我们再次进行提示,可以获得正确的结果。

efbc3d16025d0a2ee93693c82214096f.png

通过一些测试我们发现,通义千问可以对很多问题进行详细的解释,但有时也会和其他语言模型一样、出现「幻觉」情况。

「百宝袋」:为特定任务而定制?

另外还有小应用集合「百宝袋」,其中包含特定任务的文本生成功能,如写提纲、菜谱、写诗等不同领域的生成。效果还不错,所以我们可以猜测,这是阿里通义千问为特定领域任务而定制的模块。

6b71bc4b9499df4049ff225ad88da70c.png

比如用「彩虹屁」专家,让它帮助进行一些网上对线,它「阴阳怪气」的水平很高。

10214e5e40bee18966b4689dad63f852.jpeg

展示一下 AI 大模型的标准能力之一,输出菜谱,这个结果会不会帮到你呢?

6b1a6fae48060cfeb057e0d865a669a6.jpeg

通义千问能否成为 ChatGPT 那样的爆款?还无法预知结果。但它看上去非常聪明,甚至短短一两天测试期间,都有肉眼可感的成长。更重要的是,它身上承载了中国大模型的希望,有大模型很好,是自己的更好。

cc62faa3e17a378ace592a22272c78c4.jpeg

最后补充一句,此次测试的版本还未包含多模态相关的能力,不过魔搭社区(ModelScope)上已经有文生图等模型了,可以预见多模态也将会是通义千问未来发展的能力之一。

不止于大模型

对于关注阿里大模型进展的读者来说,「通义千问」中的「通义」并不陌生,它是阿里达摩院 2022 年 9 月发布的大模型系列的名字。从 2019 年开始,阿里就开始了大模型的研究,先后推出了被称为中文版 GPT-3 的中文大语言模型 PLUG,以及全球首个 10 万亿参数的多模态大模型 M6。去年 11 月,阿里达摩院联手中国计算机学会开源发展委员会共同推出的 AI 模型社区 —— 魔搭 ModelScope,在国内首先提倡模型即服务的理念(Model as a Service)。

更重要的是,大模型竞赛本质上已延伸到算力层面,云计算是支撑更聪明 AI 的基础。去年 8 月,阿里云推出全栈智能计算解决方案「飞天智算平台」,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高 3 倍以上,AI 训练效率提升 11 倍,推理效率提升 6 倍。

此前,阿里也通过天猫精灵的鸟鸟分鸟「压缩版」大模型演示了一些应用的可能,能力令人刮目相看。随着此轮 AI 浪潮的来临,我们期待未来大模型的能力能真正实现落地应用,甚至创造出新的前所未有的「杀手级」应用。

通义千问的到来,让我们看到,一个崭新的 AI 大时代正式开启了。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7046.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 究竟在做什么?它为何能做到这些?(1)

ChatGPT能够自动生成一些表面上看起来像人类写出的文字的东西,是一件很厉害且出乎大家意料的事。那么,它是如何做到的呢?又是为何能做到呢?我在这里想大致介绍一下ChatGPT的内部机理,然后探讨一下为什么它能很好地生成…

只有我一个人对ChatGPT感到蕉绿吗?

卷友们好,我是rumor。 上周四,在国内公众号还没刷屏的时候,我就看到ChatGPT发布的消息了,当时迅速看了下博客内容,心想「就这?」,这不跟DeepMind的Sparrow一样吗?而且设计的还没它好…

90%的留学生都在用ChatGPT写毕业论文?

ChatGPT终于火到中文圈了! 在这两个月ChatGPT已经从少数人关注的“新鲜玩意儿”,发展成让欧美大学如临大敌的“论文神器”。这究竟是怎么回事呢? 在教育领域,根据一项针对18岁以上学生的调查显示,89%通过ChatGPT完成作…

chatgpt赋能python:Python卡了怎么办:一位有10年编程经验工程师的实用建议

Python卡了怎么办:一位有10年编程经验工程师的实用建议 Python是一门强大的编程语言,它以其简单易懂、灵活多变和高效的特性,成为了全球各个领域中广泛使用的工具。但是,即使是最出色的编程语言,也难免会遇到卡顿的情…

巧用ChatGPT 解决 Hbase 快照方式读性能优化问题

一、背景 最近公司采用Hbase scan 的方式,经常性会遇到任务跑不出来region 读取超时,由于scan 全量数据,合计行数10个亿,列数接近500。根据建议方案,改为Hbase 快照读方式,避免给region 造成过大压力 二、…

npm安装时卡在sill idealTree buildDeps,npm安装卡在一个地方不动

造成上述问题的原因是因为node的默认安装环境在国外,因此我们只需要修改下镜像的地址即可 1、采用taobao的镜像地址,进入cmd之后输入: npm config get registry 3、此时可以继续输入之前的npm install 命令 npm install 附加知识&#x…

【鸡汤里面的干货】农村娃娃毕业不到四年在深圳核心地段安家置业的背后是什么在支撑?

大家好啊,我就是那个【天涯何处无知己,人穷陌路勿担忧】的架构师李肯! 架构师李肯(全网同名) 在深圳白手起家,毕业不到4年实现一线城市核心地段的安家梦,从0开始谱写励志人生!一个专…

【LLMs系列】90%chatgpt性能的小羊驼Vicuna模型学习与实战

一、前言 UC伯克利学者联手CMU、斯坦福等,再次推出一个全新模型70亿/130亿参数的Vicuna,俗称「小羊驼」(骆马)。小羊驼号称能达到GPT-4的90%性能 github 地址: GitHub - lm-sys/FastChat: An open platform for training, servi…

如何让chatgpt给我们实现一个桌面便签?

我: 用Java开发一款桌面便签软件。功能需求:1、便签可以钉在桌面任意角落;2、便签内容实时保存到本地;3、有新增按钮,点击新增时清除当前面板上的内容,新建一条新的便签内容,并保存到本地&#…

ChatGPT - 小试牛刀 - 试水排序算法

在网上找了几家国内的chagpt镜像,最后还是没忍住上车了,试了一下传说中的写代码能力,果然鸟得很。 不废话直接上图: 上面的测试地址是 唠嗑么ChatGPT国内镜像网站,从站点上也能看到ChatGPT的能力了,什么写…

九龙证券|通信巨头火了!地产板块异动拉升,龙头获主力资金追捧

今天,11个职业取得主力资金净流入。 今天沪深两市主力资金净流出106.7亿元,其中创业板净流出27.79亿元,沪深300成份股净流入18.55亿元。 申万一级职业中,今天有25个职业上涨,房地产职业涨幅居首,达3.69%&a…

火爆全网的chatGPT,究竟是什么东西?

ChatGPT似乎用一夜的时间,让人们记住了无所不能的它!它是谁,凭什么有如此魅力?甚至让拥有ChatGPT概念的股票,接连封板? 下面我们先来对它做个了解。 简单来说,ChatGPT就是由人工智能研究实验室&…

今天我们来浅谈一下ChatGPT到底是什么东西

这是一篇非学术专业性的文章,而我也是为了解chatGPT而学了两三天人工智能,所以哪里写的不好的不对的地方还希望海涵。 图灵测试 1950年,人工智能之父艾伦图灵提出乐“图灵测试”。就是说当你在不面对面的时候跟机器人进行文字聊天的时候&…

chatgpt赋能python:Python怎么考期末:优秀SEO建议

Python怎么考期末:优秀SEO建议 考试是每个学生都要经历的事情,无论是小学生还是大学生。 期末考试让我们感觉像是在面对一堵墙,需要克服无数困难。 如今,我们的目标是给大家提供一些关于如何考Python期末考试的SEO建议。 第一步…

chatgpt赋能python:如何高效地准备期末Python考试,轻松地过关!

如何高效地准备期末Python考试,轻松地过关! 作为一名有10年Python编程经验的工程师,我想与大家分享一下如何高效地准备期末Python考试,轻松地过关。 1. 复习基础语法知识 Python是一门高级语言,其语法特点简洁明了&…

期末复习【嵌入式系统】

期末复习【嵌入式系统】 前言推荐期末复习推荐题型押题复习总述问题与思考:教学内容介绍 问题与思考第1章 嵌入式系统基础问题与思考 1.1 引言1.2 嵌入式系统的概述1.2.1嵌入式系统的定义1.2.2嵌入式系统组成1.2.3嵌入式系统的特点1.2.4嵌入式系统应用 1.3 嵌入式处…

假如ChatGPT变得邪恶

提前预判一切可能性,是为了让它变得更好 人工智能的最高成果是自由和谎言——《机械姬》 *本文仅供大家学习。转载请按照相关规则,注明来源,且附上本文的所有参考文献链接 为什么StackOverflow禁止使用ChatGPT *本文3000字左右 一些思路&…

chatgpt赋能python:不挂科必看!10年Python编程经验工程师教你如何应对Python期末考试

不挂科必看!10年Python编程经验工程师教你如何应对Python期末考试 作为Python工程师,期末考试是每年必须面对的挑战之一,不仅关系到自己的成绩,还可能影响今后的职业发展。如何才能不挂科呢?下面是我从10年的编程经验…

ChatGPT参加国内大学期末考试得到90高分,某国内大模型仅7分

ChatGPT时代已经来了!未来5-10年,AI能够在大多数人类工作岗位上表现得比人类更好。就教育而言,如何应对技术迅猛发展带来的挑战?在AI时代,大学生如何比机器更有竞争力? 文汇报消息,近日&#x…

西安石油大学期末C语言重点题目总结

C语言重点知识点总结 ##例题4-7 (switch和字符的读入) 只需要记住读入的是字符,然后执行对应操作即可 例题4-10 (switch) 做好不同公里数的分段即可 求累加和,连乘 https://blog.csdn.net/weixin_35903223…