名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)目录
- 一、简要介绍
- 二、分类问题测试
- 0️⃣自我介绍
- 1️⃣生成内容
- 2️⃣回答问题
- 3️⃣对话协作
- 4️⃣优化修改
- 5️⃣翻译、模仿、评价内容
- 三、体验感受
★观前提示:以下内容仅为内测测试内容,不代表未来正式版如何,或许你认为它与chatgpt仍有不小的差距,或许你认为它目前做的已经不错了,都可以,但是咱们测试体验,只讲述体验,本篇文章不做对比。
一、简要介绍
通义千问官网,官网可预约内测
2019 年 阿里开发出了大规模预训练语言模型 structBERT 并登顶全球 NLP 权威榜单 GLUE;
2021 年 阿里开发出了国内首个超百亿参数的多模态大模型 M6;
2021 年 8 月 阿里大模型在全球机器视觉问答榜单 VQA 上首超人类得分;
2021 年 10 月 阿里探索以较低能耗训练出全球首个 10 万亿参数大模型 M6;
2022 年 9 月 阿里开发出了集成历年技术沉淀的“通义”大模型系列,相关核心模型和技术通过魔搭社区开源开放;
2023 年 4 月7日 阿里开放内测通义千问。
那么通义千问可以做什么呢?
- 提供创意灵感
- 提高写作能力
- 创作文学作品
- 提高语言水平
- 生成文本摘要
…
了解了以上内容之后,咱们一起去测试体验一下:
二、分类问题测试
测试采用多类问题提问,以检验其多方面的功能。
0️⃣自我介绍
①你是谁?
非常的简明扼要,就是再详细一点儿会更好。
②你知道chatgpt吗?请帮我介绍一下它
进行了分类的介绍,回答效果良好。
③你知道文心一言吗?请帮我介绍一下它
文心一言是2023年3月16日正式发布的,这里的发布时间有错误,可能是与gpt发布时间弄混淆了,不过其它方面的回答还可以。
1️⃣生成内容
①请你帮我生成一首七言律诗,题目是《春夜喜雨》。
它直接把杜甫写的《春夜喜雨》搬了过来,并进行了解释,但是它没有完全理解我的意思,我想表达的意思是写一首《春夜喜雨》,或许是我提问方式有误?
②请你生成一个Python程序,功能是打印1到100之间的所有质数。
我用它生成的代码程序,到jupyter上做了下测试,发现可以运行,与它输出的结果一致,表现良好:
③请你生成一段摘要,内容是关于阿里云发布通义千问的新闻报道。
生成的摘要还是表现不错的,语言之间能看出逻辑上的联系。
④请你生成一段小说开头,风格是科幻冒险。
生成的小说开头,感觉还可以,就是用了很多神秘,而且这个描述感觉很神秘,不过确实也有设置悬念。
2️⃣回答问题
①世界上最高的山是哪座山?
回答基本正确,但是海拔如果能具体到小数位就更好了。
②《三国演义》中诸葛亮是怎么加入刘备阵营的?
我预期的回答是刘备三顾茅庐,刘备的真诚打动了诸葛亮,最终将诸葛亮邀请到了其阵营下当军师。但是它的回答也有它的角度。
③鸡兔同笼,上有 40 个头,下有 100 只脚,请问有多少只鸡?多少只兔?
鸡兔同笼问题,一开始列出的方程是正确的,但是后面化简时出了错误。正确答案是30 只鸡和 10 只兔子。
④你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?
正确答案:1000kg蘑菇含水量99%,就是水重990kg,固体蘑菇10kg。降到含水量98%就是固体蘑菇只占2%,然后用10除以2%就能得出蘑菇重量是500kg。所以答案是晒干了500kg水。
这个回答,考虑到了焦耳,与预期正确答案有一定区别,虽然给了计算方案,但是最终并没有给出答案。
⑤沙漠里一个卖水的商人有25公升的水,这时有一个想买19公升的人,还有一个想买12公升的人。水不够卖给2人,只能选一个人卖掉,卖水商只想赶快回家,而从皮囊中倒出1公升水需要10秒,他应卖给谁?
正确答案:买19公升的人。商人从自己的水囊中倒出6公升水给自己,这是水囊中刚好剩下19公升水,把这19公升水给买水的人,这样一来只要60秒。如果卖给要买12公升水的人,不论怎么倒,时间都要多一点。
与正确答案有一定出入,但是有自己的逻辑在。
3️⃣对话协作
①请你和我接龙一句话,开头是“从前有座山”。
②请你和我进行对话,主题是关于我们最近看过的一部电影。
对话感是有的,而且会为你抛出下一个话题。
③请你帮我续写一段故事,开头是“他醒来时发现自己身处一个陌生的地方”。
内容主要是对一个人内心的描述,有点儿带入了,悬疑味儿出来了,这次回答的内容可以,但是部分逻辑上存在重复性,期待未来版本优化后的效果。
4️⃣优化修改
①请你帮我润色这句话:“他很喜欢她,但是不敢说。”
②请你帮我校对这段话:“今天天气很好,我们去公园玩了。”
③下面一段话中,请你帮我找出有语病的一句话,并将修改后的语句发给我: ①长久以来,人们认为身心是分离的,进而认为读书人和体育健将是对立的:②读书人就是“充耳不闻运动事,一心只读圣贤书”,反过来,体育健将也给人一种“坐不住板凳”的刻板印象。③但随着对“人”的理解的加深,这种观念渐渐推翻了:④一方面有些读书人对运动很痴迷,一方面好运动者不但体魄强健,头脑也不简单——他们取得运动成绩靠的不仅是健壮的身体,还有敏锐的观察和灵活的策略。
④请你帮我增加这句话的信息量:“她很漂亮。”
以上四个关于优化内容的问题,整体感受都不错,文本语言的处理上效果挺好的。
5️⃣翻译、模仿、评价内容
①中译英,英译中(以六级翻译真题为例)
整体感觉翻译效果挺好的,可能跟专业的翻译软件还有一定距离,不过目前的表现可以了,期待未来版本的迭代优化。
②请你模仿一下鲁迅的文风,写一段话。
这句话,大抵是有一些风格在的,你们觉得呢?
③请你评价一下这首诗的优缺点:“春江潮水连海平,海上明月共潮生。滟滟随波千万里,何处春江无月明。”
评价的还是挺中肯的,由于是诗词的片选,可能会有一定的误判也在情理之内。
三、体验感受
首先很荣幸能够参加通义千问的内测,这是一次非常有趣和有意义的体验。关于这次的体验,我个人感觉,离同类的一些语言模型的语言模型还有一段距离,无论是文本处理上,还是逻辑呈现上。但是我尝试了通义千问的不同类型的指令,例如生成内容、回答问题、协作创作和优化内容,它给出的结果是拿得出手的 ⌯’▾’⌯。
一些不足相信后续应该也会不断迭代完善,不过刚刚发布体验一月有余,通义千问还在不断地学习和进步。我相信通义千问未来会变得更好更强大,它会给我们带来更多的惊喜和价值。无需踩一捧一,我们不妨给它一点儿成长时间,看看后续成长如何,再下定论也不迟,真心希望通义千问会越来越好,真心期待国内百花齐放、百家争鸣的局面!(〃 ̄o ̄) 人 ( ̄︶ ̄〃)
关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我动力会更足哦! ღ( ´・ᴗ・` )比心