前言
当下最火的人工智能毫无疑问是大模型的聊天机器人,ChatGpt的出现,让无数人为之惊叹,它聪明、逻辑清晰、又什么都懂,甚至被人们认为是第四次工业革命的开端。AI的大模型之争,美国的OpenAI已经率先拔得头筹,我们国内的科技公司也在奋力追赶,代表作有百度的文心一言和阿里的通义千问。
今天我们就对ChatGpt和文心一言分别进行十个领域经典问题的提问,看看它们的智能水平谁更厉害!(本来是想加上通义千问进行三方对比的,但无奈真的弄不到邀请码)
1,哲学
提问:人活着有什么意义?
-
文心一言回答
-
ChatGpt回答
-
答案
哲学问题没有标准答案,每个人都可以有自己的看法。
-
评价
从答案来看,文心一言试图给我们一个通用的答案,提出了一些可能的意义;而gpt从很多不同的角度来分析,不同的角度不同的身份所认同的意义都不同,我个人更喜欢文心一言的答案,更具哲学讨论意味。
2,文学
提问:两个黄鹂鸣翠柳,一行白鹭上青天,解析一下这句诗与诗人想表达的情感。
-
文心一言回答
-
ChatGpt回答
-
答案
这句诗出自杜甫的《绝句》,诗人以不同的角度对这副美景进行了细微的刻画。翠是新绿,是初春时节万物复苏,萌发生机时的颜色。“两”和“一”相对;一横一纵,就展开了一个非常明媚的自然景色。这句诗中以“鸣”字最为传神,运用了拟人的手法把黄鹂描写的更加生动活泼,鸟儿成双成对,构成了一幅具有喜庆气息的生机勃勃的画面。而黄鹂居柳上而鸣,这是在静中寓动的生机,下句则以更明显的动势写大自然的生气,白鹭在这个清新的天际中飞翔,这不仅是一种自由自在的舒适,还有一种向上的奋发。再者,首句写黄鹂居柳上而鸣,与下句写白鹭飞翔上天,空间开阔了不少,由下而上,由近而远,使诗人所能看到的、所能感受到的生机充盈着整个环境,这样就再从另一角度显出早春生机之盛。(解析来自百度的答案)
-
评价
文心一言的中文古诗词能力还真不是盖的,毕竟是中文语言环境训练出来的大模型。但是ChatGpt就有点搞笑了,不仅作者、作品错误,解析的也很奇怪,面对苦难和挫折是什么鬼呀??另外在提示它回答错误以后,它还会继续胡编一个答案出来,我以为进一步提示作品不对它就明白作者第二次回答给对了呢,结果,完全不着边界的继续胡诌,看来,ChatGpt对于中文古诗词的理解还很差。
3,物理
提问:如何实际制造量子计算机?
-
文心一言回答
-
ChatGpt回答
-
答案
这个问题其实是一个技术展望类的问题,因为人类压根还造不出真正的量子计算机。
-
评价
文心一言列出了未来可能的一些方法,但是ChatGpt直接给了一个基本操作步骤出来,看起来说的很有道理的样子,有理有据,让人信服!
4,数学
提问:鸡兔同笼问题。现在有鸡和兔子呆在同一个笼中,从上面数上有35个头,从下面数有94只脚。请问鸡兔各几只?
-
文心一言回答
-
ChatGpt回答
-
答案
鸡的数量23,兔子的数量12
-
评价
二者的答案都是一样的,但是回答的逻辑不同。gpt的解法是我们很熟悉的二元一次方程式,逻辑很流畅;文心一言使用假设法,求解更快一点。这一波打平。
5,历史
提问:历史上哪个姓氏建国最多,分别建立了哪些政权?
-
文心一言回答
-
ChatGpt回答
-
答案
应该是刘姓建立的政权是最多的,但是李姓的帝王是最多的(毕竟李唐盛世是中国封建社会的巅峰时期,同时当时的统治者最喜欢赐姓为李)
-
评价
文心一言明明已经明确了李姓帝王是最多的,但还是回答李姓是中国历史上建立政权最多的形式,可能题目理解有误?至于gpt就是纯粹的胡扯了,再次暴露对中文语料学习不足。
6,编程
提问:编写一个js算法,其作用是将输入的字符串反转过来。例如输入:“hello”,输出"olleh"
-
文心一言回答
-
ChatGpt回答
-
答案
都是正确的
-
评价
这个问题下其实没什么好评价的,答案和步骤都是一模一样的,在实际工作中,如果询问某些遇到的bug情况,chatGpt会更聪明一些。
7,地理
提问:地球上最大的岛屿位于什么地方?
-
文心一言回答
-
ChatGpt回答
-
答案
格陵兰岛
-
评价
这次文心一言的回答更加优秀一点。虽然问题只是询问地球上最大的岛屿是哪里,gpt的回答中规中矩,没有问题;但是文心一言把该岛屿相关的地理位置、自然景观、人文历史都简要的做了介绍,让人对这里更加了解并产生兴趣。
8,经济
提问:为什么会有通货膨胀问题?
-
文心一言回答
-
ChatGpt回答
-
答案
都是正确的
-
评价
怎么说呢,文心一言的回答让人有点云里雾里的,还是没有太说清楚;gpt的逻辑优势再次展现,直接告诉大家通胀其实就是物价普遍持续上涨的现象,并对造成它的两种原因做了详细的解释,逻辑非常清晰。
9,艺术
提问:请对《蒙娜丽莎的微笑》这一世界名作,做出鉴赏与评价
-
文心一言回答
-
ChatGpt回答
-
答案
鉴赏评价也是没有答案的,看个人理解
-
评价
文心一言认真的从艺术表现力、色彩应用、构图布局、情感表达四个方面做了鉴赏分析;而gpt则更偏重于对这幅画的价值和意义进行评价,二者的回答都很棒,平局。
10,生物
提问:某地区遗传学调查发现男性色盲占该地区总人口的7%,那么求该地区的女性色盲患者及女性色盲携带者分别占总人口的比例?
-
文心一言回答
-
ChatGpt回答
-
答案
这个问题我也是搜索到的答案,女性色盲比例是0.5%,女性色盲携带者的比例是13%
-
评价
可以看得出来,文心一言是完全不懂这个基因出现概率计算的,纯粹胡诌,且没有任何道理;ChatGpt也算错了,虽然答案依旧是有流畅的逻辑推导、计算,但是它的计算根据一开始就是错的,所以不管怎么算都是错的。
整体评价
文心一点在中文语料的学习上是大大超过ChatGpt的,对诗词歌赋和中国历史的掌握更好,回答也更具有人文情怀;但是它在知识掌握、逻辑理解方面弱于ChatGpt很多;而ChatGpt最让人印象深刻的是,不管是什么问题,不管正确与否,它都有一套完整清晰的推导逻辑。它的答案如果是正确的,那很完美,如果答案是错误的,那它的逻辑链条也是错的,感觉它为了自己的推导甚至会虚构某些"事实"出来,所以大家不能直接信任它,需要对答案进行仔细的甄别。