我实测了国内外GPT,问了10个问题,差点把电脑砸了...

观点| Mr.K   主笔| Wendy.L   编辑| Emma

来源| AI新猿人(ID:aixyr2023)

虽然ChatGPT早就火出圈好几个月,但是我敢保证有好多人还是不知道GPT三个字母代表什么。

G代表的是generative,表示有生产力的;

P代表的是pre-trained 的意思就是预训练;

T代表的是transformer,表示变换模型(计算机)转换器。

ChatGPT的全称就是Chat Generative Pre-trained Transformer,也就是专门用来聊天的生成式预训练转换器。



01

测评了国内外GPT之后,心情很复杂

我总结出以下差异

测评之前,我首先问了一个问题

33a13e86951c072250b6f81694ac4aad.png

下面是它的回答:

GPT的全称是Generative Pre-trained Transformer,是一种基于Transformer架构进行预训练的神经网络模型。其技术原理如下:

1、预训练:GPT的训练数据集是通过大规模语料库(例如NLP训练数据库)进行训练得到的。这些数据集包含了大量的文本数据和对应的标签,预训练模型可以利用这些数据来生成文本、回答问题、进行对话等任务。

2、模型架构:GPT采用了Transformer架构作为其神经网络模型。Transformer是一种基于注意力机制的深度学习模型,其训练过程类似于循环神经网络(RNN),但具有更好的时间和空间效率。

3、损失函数:GPT的损失函数采用了交叉熵损失函数,这种损失函数能够更好地反映生成文本和回答问题的质量和准确性,并且可以通过交叉熵损失函数的剪枝来避免过度训练。

4、优化方法:GPT采用了反向传播算法和Adam优化器进行模型的训练和优化。反向传播算法可以帮助训练算法找到模型的局部最优解,Adam优化器可以通过学习动量来更好地调整模型的参数,以提高模型的训练效果。

也就说,GPT它是基于Transformer架构的预训练语言模型,并且通过处理大量的非标记语料来进行训练,通过预训练得到一个高效的神经网络模型,该模型可以自动生成文本、回答问题、进行对话等任务,并且可以通过交叉熵损失函数和Adam优化器进行训练和优化。

值得注意的是,GPT采用的是单向的、基于自回归的方式来预测生成下一个单词的概率,也就是说,当输入前面的句子时,GPT可以预测下一个最有可能出现的单词是什么。

由此可见,不管是chat GPT还是文心一言,它们的内容创作都不同于人类。

人类作家在创作之前,需要先整体构思出一个框架,可是GPT却是只需要给出它一个开头和关键词,他就挤牙膏一样把内容挤出来,在写完文章之前,GPT并不知道自己要写的是什么样一个故事。

这也就是为什么即使ChatGPT完全不理解你所说是什么东西,它仍然能够一本正经胡说八道跟你聊一堆。

当然了文心一言本身也是知道自己可能在“胡说”,而且自己也在回答当中很谦虚地承认了这一点:

83e0d2e2b3d9afa6046557d4f43aa69b.png

作为一个人工智能语言模型,我是基于自然语言处理技术来分析和回答你的问题的。

具体来说,我是通过分析你输入的文本,提取出其中的关键词和信息,然后使用自然语言处理技术中的语法分析技术来分析这些关键词和信息之间的语义关系,从而生成回答。

需要注意的是,我的回答是基于自然语言处理技术中的机器学习算法和模型,通过不断的训练和优化来生成的。因此,我的回答是基于大量的文本数据和语料库,具有一定的准确性和可靠性,但是也存在一定的限制和误差。

至于具体的测评结果,我根据自己的体验,综合了网上其它人的点评,总结出以下几点:

1、文学创作,首先要说明的是,不管是文心一言还是chatGPT,他们在文学创作或讲故事说段子方面,都是半斤八两 ,一言难尽。

43f7b9436ef35574a384751ef59c4576.png

bb618d0e74dd851cbab83c243ec07043.png

怎么说呢?讲的笑话本身并不好笑,但是它们讲笑话本身真的好好笑。

当然,这一点所谓仁者见仁智者见智。

对于本身需要情感或艺术水平、或者本身对质量要求比较高的创作, 如果让AI来生成的话,就算形容为差强人意,也真的是很勉强。

2、专业文稿,对于产品说明或者新闻消息乃至商业软文写作方面,二者各有千秋,并且与人类的水平不相上下,但更重要的是,比人类效率更高。

这要怎么说呢?AI就是一个没有感情的但产量奇高的创作机器。

3、写代码方面,根据好多专业程序员的测试,貌似文心一言的代码能力还需加强,而 ChatGPT 以擅长编码“出圈”果然名不虚传。

4、中文语义理解,所谓术业有专攻,文心一言在中文语义的理解以及中国传统文化相关内容的创作上显然更胜一筹。

文心一言生成的内容之所以还不够完善,是因为训练的参数相较国外的GPT4还不够,并不是外界谣传的那种“文心一言对中文的理解不好是因为基于国外某GPT XXX…… ”

拜托,我们要对国产AI有信心好吗?:)

5、多模态内容生成,这一点chatGPT目前还不支持,不能输出图片创作;可是文心一言是可以画图的,这一点完胜!



02

AI绘画测评:Midjourney

刚刚说到画图,我们就不得不提另一个AI作图神器,Midjourney。

Midjourney诞生在美国,是一款采用了类似于GPT-4的深度学习技术的绘画工具,它具有强大的绘画能力和便捷的使用体验,能够理解用户的输入信息,比如文字描述、草图、甚至是情感等,然后在大量的图像数据中寻找相似的元素和特征,最终生成一幅满足用户需求的作品。

42a0795a2413dfee54fc040ea155e794.png

Midjourney绘制,来自网络,侵删

它不仅能够生成传统意义上的图像,还能够创作出具有丰富意义和独特风格的作品。比如Midjourney可以将某种艺术风格应用到的作品上,例如梵高的星空风格、毕加索的立体主义等。只需上传一张图片和指定想要的艺术风格,Midjourney就能快速地生成一幅具有该风格特点的作品。

6c7a27416a83be55e77e4ee029598c1d.png

更重要的是,这些图片已经能传达出情绪和意境来了不是?!

95be3ad5f394b75b2ed2abbddef138aa.png

Midjourney绘制,侵删

此外,用户还可以对AI创作的图片进行分层编辑,允许用户在不同图层上绘制和修改,这样即使在复杂的创作过程中,也能轻松地实现对各个元素的控制和调整,而且还支持团队协作。

ba9446de04d4294d8baa00dfa575f6aa.png

前段时间火出圈的“中国式情侣”图片,由Midjourney生成

42f4b636d56cae13042cf19358b6e139.png

不得不说,Midjourney它是所有GPT里头最最最懂美学的。

另外我附上 这是文心一言绘制生成的中国式情侣。

bd3f87b4e965a6298e5cbd392013f6c1.png

怎么说呢?也不能说它不对,只是真的像极了十几年前,5块钱一本买的言情杂志当中插图。。。

我再来揭晓一个,前两天另一篇文张的谜语图:

6fdb0f7fdb5a5d92e16d6a5a76dce007.png

其实我说的是,画一只虎头虎脑的小熊。

6dbf345f5ce1b004fccd2a025d1b1c54.jpeg

虎头虎脑熊正确打开方式。

总体来说,文心一言能聊天会创作写代码还会画图,功能更综合全面一些。

Midjourney在绘图方面则是一骑绝尘了。

最后,Midjourney不仅是一个绘画工具,还是一个学习与教育乃至于社交平台。用户可以通过它来学习和掌握各种绘画技巧和风格,还可以在平台上与其他用户进行交流和分享自己的作品。

也许Midjourney真正令人叫绝的不是技术能力强大,而是产品塑造十分成功。

这一点,值得所有的GPT应用企业学习。



03

国内外GPT技术水平差多远?

导致差距的原因是什么?

其实透过现象看本质,中文大语言模型和GPT-4,目前的确是有一些的差距,但背后原因并不是在于技术研究水平的差距有多大,而是在于技术应用的滞后和环境的不佳方面。

以ChatGPT为例,目前,ChatGPT已经被广泛应用于金融、医疗、教育等领域,并且已经取得了不错的效果。例如,在金融领域,ChatGPT已经被应用于智能投资、客户服务等方面,可以帮助投资者进行智能投资,提高投资效率;在医疗领域,ChatGPT已经被应用于智能诊断、医疗预测等方面,可以帮助医生进行智能诊断,提高诊断准确率;在教育领域,ChatGPT已经被应用于智能教学、在线辅导等方面,可以帮助学生进行智能辅导,提高学习效果。

在中国,GPT技术的应用才刚刚起步,在文心一言刚发布的时候,大量的企业仅仅是才开始与百度签订合作,目前可能也只有一部分刚刚开始接入应用或者开发工具等,但实际的还没有看到很出彩的应用案例。

虽然还没有看到技术的应用,但是网上已经出现了关于GPT各种教赚钱课程,不少人已经靠GPT赚得了第一桶金,但用的是什么方式呢?

卖ChatGPT账号、直播卖课、以及炒股···

自然语言处理是一项需要大量资金投入的技术。美国在自然语言处理领域的投入是国内的数倍甚至数十倍,这也是美国在该领域能够取得领先地位的重要原因之一。

而在中国的今年的农历年之后,每一个投资人都在疯狂寻找中国的ChatGPT。

资本疯狂炒作GPT概念,但是这些年一直潜心研究大语言模型技术的百度公司,AII IN AI, 这些年股价却一路狂跌。

少有人是真的想研究技术造福社会科技兴国,多数只是想捞一笔钱然后离场,或者再去捞下一笔钱。

刘慈欣在《三体》里写过一句话:任何超脱飞扬的思想都会砰然坠地——现实的引力实在是太沉重了。

也许这就是社会环境的引力。



04

GPT未来发展前景分析

前面我们说道,国产的GPT与国外还存在一定差距。

但是,随着国内大语言模型训练的参数和时长不断增多,以及应用场景的不断扩展,其差距将会逐渐缩小。

1、横向继续扩展应用领域,AI+传统应用,引起产业升级

当前AI技术已经在多个领域得到了应用,例如:金融、医疗、教育等。未来,随着自然语言处理技术的不断提升和应用场景的不断扩展,其应用领域还将进一步拓展。

其次,自然语言处理技术与其他技术的融合也将成为未来的一个重要趋势。

例如:在智能客服领域,自然语言处理技术可以与语音识别技术、机器学习技术等结合,实现更加智能的客户服务;在智能翻译领域,自然语言处理技术可以与翻译技术结合,实现更加自然的翻译服务……

随着自然语言处理技术的不断发展和应用场景的不断扩展,其产业链也将得到进一步拓展和优化,从而带动整个人工智能产业的发展。

2、纵向深耕,垂类领域GPT还会不断浮现,信息安全成为主打要求

垂直GPT相对于通用的GPT产品(比如广而泛的ChatGPT)来说,优势其实是十分明显:

1、时间成本还是经济成本都显著降低

垂直GPT只需利用该领域内(如金融、教育、环保等)的专业数据进行训练,避免了采集高成本和高难度的数据,可以节省人力物力;同时,垂直GPT针对特定领域进行优化,训练数据更加专业化和精细化,可以通过更少的数据和更短的训练时间,获得更好的效果。

2、专业度高,应用效果更好

与通用的GPT产品相比,垂直GPT能够更准确地理解和处理领域内的语言数据,同时也减少了后续的人工修正和调整,在特定领域的应用效果会更好。

例如,IBM Watson Education推出了一款名为“Teacher Advisor with Watson”的教育GPT,可以为教师提供个性化的教学建议和支持;Kheiron Medical推出的“MIA”医疗GPT,可以为医生提供乳腺癌筛查和诊断支持,而专门为金融领域打造的大型语言模型(LLM)——BloombergGPT,更是一经发布就引发金融圈“地震”。

以上这些垂直GPT都更加适合商业化应用,可以为企业提供更高效、准确、具有定制性的自然语言处理服务。

3、在信息安全和隐私保护方面做到加强

对于ChatGPT类的产品,其实我们都知道,你的每次问答,都是在给它进行数据投喂。

可是如果有一天,当涉及到个人隐私、企业机密、乃至于国家秘密的时候,你还敢不敢使ChatGPT?——相信很多人在使用 ChatGPT的时候,都不免会有相同的隐忧。

这也就是为什么,自打国产的文心一言发布之后,我开始坚定地去用,因为我知道每次使用文心一言,都是在帮它优化性能,同时我也是觉得说,不想把更多中国人的数据,给到美国。

同样,对于一个企业来说更是如此。

未来的垂直GPT应该做到加注重信息安全与隐私保护,比如,采用加密过滤的方式,使企业数据不被泄露,也就是无法“二次训练”,同时,采用更为严格的数据保护措施,也可以确保用户的隐私和信息安全不受侵犯等等。

 --  END -- 

送你一份《顶尖机构 ChatGPT 研究报告》pdf

关注下方公众号,在对话框回复:gpt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8806.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文心一言 VS chatgpt (6)-- 算法导论2.3 1~2题

一、使用图 2-4作为模型,说明归并排序在数组 A(3,41,52,26,38,57,9,49)上的操作。 文心一言: 使用图 2-4作为模型,说明归并排序在数组 A(3,41&a…

文心一言 VS chatgpt (14)-- 算法导论3.2 2~3题

二、证明等式(3.16):a ^ {\log_b c} c ^ {\log_b a}。 文心一言: chatgpt: 我们需要证明的等式为: a log ⁡ b c c log ⁡ b a a^{\log_b c} c^{\log_b a} alogb​cclogb​a。 首先,将 l…

文心一言 VS chatgpt (3)-- 算法导论2.1

一、以图 2-2 为模型,说明INSERTION-SORT 在数组 A(31,41,59,26,41,58)上的执行过程。 文心一言: 以图 2-2 为模型,说明INSERTION-SORT 在数组 A(31,41,59&…

文心一言 VS chatgpt (16)-- 算法导论4.1 1~2题

一、当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回什么? 文心一言: 当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回-1。 这是因为在二进制中,当所有元素均为负数时,A的每个元素都对应一个负数&#xff…

文心一言 VS chatgpt (1)-- 算法导论1.1

1.给出现实生活中需要排序的一个例子或者现实生活中需要计算凸壳的一个例子。 文心一言: 现实生活中需要排序的一个例子: 在一个商店里,顾客需要购买一些商品。他们需要按照价格从低到高排序,以便更容易地找到他们想要的商品。…

letcode算法,ChatGPT来救场(每日一学)

ChatGPT与letcode ChatGPT解释说明一个时间复杂度小于 O(n2) 的算法 众所周知ChatGPT是一种大型语言模型,使用深度学习技术学习大量的语料库,从而模仿人类语言和思维方式,回答用户的问题 我们那他来辅助letcode刷题,有答疑还有详细…

文心一言 VS chatgpt (9)-- 算法导论2.3 7题 3.1 1题

七、描述一个运行时间为O(nlgn)的算法,给定n个整数的集合S和另一个整数,该算法能确定 S中是否存在两个其和刚好为工的元素。 文心一言: 这里是一个运行时间为O(nlgn)的算法,可以用来确定集合 S 中是否存在两个元素,它…

js算法题

文章目录 前言刷题基础——输入输出问题刷题网站解决方案本地输入输出 数组的常用方法push和pop组成栈shift和push组成队列unshift()reverse()slice(start,end) (slice:片)splice(start, deleteCount, item1, item2……)&#xff…

文心一言 VS chatgpt (5)-- 算法导论2.2 3~4题

三、再次考虑线性查找问题(参见练习 2.1-3)。假定要查找的元素等可能地为数组中的任意元素,平均需要检查输入序列的多少元素?最坏情况又如何呢?用0记号给出线性查找的平均情况和最坏情况运行时间。证明你的答案。 文心一言: chatgpt: 假设…

由浅入深之数组的算法题(vs: chatGPT做算法)

背景 俗话说,温故而知新。chatGPT效果太惊艳了!简直就是碾压的效果。但是还要有希望,先拾取,再创新。先了解,再超越吧。 ps: 再刷最后一遍算法题思路。顺便基于chatGPT3.5感受一下大模型的魔力。 数组与指针的区别 在C…

让ChatGPT帮我准备面试题

背景 最近大家伙找工作都挺难的吧,反正我是挺难的。将近一个月了,简历都投烂了,boss都是【已读】。倒是有一两家面试,有一家感觉我自己没发挥好,有点紧张本来知道的东西面试的时候就忘了。而且在面试之前我也没做什么准…

用ChatGPT写神经网络!

Datawhale干货 技术:ChatGPT,编辑:机器之心 AI 写 AI,来得比预料中更快一些。 自从去年底推出以来,对话式 AI 模型 ChatGPT 火遍了整个社区。 ChatGPT 的确是一个了不起的工具,就像一个「潘多拉魔盒」。一…

我让 ChatGPT 写了个 ChatGPT

这家伙实在是火得过头了,索性讲个它的故事。 去年11月份,OpenAI 推出了 ChatGPT. 这里就不赘述这个家喻户晓玩意的常识了。 要说刚开始也没多少人在意,一个聊天机器人…… 谁稀罕呐。 但仅仅过了一个月,事情就有点不对头了&#x…

阿里面试官:如何用ChatGPT写一个ChatGPT的程序!

目录 第一步 询问ChatGPT 第二步 实战 第三步 调试ChatGPT 第四步 人工介入实现开发 总结 需求:准备搭建一个对接ChatGPT的服务,部署在云服务器上,这样应该就可以更方面的使用ChatGPT的服务了。 第一步 询问ChatGPT 好了,我…

摸得到的chatgpt--AI场景下的编码

千帆竞逐的时代序幕 从去年ChatGPT正式对外发布至今,其热度一直居高不下,无数大模型类新的场景均引得无数已退休大佬下场参与,可见其中蕴含的巨大机会。2C端的搜索场景、聊天场景、教育场景、游戏场景、辅助生成场景,2B的客服场景、应用交互升…

一块RTX3090跑ChatGPT体量模型的方法来了!代码已开源

编|泽南 源|机器之心 1750 亿参数,只需要一块 RTX 3090,ChatGPT 终于不再是大厂专属的游戏? 计算成本是人们打造 ChatGPT 等大模型面临的重大挑战之一。 据统计,从 GPT 进化到 GPT-3 的过程也是模型体量增…

百度潘征:ChatGPT将为低代码带来怎样的“新鲜血液”?

在 AIGC 这个概念如日中天的大背景下, “让 AI 直接生成能运行的应用” 是许多低代码厂商以及相关从业者的最高理想。早在 AIGC 这个概念兴起之初,潘征老师及其团队就对 AIGC 与低代码的结合进行了一系列的探索,而以 ChatGPT 为新锐代表的大模…

玩转ChatGPT:R代码Debug一例

一、写在前面 今天家里领导发来求助,说是用GPT-3.5写一个 计算mRNA干性指数 的R代码,运行报错。让我用GPT-4帮忙Debug一哈。 搞了半小时,还是有亿点感悟,写段文字记录记录。 二、踩坑过程 (1)先看原始的…

英文论文如何查重?

英文论文是我们常见的文章类型之一,国际期刊投稿的英文论文一般都采用iThenticate查重软件进行查重。 什么时候开始论文查重?至少给在论文提交前一个月开始,给降重预留足够的时间 那还有其他合适工具可以进行英文论文的查重呢? …

ChatGPT如何辅助工作

探索ChatGPT,协助工作学习创作。公众号「阿杰与AI」回复AI,加入社群,一同探讨,一同成长,比他人更进一步。 我们一起维护一个完全免费开源知识库。 1.AI、OpenAI、MidJourney发展史2.ChatGPT们对今后社会生活的影响3.目…