ChatGPT是什幺?GPT-4厉害在哪?跟过去几代有差吗?一篇看懂最强AI红什幺
多年来,人工智能(AI)统治世界一直是许多人担忧、且并非不可能的事,但谁知道,这会从艺术和文学领域开始呢?
在全球都还在为聊天机器人ChatGPT惊叹时,OpenAI在3月14日又亮相了新一代的GPT-4,不但可以可处理2.5万字长篇内容,是ChatGPT的8倍,最让人惊艳的是还能「看图说故事」,连哏图都能分辨,告诉你背后的小点在哪。
国内可以直接访问,感兴趣的可以试试ChatGPT的强大,ChatGPT Next Web
ChatGPT是什幺?ChatGPT能做到哪些事?
GPT是「生成型预训练变换模型(Generative Pre-trained Transformer)」的缩写,是一种语言模型,而OpenAI所提出的这一系列的模型,可以执行非常复杂的任务,如回覆问题、生成文章和程序码,或者翻译文章内容等。而GPT中的Transformer是指由Google Brain所推出的译码器(decoder),是用来处理输入的自然语言以处理翻译、摘要等。
ChatGPT不仅仅是个聊天机器人,而是上知天文下知地理、可以针对使用者问题给予相应的长篇回覆;问答解惑、写程序和debug,甚至撰写论文、剧本小说诗歌等等,都难不倒它,只是有时还是会出现令人啼笑皆非的答案,但都还编得有模有样、令人惊艳。
自从先前ChatGPT开放公众使用以来,已经吸引超过100万人使用,社群媒体也涌现了大量用户的测试截图,主题广泛,个个都在测试人工智能的极限。
看起来coding难不倒它:
写诗也有模有样,对英文诗的押韵也有一点概念:
甚至基本的学术论文(且将可能会为学校带来一些问题):
但可询问的内容也有限制,例如,它的培训内容只限于2021年以前的信息:
来源:ChatGPT
ChatGPT的回答内容仅限于2021年前。
ChatGPT的演变历程:1到4代有什幺差别?
1. GPT-1:
就是第一代GPT模型,于2018年6月诞生时,就已经是个强大的语言理解模型。从判断两个句子间的语意与关系、文本资料分类、问答与常识推理都难不倒,只是并非好的对话式AI模型,训练参数也远低于后续模型。
2. GPT-2:
2019年2月OpenAI又推出了由GPT-1演变而来的GPT-2,但主要改变只有使用了更多参数与数据集,参数量达15亿(GPT-1仅有1.17亿),而学习目标改成了「无特定任务训练」。这证明了,大幅增加的参数和资料可以让GPT-2比起GPT-1更上一层楼,虽然有些任务的表现不比随机的好,但在生成短文和编故事等方面都有了一定的突破。
3. GPT-3/GPT-3.5:
2020年GPT-3也受简单粗暴地用钱堆出了更多的运算资源,延续过去GPT类的单向语言模型的训练方式,只是将模型增大到1750亿参数。GPT-3在自然语言处理领域已经取得了重大的突破,成为了当时最大、最强大的自然语言生成模型,从机器翻译到文章总结输出,都有着非常出色的表现。
只是,2020年因为疫情严峻所致,人们对于人工智能领域的突破并没有足够的关注。而且,比起ChatGPT,GPT-3并没有办法进行自然的对话,只能处理单向的任务,因此也只有少数开发者有兴趣。
直到2022年11月底,OpenAI才发布了「GPT-3.5」的更新,主打对话模式,甚至可以承认错误、且拒绝不恰当的请求──这就是支持ChatGPT背后的模型,其更接近人类对话与思考方式的特点也吸引了全球的目光。
4. GPT-4:
距上次GPT-3.5的更新不久,2023年3月14日,OpenAI又抛出GPT-4,此次除了正确度高出40%、以整理和搜寻网络上的信息为主,还可以支援视觉输入、图像辨识,懂得「看图说故事」了!不过GPT-4没有再砸下重金、狂堆训练参数,而是把研发的重点将放在提升利用现有数据的能力上。:shuttersto
ck
ChatGPT有可能取代Google吗?
外界公认ChatGPT在AI界最大的突破,就是能处理非常广泛的主题。再者,ChatGPT以对话的方式进行互动,以人们无法企及的速度打包整理信息,甚至能处理对话中出现的不同人物、地点和时间等信息;可以把它理解成文字版的Siri或Alexa,但ChatGPT更能理解问题、更知道用户想要什幺。
专家也认为,ChatGPT首先威胁到的就是搜寻引擎。比起一条条的蓝色连结列表,整理好的信息、有逻辑的解释,似乎更吸引人。
观察一:ChatGPT可自行生成内容,并结合前后文意对话
目前搜寻引擎的运作方式(如Google),是汇集大量信息,而非创造信息。透过在输入框输入关键字,搜寻引擎会透过算法,抓取、索引以及排序匹配的信息,然后再由用户寻找自己需要的内容。但ChatGPT很不一样的是, 可自己生成内容,给出单一、实时的答案,还能结合前后文意,进行多轮对话 。
观察二:ChatGPT能不能判断讯息真伪?
不过,虽然ChatGPT资料源自于大量网络内容,但也会有出错的时候;而使用搜寻引擎可以从多个资料来源交叉对比。正如一些AI研究人员所解释,这是因为这样的聊天机器人基本上是「随机鹦鹉」(Stochastic Parrots)——也就是说,它们的知识仅来自训练数据中的统计规律,而不是像人类一样,拥有复杂和抽象的理解能力。
甚至,推特(Twitter)现任执行长伊隆.马斯克(Elon Musk)透露,ChatGPT可以使用Twitter数据库,且众所皆知Twitter垃圾讯息泛滥。这表示ChatGPT必然学到了许多缺少事实核查的内容,甚至被用来生成不实的消息、恶意散播。
综合来看,ChatGPT短时间内应该不会威胁到搜寻引擎,再加上Google也推出名为「Bard」的聊天机器人技术,正面迎战。但ChatGPT仍在起步,在未来,也有可能改变我们获取信息的方式。
ChatGPT还能写论文?其实是扼杀思考
而在教育领域,Kedrosky也认为ChatGPT对高等教育来说也是个威胁,尤其ChatGPT用于撰写论文可以算是剽窃,「 写文章的目的是为了证明你可以思考,但缩短了(写作)过程、且达不到目的 ……我们不再知道他们有没有作弊,所以这表示,一切都必须在课堂上完成(作业)并且必须受到监督。」这都需要更多教育工作者在第一线努力,因此学校可能会变得更贵、更小。
但对于未来职业的威胁,Kedrosky仍同意比较乐观的看法,「……只要有『颠覆』,就会有其他机会,人是会流动的,会从一个地方到另一个地方、从一个职业到另一个职业。我们不应该如此固执,认为这个技术(AI)的发展让我们无法改变或是迁移。」
AI取代人力的那一天,终究要来临?
不过,这也引发了另一个问题,这会不会取代一些工作?虽然许多用户表示,根据大量测试结果,ChatGPT并不是那幺聪明,但各行各业的专业人士都开始担心。程序可以仰赖AI、学术论文甚至可以回避反剽窃软件,饭碗不保、知识原创性出现危机。
根据TechCrunch与麻省理工学院的研究员兼经济学家、风险投资者Paul Kedrosky的访谈,Kedrosky认为,「 OpenAI正在推动美国经济100年来最具破坏性的变化 。」
在访谈中,Kedrosky用机械化的汽车工厂来比喻,指出这与自动化进入汽车工厂、并且让汽车工人失,很不一样,「制造工厂中的机器人虽然对在工厂工作的人们造成了破坏性的影响,并产生了令人难以置信的经济后果,但它们并没有转身开始『吸收』工厂内部的一切,一个部门接着一个部门吸收。而这不仅仅是我们可以预想到的,且这是你应该预想到的。」