未来已来,拥抱变化,拥抱未来
一、ChatGPT
1、ChatGPT定义
ChatGPT(Chat Generative Pre-trained Transformer)翻译成:聊天生成式预训练转换器,其中,“Chat Generative”表示聊天生成式,“Pre-trained Transformer”表示预训练转换器。预训练模型可以提高模型的泛化性和效率,使得模型在处理新任务时更加灵活和高效。转换器是一种新兴的神经网络结构,可以有效地处理自然语言处理任务,尤其是基于序列的任务,例如自然语言生成和机器翻译。所以,“Chat Generative Pre-trained Transformer”就是一种能够在聊天生成任务中使用预训练转换器的技术。
Generative生成式
生成式人工智能 (generative AI) 指的是一种基于深度学习的技术,通过模型输入大量的数据进行学习,并尝试模拟数据背后的潜在分布,进而生成类似于真实数据的新数据。生成式AI不仅可以生成文本、图片、音频等各种类型的数据,还可以实现音乐创作、语言翻译、图像处理和自然语言生成等任务。常见的生成式AI模型包括生成对抗网络 (GAN)、自动编码器 (Autoencoder)、变分自编码器 (VAE)等。
与传统的基于规则或者模板的人工智能不同,生成式人工智能可以通过学习数据的规律和模式,不断优化模型,并生成类似于真实数据的模拟结果。这种模型可以实现更加灵活、多样化的数据生成,具有较高的实用性和应用潜力。比如,通过生成式AI可以自动创作出美妙的音乐乐曲、生成高质量的图像和视频内容,还可以实现智能对话、机器翻译等人类语言处理任务。
这里面的Generative表示生成式的,与传统的人工智能有着本质的区别,他注定了这个模型给出的答案,不是基于标准答案,而是机器通过与人的对话,和自己本身的理解,而“产生”的答案;
Pre-trained预训练
预训练模型就是利用计算机处理大量的数据,让模型学习到普遍的语言表达规则,并训练出一个可以理解语言的模型。这个模型可以理解人类的语言如何表达,并对复杂的语言任务进行预测。比如回答问题、对话和生成文章等。
Transformer神经网络转换器
Transformer是一种基于自注意力机制的神经网络模型,由Google公司在2017年提出。它是一种用于自然语言处理的模型,可以用于文本分类、翻译等任务。
(1)选择型的记忆:针对我们提供给它的内容,能够自主选择哪些内容是有价值的;
(2)选择型注意力;
人和动物的本质区别是,使用工具,人用了几千年,GPT只有了几个月,效率大大超过人类。
ChatGPT4似乎学会了自己筛选和使用工具
2、ChatGPT发展史
所属公司OpenAI
OpenAI是一家人工智能研究和开发公司,成立于2015年,总部位于美国加利福尼亚州。最初创立的时候是非营利性公司,2019年转为盈利性公司,利润上限为任何投资的100倍,同年,微软向该公司投资了10亿美金,并获得了OpenAI技术的商业化授权,从此,OpenAI的一些技术开始出现在微软的产品和业务上。
公司的目标是通过研究人工智能技术,推动人类进步。
OpenAI的研究领域包括自然语言处理、强化学习、机器翻译等。
公司的创始人包括Elon Musk(埃隆马斯克)、Sam Altman等知名人士。马斯克曾于2015年注资OpenAI,成为该公司的创始投资者之一。他一直对OpenAI的进展保持着关注,并经常在社交媒体上分享OpenAI的成就和研究成果。不过,2018年,由于OpenAI宣布不再将研究成果全部开源,而在一些特定领域进行商业化应用,马斯克决定退出OpenAI董事会。现在,他已经不再是OpenAI的股东或相关公司的代表。
进化时间轴
ChatGPT发布时间:2022年11月30日
模型 | 发布时间 | 参数量 | 预训练数据量 |
---|---|---|---|
GPT | 2018年6月 | 1.17亿 | 约5GB |
GPT-2 | 2019年2月 | 15亿 | 40GB |
GPT-3 | 2020年5月 | 1750亿 | 45TB |
ChatGPT-3.0 | 2022年11月20日 | ||
ChatGPT-3.5 | |||
GPT4.0 | 2023年3月14日 |
用户破亿的时间
电话:75年
手机:16年
互联网:7年
Itunes:6.5年
Twitter:5年
Facebook:4.5年
WhatsApp:3.5年
苹果APP Store:2年
ChatGPT:2个月
3、ChatGPT的主要特点
ChatGPT是由OpenAI公司开发的一种聊天人工智能模型,具有以下特点:
(1)自然语言生成能力:ChatGPT可以自动根据用户输入生成自然语言的回答,而且回答具有较高的一致性、连贯性和流畅性。
(2)预训练模型:ChatGPT是基于大规模的预训练数据进行训练的,因此具有较强的语言理解和生成能力。
(3)支持多轮对话:ChatGPT支持多轮对话,可以在对话中保持上下文信息,使得回答更加准确和连贯。
(4)多语言支持:ChatGPT可以处理多种语言,并支持各种语言间的翻译,适用于全球用户。
(5)高度自适应:ChatGPT可以根据用户不同的提问和回答方式自适应性地进行调整和优化。
(6)OpenAI使用 RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)技术对 ChatGPT 进行了训练,且加入了更多人工监督进行微调。
(7)可以主动承认自身错误。若用户指出其错误,模型会听取意见并优化答案。
(8)ChatGPT 可以质疑不正确的问题。可以承认自身的无知,承认对专业技术的不了解。
(9)对人类足够尊重,对敏感话题能够合理的绕开。
(10)没有情绪,足够的友善;
(11)ChatGPT给出的答案是“涌现”出来的,而不是调用的数据库的已有信息;
(12)GPT2.0在2020年的时候就已经通过了图灵测试;
(13)现在在跟ChatGPT对话的时候,会感觉他不是一个人,是因为这个系统有意让我们认识到他不是人;
(14)微软的研究报告,ChatGPT的开发人员,不知道为什么GPT能够这么聪明,这么“智慧”;
(15)GPT现在到底有没有意识,这个不好说,因为人为什么有意识,以及什么时候有的意识我们也不知道,就算是GPT有了意识,我们可能也不知道;
4、ChatGPT使用
怎样才能用上ChatGPT
目前想要使用ChatGPT,有两种方式:
(1)科学上网,直接进行访问,账号可以买,但是不建议这样做,自己注册账号需要用到什么验证啥的,充值Plus会员什么的,不建议自己捣鼓,直接淘宝购买就行;
(2)使用他人通过API接口转接过来的(有一些免费的),不好的是无法使用最新的ChatGPT4.0,因为API只开放了GPT3的模型;
应用场景
看别人写的太好了,我就不写了,直接把连接放进来。传送门如下:
(1)ChatGPT应用场景与工具推荐_小殊小殊的博客-CSDN博客
(2)ChatGPT实用用法10大场景_乐享技术的博客-CSDN博客
怎样更好的跟ChatGPT打交道,用好ChatGPT
(1)友好的问答:虽然知道他是个人工智能,但总觉得在跟真人对话,实测ChatGPT是能够通过文字,感受到人的情绪的,所以能友好的表达就友好的表达;
(2)心法是,如果没有得到你想要的答案,那一定是你的问题提的不好,问题要清晰,要尽可能的多像他表达自己的想法,就像是再跟一个新入职的手下交流一样,要事无巨细的交代,这样才可能得到更好的答案;
(3)如果还是得不到想要的答案,那么就新开一个窗口,把问题重新问一遍,可能就能得到满意的答案了,我的理解是,原来的手下开除掉,换了一个新的手下;
(4)用中文跟ChatGPT交流的时候,它是先把中文翻译成英文,输入给ChatGPT后,又输出英文的答案,然后又翻译成中文给到了你,所以有的时候没有得到自己满意的结果,可能语言的原因,尝试用英文进行问答;
(5)如果希望ChatGPT给出更专业的问题,你可以让他进行角色扮演,比如关于法律的问题,可以要求他扮演资深律师;
(6)由于GPT3训练数据是2021年9月以前的,所以如果你用的是别人借用API搭梯子的伪ChatGPT的话,这个时间点后面发生的事情他都不知道;
(7)ChatGPT的记忆力有限,GPT-3.5的输入长度2048,GPT-4的输入长度是25000。所以尽量用更精简的语言描述需求,当然ChatGPT可以结合上下文进行处理,你也可以选择多次沟通;
(8)ChatGPT的输出长度也有限,所以他可能在回答问题的时候并没有说完,这个时候,你可以让他继续,还有就是他是个话痨,及时说完了,只要你让他继续,他就可以一直说下去;
(9)ChatGPT回答的大多数情况下回答的是正确的,但是也有一些是自己瞎扯的,你要有分辨的能力;
(10)AI上使用的单位是token,"token"在 ChatGPT 中指的是一个输入文本被分解成的最小单位,并用于模型的预测和输出。计费标准是0.002美元每1000个token。在英语中1个token大概相当于4个字符,在中文中间,1个字大概相当于2-2.5个token。2美元可以买到100万格token。75万格单词只要不到15块人民币。但实际上不是这么算的,他会把你跟ChatGPT交互的所有内容都计算在内,包括上下文,包括回传的一些推理分析等。
还未完全开放的GPT4
目前GPT4还没有完全开放,而GPT4具有更强大的功能,具体的解读请参考下面的文章
GPT-4发布!ChatGPT大升级!太太太太强了!_zenRRan的博客-CSDN博客
GPT-4大模型硬核解读,看完成半个专家_滕青山YYDS的博客-CSDN博客
本章到此结束,请参见下一篇