互联网新时代要到来了(三)什么是ChatGPT?

什么是ChatGPT?

tips:资料来自百度百科、openAi、CSDN博主「琦在江湖飘」、Info写作社区、CSDN博主「夕小瑶」等网页资料。

1.什么是ChatGPT?

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
在这里插入图片描述

ChatGPT本质是一个应用在对话场景的语言模型,基于GPT3.5通过人类反馈的强化学习微调而来,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。
我们可以让今天的主角ChatGPT来亲自介绍自己。

在这里插入图片描述
在这里插入图片描述

OpenAI 11月30号发布,首先在北美、欧洲等已经引发了热烈的讨论。随后在国内开始火起来。全球用户争相晒出自己极具创意的与ChatGPT交流的成果。ChatGPT在大量网友的疯狂测试中表现出各种惊人的能力,如流畅对答、写代码、写剧本、纠错等,甚至让记者编辑、程序员等从业者都感受到了威胁,更不乏其将取代谷歌搜索引擎之说。继AlphaGo击败李世石、AI绘画大火之后,ChatGPT成为又一新晋网红。下面是谷歌全球指数,我们可以看到火爆的程度。
在这里插入图片描述
国内对比各大平台,最先火起来是在微信上,通过微信指数我们可以看到,97.48%来自于公众号,开始于科技圈,迅速拓展到投资圈等。我最先了解到ChatGPT相关信息的也是在关注的科技公众号上,随后看到各大公众号出现关于介绍ChatGPT各种震惊体关键词地震、杀疯了、毁灭人类等。随后各行各业都参与进来有趣的整活,问数学题,问历史,还有写小说,写日报,写代码找BUG等等。

不过,目前ChatGPT未对中国大陆开放,注册需要境外手机号或是使用VPN等途径,非常不方便。

2.ChatGPT技术

核心技术

2.1语言模型
语言模型通俗讲是判断这句话是否通顺、正确。数学函数表达为给定前N个词,预测第N+1 个词概率,将概率序列分解成条件概率乘积的形式,这个函数就可以实现语言模型去生成句子。那么是什么样的语言模型如此强大,

深度学习开始的语言模型演技过程,如下图所示:
在这里插入图片描述
第一次开始用神经网络做语言模型是2003年Bengio提出的NNLM的网络结构,随着图像领域预训练的取得的突破迅速迁移到NLP领域,有了我们熟知的word2vec,通常做NLP任务句子中每个单词Onehot形式输入,使用预训练好的word embedding初始化网络的第一层,进行下游任务。word2vec的弊端是word embedding静态的,后续代表性工作中ELMo通过采用双层双向LSTM实现了根据当前上下文对Word Embedding动态调整。

ELMo非常明显的缺点在特征抽取器LSTM结构带来的,17年Google在机器翻译Transformer取得了效果的突破,NLP各种任务开始验证Transformer特征提取的能力比LSTM强很多。自此NLP开启了Transformer时代。

2018年OpenAI采用Transformer Decoder结构在大规模语料上训练 GPT1模型横扫了各项NLP任务,自此迈入大规模预训练时代NLP任务标准的预训练+微调范式。由于GPT采用Decoder的单向结构天然缺陷是无法感知上下文,Google很快提出了Encoder结构的Bert模型可以感知上下文效果上也明显有提升。随后2019年OpenAI提出了GPT2,GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模有了惊人的生成能力。同年Google采用了Encoder-Decoder结构,提出了T5模型。从此大规模预训练语言模型兵分三路,开始了一系列延续的工作。

2020年OpenAI提出GPT3将GPT模型提升到全新的高度,其训练参数达到了1750亿,自此超大模型时代开启。技术路线上摒弃了之前预训练+微调的范式,通过输入自然语言当作指示生成答案,开始了NLP任务新的范式预训练+提示学习。由于GPT3可以产生通顺的句子但是准确性等问题一直存在,出现WebGPT、InstructGPT、ChatGPT等后续优化的工作,实现了模型可以理解人类指令的含义,会甄别高水准答案,质疑错误问题和拒绝不适当的请求。

2.2深度学习
深度强化学习(deep reinforcement learning,DRL)是强化学习一个分支,基于深度学习强大的感知能力来处理复杂的、高维的环境特征,并结合强化学习的思想与环境进行交互,完成决策过程。DRL在游戏场景这种封闭、静态和确定性环境可以达到甚至超越人类的决策水平。比较著名的事件是2017年DeepMind 根据深度学习和策略搜索的 AlphaGo 击败了围棋世界冠军李世石。2018 年OpenAI 团队基于多智能体 DRL推出的OpenAI Five 在Dota2游戏中击败了人类玩家。DRL算法主要分为以下两类:

值函数算法:值函数算法通过迭代更新值函数来间接得到智能体的策略,智能体的最优策略通过最优值函数得到。基于值函数的 DRL 算法采用深度神经网络对值函数或者动作值函数进行近似,通过时间差分学习或者 Q 学习的方式分别对值函数或者动作值函数进行更新。代表性的是2015 年 DeepMind 团队提出深度Q网络(DQN),及其后的各种变种DDQN、Dueling DQN、分布式DQN等。

策略梯度算法:策略梯度算法直接采用函数近似的方法建立策略网络,通过策略网络选取动作得到奖励值,并沿梯度方向对策略网络参数进行优化,得到优化的策略最大化奖励值。可以用来处理连续动作。在实际应用中流行的做法是将值函数算法和策略梯度算法结合得到的执行器‒评价器(AC)结构。代表性工作有策略梯度算法、AC 算法以及各种变种DDPG、A3C、PPO等。ChatGPT使用的就是策略梯度算法PPO。

技术原理

ChatGPT整体技术方案是基于 GPT-3.5 大规模语言模型通过人工反馈强化学习来微调模型,让模型一方面学习人的指令,另一方面学习回答的好不好。

ChatGPT在对话场景核心提升了以下三方面:

1)更好的理解用户的提问,提升模型和人类意图的一致性,同时具备连续多轮对话能力。
2)大幅提升结果的准确性,主要表现在回答的更加的全面,同时可以承认错误、发现无法回答的问题。
3)具备识别非法和偏见的机制,针对不合理提问提示并拒绝回答。

ChatGPT的提升主要涉及以下三方面技术:

1)性能强大的预训练语言模型GPT3.5,使得模型具备了博学的基础。
2)webGPT等工作验证了监督学习信号可大幅提升模型准确性。
3)InstructGPT等工作引入强化学习验证了对齐模型和用户意图的能力。

ChatGPT的训练过程分为微调GPT3.5模型、训练回报模型、强化学习来增强微调模型三步:

在这里插入图片描述
第一步:微调GPT3.5模型。让GPT 3.5在对话场景初步具备理解人类的的意图,从用户的prompt集合中采样,人工标注prompt对应的答案,然后将标注好的prompt和对应的答案去Fine-tune GPT3.5,经过微调的模型具备了一定理解人类意图的能力。

第二步:训练回报模型。第一步微调的模型显然不够好,至少他不知道自己答的好不好,这一步通过人工标注数据训练一个回报模型,让回报模型来帮助评估回答的好不好。具体做法是采样用户提交的prompt,先通过第一步微调的模型生成n个不同的答案,比如A、B、C、D。接下来人工对A、B、C、D按照相关性、有害性等标准标准并进行综合打分。有了这个人工标准数据,采取pair-wise 损失函数来训练回报模型RM。这一步实现了模型判别答案的好坏。

第三步:强化学习来增强微调模型。使用第一步微调GPT3.5模型初始化PPO模型,采样一批和前面用户提交prompt不同的集合,使用PPO模型生成答案,使用第二步回报模型对答案打分。通过产生的策略梯度去更新PPO模型。这一步利用强化学习来鼓励PPO模型生成更符合RM模型判别高质量的答案。

通过第二和第三步的迭代训练并相互促进,使得PPO模型能力越来越强。

具体详见CSDN博主「琦在江湖飘」文章

3.ChatGPT应用

ChatGPT的实际应用

ChatGPT可以应用于多种领域,主要应用场景如下:

问答系统:ChatGPT 可以通过对询问进行理解和生成简明易懂的回答。

聊天机器人:ChatGPT 可以用于构建人机对话系统,以帮助用户解决其问题并回答其问题。

文本生成:ChatGPT 可以用于生成文本,例如新闻文章、诗歌、小说等。

机器翻译:通过使用多语言训练数据,ChatGPT 可以用于文本翻译。
在这里插入图片描述
其他应用:
(1)写情书
让 chatGPT 帮我写了一份情书,整得还挺好,赞一个:
在这里插入图片描述

(2)找美女图
我帮大家考验了一下 chatGPT,还是非常站的,经过了考验!
在这里插入图片描述
(3)写代码
在这里插入图片描述
(4)写歌词
在这里插入图片描述

应用:
(1)程序接入
接入步骤
我们用程序接入 chatGPT 非常简单,直接用 chatGPT 去创建一个程序要用的秘钥,就可以使用 http 接口调用了。
在这里插入图片描述
chatGPT 的官网 openai 为我们提供大量语言快速开发的 SDK,详情如下:
在这里插入图片描述

接入 chatGPT 你的程序能做的 49 件事情
当你开通 chatGPT 之后,你的程序就可以通过接口完成以下基本的 49 件事情了;我给大家都批注好了,那一项不明白的就评论区交流;下面每一项勇哥都熬夜晚过了,非常 NICE。

在这里插入图片描述
在这里插入图片描述

4.ChatGPT好玩的事例

  1. ChatGPT进入百度“弱智吧”后,疯了。
    https://mp.weixin.qq.com/s/BE1TkqY8CY99jQuAToW-FQ

不得不说,“弱智吧”的一些经典提问,真的会把ChatGPT搞到崩溃。。。这一点上,我觉得还是人类更胜一筹。

  1. ChatGPT惊人语录大赏
    https://mp.weixin.qq.com/s/csyCHucLtUQAsT8QRS5AUw

这里是一些关于ChatGPT的经典语录大赏,真的是看了之后毁三观。

甚至还有网友让ChatGPT扮演猫娘,笔者看了聊天记录之后直接吐血。。

可以说,ChatGPT好不好玩,纯看你的脑洞大不大。。。

  1. 谷歌要完,百度也危了
    https://mp.weixin.qq.com/s/qVt89FS_wzfu6-ShiWTv_Q

最后是把ChatGPT当成一个搜索引擎来用,你会发现非常惊喜。。这究竟会不会成为一个颠覆谷歌、百度的新型搜索引擎形态,谁也不好说。但至少目前来看,潜力非常大。

5.面临的挑战和问题

5.1慢的问题
chatGPT 火遍全球,涌入了大量的访问者,那么这就是 chatGPT 慢的原因吗?其实不然,试想 chatGPT 背后那么多大佬,不缺服务器,但为什么依旧接近不了慢、网络错误等问题呢?AI 算力是核心关键,如下图大量用户访问 chatGPT,chatGPT 要并发的从海量数据模型中去计算用户请求的真实目的,并给出正确结果。这需要非常庞大的算力,而这个正是卡主 chatGPT 脖子的事情.

在这里插入图片描述

5.2错的问题
网上也有一大堆网友在调侃 chatGPT 的错误,其实这是真实存在的,如下图评价歌曲明显是回答有偏差了。那么这说明 chatGPT 还有努力的空间,同时也方向证明了,大佬都解决不了的问题,它本身就具有很高的复杂性。

在这里插入图片描述
5.3广的问题
chatGPT 在一些领域还支持不到位或者说直接不支持,这表现出 chatGPT 的广度还有待提高,但他为什么没扩大广度呢?其实这个问题还得回归算力和成本上来。GPT-3 模型训练一次需要花费 460 万美元,这是非常非常高成本的事情。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3051.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AIGC文本生成智能应用(ChatGPT)提示工程师技巧

我是荔园微风,作为一名在IT界整整25年的老兵,今天来看一下AIGC文本生成智能提示工程师技巧。 当你在使用类似于ChatGPT这样的AIGC文本生成智能应用时,有没有想过,你所问的问题中的每一个词语对AIGC文本生成智能应用给你的回答的好…

聊一聊AI发展的过去现在与未来-由OpenAI之ChatGPT想到的

目录 一、AI的过去 1、概述 2、艾伦麦席森图灵--一位立志制造大脑的疯子 二、AI的现在 三、AI的未来 一、AI的过去 1、概述 最近由微软等几大财团投资OpenAI公司的ChatGPT火热出圈,这是一款聊天机器人,可以回答你各种各样奇怪问题,使用…

ChatYuan元语AI: 类似ChatGPT功能型对话大模型 部署实践

个人使用感受 1.中英翻译超越了翻译软件,变成本地翻译最好软件了,回答英文时 有时单词之间没有空格 2.中文对话能基本理解意图,回答时会出现搜索式回答.相关内容,照抄网页相关内容原封不动显示出来,不精简提炼 3.不会做数学,简单23都不会 ,不然会更加强大 ChatYuan元语AI 元…

ChatGPT/大模型+零代码,给中小企业带来哪些机会?

ChatGPT让2023年成了AI之年。正如iPhone在2007年开启了智能手机时代,我们现在正在进入人工智能时代。 新形势下,零代码应如何借势发力?伙伴云“AI零代码”给出了答案。 作为零代码领域的头部平台,伙伴云全量发布【AI零代码应用搭…

对待ChatGPT不用如临大敌它语文超牛,但数学不及格?

人工智能(AI)这词语是由MIT的John McCarthy和卡内基梅隆大学的Marvin Minsky在1956年夏季在达特茅斯学院举行的会议提出的: “构建一种计算机程序从事目前只有人类才能够令人满意地执行的任务,因为它们需要高级心理过程&#xff0…

陶哲轩:ChatGPT已加入我的数学工作流

Pine 梦晨 发自 凹非寺转自量子位 | 公众号 QbitAI ChatGPT,已经成为天才数学家陶哲轩的研究助手了! 不止ChatGPT,他还直接在网上宣布: 多种AI工具都会纳入自己的工作流。 最近这些日子,陶哲轩对AI可是青眼有加&#x…

玩转系统|完美替代ChatGPT!Claude注册教程及出现问题解决方案

目录 1、什么是ChatGPT? 2、什么是Claude? 3、为什么推荐Claude? 3.1、Claude特性 4、注册 slack 5、Claude添加到Slack 6、出现APP Unavailable问题 7、如何解决该问题 8、使用感受 8、1代码测试 8、2文学测试 8、3英语测试 1、什么是ChatGPT&a…

堪比ChatGPT,Claude注册和使用教程

新建了一个网站 https://ai.weoknow.com/ 每天给大家更新可用的国内可用chatGPT资源 Claude简介 Claude是一款人工智能聊天机器人。主要有以下特征: 使用自己的模型与训练方法,而不是基于GPT-3等开源框架。模型采用Transformer编码器与解码器的结构,并使用对话上下文的双向…

Cool-Admin + ChatGPT 一键生成代码、AI绘画

Cool-admin chatgpt 一键生成代码 体验地址 文档地址 chatgpt ai 微信机器人,ai 绘图,聊天模板 uniapp插件地址 文档地址 体验地址

《花雕学AI》31:ChatGPT--用关键词/咒语/提示词Prompt激发AI绘画的无限创意!

你有没有想过用AI来画画?ChatGPT是一款基于GPT-3的聊天模式的AI绘画工具,它可以根据你输入的关键词/咒语/提示词Prompt来生成不同风格和主题的画作。Prompt是一些简短的文字,可以用来指导ChatGPT的创作过程。在这篇文章中,我将展示…

ChatGPT+AI绘画 == 王炸 !

2022年,短短半年,AI绘画从海外风靡到国内,从最初笑话AI绘画是人工智障,到惊叹AI绘画的学习能力! 2023年,随着ChatGPT的火爆!掀起一股AIGC热潮,AI绘画热度更是超前火爆! 有…

chatgpt源码能商用吗

近年来,聊天机器人技术逐渐成为各个行业的焦点,特别是 GPT 型聊天机器人技术逐步成熟,广泛应用于客服、教育、医疗等领域。这些聊天机器人的开源代码被 widely distributed,如 OpenAI 的 GPT-2、GPT-3,香港科技大学的 …

2023 ChatGPT v3.5 单页html源码

ChatGPT3.5单页版,先发个基础的,带复制功能, 可以设置自己key,查询功能,以及用程序主的key会显示广告等 这个版还有vue版的 ,过会在发 接口自己更换,修改js即可。

chatgpt源码怎么在电脑上运行

近年来,随着人工智能技术的不断发展,聊天机器人成为了一个备受关注的热门话题。GPT模型(Generative Pre-trained Transformer)是聊天机器人中的一种非常流行的模型,有着非常强大的自我学习和交互能力。也有很多开源的G…

ChatGPT API 简单使用教程

1、关于ChatGPT 和 API 获取 2、调用API 实现 ChatGPT 对话 import openaiopenai.api_key "你的api_key"def completion(prompt):completions openai.Completion.create(engine"text-davinci-003",promptprompt,max_tokens1024,n1,stopNone,temperatu…

让小白也能看懂,ChatGPT入门级科普“十问十答”

由于现在GPT火热,360老板已经开始总动员. 白领的日常工作肯定是要发生颠覆性变化的。下面我们就通过自问自答的方式带领小白用户了解一下ChatGPT. 1、ChatGPT到底是什么? ChatGPT 是一个由美国人工智能公司 OpenAI 开发的自然语言处理(NLP&a…

国内版ChatGPT要来了?基于GPT的文本生成一键体验

★★★ 本文源自AI Studio社区精品项目,【点击此处】查看更多精品内容 >>> 项目概述 本项目从零开始构建了一个用于文本生成的语言模型,模型采用Transformer架构,数据集采用网络上搜集到的zhttty的网络小说《无限恐怖》文本&#x…

chatgpt一键生成 PPT

在即将过完的 12 月,相信很多人都在忙一件事:年终工作汇报。就像那句话说的:职场人,不是在做 PPT,就是在做 PPT 的路上…… 职场人苦 PPT 久矣。想做出一份优秀的 PPT,确实难点颇多:要构思亮眼的…

【Java】快速接入ChatGPT API实现聊天、生成图像

目录 申请API秘钥 发请求 发请求响应文本 发请求响应图像 申请API秘钥 访问https://platform.openai.com/ 登录后点击右上角的头像,如图&#xff1a; 获取到秘钥后接下来就开始搞代码啦~ 发请求 添加发请求和解析响应的maven依赖 <!-- https://mvnrepository.com/a…

【免费】微信图片dat转jpg工具(自动区分JPG、PNG、GIF)

楼主之前为了完成一个课程项目&#xff0c;写的一个小程序&#xff0c;之前需要批量转换微信图片的时候&#xff0c;看cadn上有好多源码&#xff0c;但是楼主比较菜&#xff0c;不怎么会用&#xff0c;后来自己写了一个小程序解决普通人使用的痛点&#xff0c;下载下来exe可以直…