大白话谈谈ChatGPT:多点人工,多点智能

对于NLP领域,本人也是门外汉,就是最近了看到的博文,记录自己的一些体会。

 


ChatGPT简介

ChatGPT的全称是"Conversational Generative Pre-training Transformer",中文翻译为"对话生成式预训练转换器"。是一种基于自然语言处理的人工智能模型,由OpenAI团队开发,它是一种基于深度学习的语言模型,专门用于对话系统中,旨在使机器人能够自然地与人类进行对话。

ChatGPT的核心技术是GPT(Generative Pre-trained Transformer)模型,这是一种预先训练的自然语言处理模型,它是通过大规模文本数据集的预训练来学习自然语言的语法、语义和上下文关系,从而使得在新的任务中微调时,能够更加高效准确地进行文本生成、摘要、问答等自然语言处理任务。

大白话解释一下就是ChatGPT是在原有预先训练的大模型的基础上,进行一些“微微”的调整就得到了现在强大的能力。

那具体这个大模型有多大,就得提一下GPT系列,也就是生成式预训练模型。现在GPT系列已经到了GPT-3,GPT-4也在路上了,可以看看这个大模型的参数量。

 

1750亿参数,45TB数据,懂行的不懂行的都能感受到这个大模型是真不小。

那这么多参数,那么多数据,这个大模型岂不是很好了。当然是有不足的,预训练模型自诞生之始,一个备受诟病的问题就是预训练模型的偏见性。因为预训练模型都是通过海量数据在超大参数量级的模型上训练出来的,对比完全由人工规则控制的专家系统来说,预训练模型就像一个黑盒子。没有人能够保证预训练模型不会生成一些包含种族歧视,性别歧视等危险内容,因为它的几十GB甚至几十TB的训练数据里几乎肯定包含类似的训练样本。

换句话说,大数据时代网络上说啥的都有,各种言论都能看到。这些数据也有来自网上收集的,所以大模型很可能看到过这些危险言论,当你问它相关问题的时候,它作为机器可不会“三思而后说”。如果真正要和人们进行多轮交互,什么该说什么不该说就需要好好掂量了。

所以ChatGPT优化的目标有以下三个:

有用的(Helpful),总不能问个问题说出来的都是废话,一点干货都没有

可信的(Honest),不能一本正经的胡说八道

无害的(Harmless),不能有太多危险发言


ChatGPT的优化策略

一句话总结就是:从人类反馈中进行强化学习,先上个图(图为InstructGPT,算法和ChatGPT一致)

大白话版本:

Step 1就是人工标注信息,比如我要给别人解释谁是高启强,那我就找个看过《狂飙》的人,写一段话介绍高启强是如何熟读孙子兵法,然后一步一步做大做强……然后告诉上面提到的那个GPT-3这个大模型,这样模型就认识了高启强。这个新模型就叫SFT

Step 2 就是如果所有的东西都要人工来进行标注提示,那人工成本太大了,那就换一个方式,给刚才微调的模型SFT输入问题得到一些输出答案,人工对这些答案按好坏进行排序重新训练一个奖励模型。毕竟做排序题肯定比做主观题要快(懂的都懂)

比如你问模型:谁是高启强?模型给出你4个回答:A.鱼贩 B.警察 C.好男人 D.黑社会大哥 假设进行人工排序就是D>A=C>B。也就是告诉模型,他是黑社会大哥的概率比较大,以后再见到他你就认为他是黑社会大哥。

这个奖励模型就是说你给我你的问题,你再给我你的输出,然后模型就给他一个分数,这个分数要满足我的人工排序

Step3就是继续去调整前面的SFT模型,使得它生成的答案能够尽量得到一个比较高的分数。就是每次我让SFT生成一个答案,然后丢到第二步里的奖励模型打个分数,然后根据这个分数进行调整,使得它生成的答案分数更高,比如第一次SFT说高启强是警察,因为警察这个答案的分数很低,就像你告诉模型这个答案不对,这样不停的迭代直到模型告诉你高启强是黑社会大哥

第三步使用了强化学习,强化学习简单来说就是试错。举个例子,当我们在玩一款游戏时,我们需要做出一系列的决策才能获得游戏的最高得分。在这个过程中,我们会通过不断的试错来学习什么样的决策能够获得更高的得分。这个过程就类似于强化学习中的智能体与环境进行交互,在每个状态下选择一个动作,从环境中获取一个奖励,然后更新其策略以获得更大的奖励。


 高级版本(涉及到公式和专业术语,可跳过):这是今天在CSDN上看到的一篇文章,讲得挺好,链接放上,顺带复制两张公式图,膜拜大佬

奖励模型损失函数:

强化学习目标函数:

 


总结

其实我个人觉得ChatGPT之所以那么强大可以归结于两句话:

1、大力出奇迹:1750亿的参数量巨大,并且GPT-3本身就具有非常强的泛化能力和生成能力,基于此基础上的ChatGPT“起跑线”就很高。

2、多点人工,多点智能:在对模型进行调整的过程中用到了使用了相应的人工标注作为指导,相当于有了“老师”,相比于原始的GPT简单依靠无标注的数据效果自然会好一些。

当然,ChatGPT也有不足,有时候ChatGPT会给出一些荒谬的输出,虽然ChatGPT使用了人类反馈,但限于人力资源有限。影响模型效果最大的还是有监督的语言模型任务,人类只是起到了纠正作用。所以很有可能受限于纠正数据的有限,或是有监督任务的误导(只考虑模型的输出,没考虑人类想要什么),导致它生成内容的不真实。就像一个学生,虽然有老师对他指导,但也不能确定学生可以学会所有知识点。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/138.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 一统所有 AI 模型入口,四步实现文本分类、图像生成等 24 种复杂任务!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT、GPT-3、GPT-4、text-davinci-003......近两年来,大模型层层出不穷,使人眼花缭乱,在不同的场景下,很多研究人员往往不知该作何选择? …

从 ChatGPT 被挤崩,浅谈如何做入口限流?

作者: 张斌斌:Nacos&Sentinel Committer 最近 ChatGPT 很火,激起了社会广泛关注和学习热潮,记得上次我通宵学习 AI 知识还是 Goolgle 发布最新算法的时候。当时我考虑是不是要转行去搞 AI,不然就有被淘汰的风险&a…

阿里云通义千问官网上线了(阿里版ChatGPT)

阿里版ChatGPT的通义千问上线了,官网:https://tongyi.aliyun.com/ 阿里云的二级域名,你拿到邀请码了吗? 阿里云通义千问邀请码 阿里云通义千问大模型能力测试体验,人工智能语言大模型,还没拿到邀请码的同学…

阿里版 ChatGPT 已进入测试

点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源…

使用openai模块接入chatGPT,无需魔法可直接畅聊

本人早先买了一个外网服务器,闲置没用,最近ChatGPT爆火,突发奇想,是否可以利用外网服务器,搭建服务端网页端来实现国内访问。 说干就干,首先需要准备以下工具: chatgpt API 密钥外网服务器&am…

bing必应引入chatgpt为什么我没看到在哪里?

一、在哪里可以看到 1、主页 打开https://bing.com/ 也就是bing国外的主页,当然国内的主页cn.bing.com还没有chatgpt。可以看到搜索栏变成了一个拉长的对话框 2、搜索页面 大家可以看到在这个栏目会多出一个“聊天”的项目 二、bing的chatgpt是什么效果 三、为什么我…

ChatGPT实用使用指南 让它解你所问

Chatgpt无疑是这几年来影响力最大的AI技术之一,生成式的AI模型正在促进各个行业的效率和自动化发展,Chatgpt对于个人、企业和各个行业都有着一定的影响 在我刚接触的时候,发现对Chatgpt的认知太肤浅了,一个最强的ai聊天机器人摆在…

chatGPT研究-(一)使用入门及Access Denied打不开问题解决

从去年底chatGPT刚出来到现在,除了官方openAI入口外,很多二次包装后的渠道、小程序产品层出不穷,同时包括百度文心一言等自研AIGC产品也是相继推出,感觉大模型研究确实被带火了一把。目前据了解,openAI使用时有很多限制…

Chatgpt详细登录教程

一、准备“梯子” 梯子、科学上网、翻墙,三者是同一个意思。本店没相关科技产品和服务,请用户各显神通。 1. 确认IP 打开跳转入口,看下图 ​ 2.尝试登录 注意,第1点不是必需的,有些设备ip查询会延迟但当下依然能登…

ChatGPT:重新定义搜索入口

ChatGPT是实现模糊搜索到精准推送的跨时代巅峰之作。ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfile.com/f/2501739-805099579-92a952?p2096 (访问密码: 2096) 参考文献: [1]ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfil…

国内版 ChatGPT值不值得上手----PlumGPT测评

前言:什么是PlumGPT(国内版的chatgpt),PlumGPT国内版ChatGPT是一个基于GPT-3.5算法的人工智能聊天机器人,能够通过自然语言与用户交互,提供各种服务和解答各种问题。本文将对PlumGPT国内版ChatGPT进行全面测…

【ChatGPT】还不会用ChatGPT ?快来看看ChatGPT如何为你所用吧——

毫无疑问,ChatGPT 已经风靡全球,推出仅仅一周就拥有了 100 万用户。 OpenAI 推出了这个受欢迎的聊天机器人或语言模型,它可以根据给定的输入生成类似于人类的文本。人们已经用 ChatGPT 生成了几乎各种类型的文本,从论文、诗歌到落地页和网站。 这个聊天机器人还能生成代…

国内版的ChatGPT弯道超车的机会在哪里?

前言 从去年11月最后一天ChatGPT诞生,截至目前,ChatGPT的热度可谓是爆了。众所周知,ChatGPT是美国“开放人工智能研究中心”研发的聊天机器人程序,它是一个人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人…

ChatGPT到底怎么用?

ChatGPT简介 ChatGPT(Chat Generative Pre-trained Transformer)全称为生成型预训练变换模型,由美国 OpenAI团队研发。现如今的ChatGPT不仅可以根据聊天上下文进行交互,还可以进行文学创作、翻译、编写代码等,相信以后…

亲测:Chatgpt国内就能使用,全面支持中文

ChatGPT是什么? ChatGPT是一个基于人工智能技术的聊天机器人网站,它使用了GPT(Generative Pre-trained Transformer)模型来生成自然语言响应。用户可以在ChatGPT上与机器人进行对话,机器人会根据用户的输入生成相应的回…

chatGPT爆火,什么时候中国能有自己的“ChatGPT“

目录 引言 一、ChatGPT爆火 二、中国何时能有自己的"ChatGPT" 三、为什么openai可以做出chatGPT? 四、结论 引言 随着人工智能技术的不断发展,自然语言处理技术也逐渐成为了研究的热点之一。其中,ChatGPT作为一项领先的自然语言处理技术…

如何更好的利用chatgpd 国内

文章目录 前言好用的网站更好的使用AI 前言 当您需要一位聪明、快速、准确地回答问题并提供帮助的伙伴时,您可以考虑ChatGPT。ChatGPT是OpenAI开发的大型语言模型,它可以理解人类语言并以自然的方式回答问题。但由于某些因素,国内无法正常访…

在国内,如何优雅的使用ChatGPT??

ChatGPT 是一个在线的语言模型,可以通过 Web 端访问。 由于中国大陆地区的网络环境和政策原因,访问 Web 端可能会遇到一些困难。 以下是一些可能可行的方法: 1、使用 VPN 通过使用 VPN 可以切换到国外的网络环境,从而访问 Cha…

国内也能畅玩gptchat,游玩攻略分享

看到很多人都不知道怎么玩gptchat,小编就不能忍了,其实要玩chatgpt是非常的简单的,完全是能免费体验chatgpt的强大的。下面我们一起来了解一下国内也能畅玩gptchat,游玩攻略分享。 一.Chatgpt国内为啥能玩 其实现在很多的程序都接…

chatgpt是什么东西?chatgpt在国内能用吗

chatgpt是什么意思? ChatGPT 是一种“以对话方式进行交互”的聊天机器人模型,是一种由 AI 技术驱动的自然语言处理工具,可让您与聊天机器人进行类似人类的对话等等。语言模型可以回答问题并帮助您完成撰写电子邮件、论文和代码等任务。这种类型的生成式…