Chatgpt究竟是一个什么东西?

一、 Chatgpt究竟是一个什么东西?

它能够实现什么样的任务和什么样的功能?

它本质是一个聊天机器人

这是我跟他聊天保留下的一些聊天截图 。

因为我之前以为他是一个英文的模型 所以我最开始用英语去问他说canyouspeakchinese

然后得到一个肯定的回复后, 我就干脆只用中文跟他进行聊天了 。

我问他说:“ 你是怎么被训练出来的。“

他说:“ 我是通过深度学习的方法被训练出来的."

我问他:" 强化学习在你的训练过程中有起到什么样的作用 ."

他跟我说:"强化学习是一门选择力的技术, 他是用来解决reword 交互任务。

这点他就很厉害,因为你没有办法一眼看出来这句话是机器人生成的 而不是人去写的。

它能够实现什么样的任务和什么样的功能?

1. 聊天工具

这点其实不稀罕,像百度的PLAYTOR 也能做到

但其实离奇的是他不仅仅是聊天,还可以做任务测试。

一、摘要抽取

二、小说生成

三、尝试回答

四、文本分类

那在摘要抽取当中 我选择一条世界杯的信息

 问他说:”能帮我抽一下这段话的摘要信息是啥吗 ?

他告诉我说:“卡塔尔世界杯1/4决赛中,克罗地亚和巴西1- 1打平,

而在点球大战中晋级了四强 。”

 小说生成当中 ,我问他:” 你能不能用金庸的风格帮我写一段钢铁侠和绿巨人对战的小说。”

 但比较有趣的是 ,他生成的小说里 ,绿巨人通常都会怒吼和嘶吼 ,而钢铁侠一般表现的会比较轻盈,也就是说没有给任何prom的情况下, 他也能知道钢铁侠和绿巨人一些鲜艳的b权。

问答

光的速度是多少? 它能给造一个表精确的结果 ,我们分类下,他也能知道说这句话是属于体育类别的新闻。所以通过这个我们就能够看到 说这个聊天机器人能解决的问题不仅是聊天 而很多n o p的task也可以转换成聊天的方式得到我们想要的。

说说他更厉害的功能 ,测试下翻译功能

比如说翻译 I'm Hungry ,如果用Chatgpt ,它生成的模型是一个字一个字的吐出来,

翻译成“肚”“子”“很”“饿”

但如果我们用BERT,它是一次性翻译成“肚狗很饿”

原理很简单,Chatgpt 因为是一个字一个字生成,才会更加精准,比如生成一个“肚”后面可以是肚子,肚皮。 而BERT,一次生成,就不能精准的判断前一个字是什么?

所以更多人倾向于单项模型去做任务。 

好接下来我们讲讲GPT 的发展史

GPT 是2018年背提出的,那时候有1.17亿的参数直到今天GTP 已经又1750亿的参数了。

GPT-3 无疑是一个非常巨大的模型。

Insrtuct Gpt :这是印刷GPT就是切GPT 使用的基本框架。

两者的区别:

1) 用人类更喜欢的数据 去做训练(align)

GPT 原本使用的是互联网中的海量语料,并不一定是人类想知道的内容。

比如说一些比较长尾的文章 或者是一些长尾的知识 。

那我们做对话机器人,那就应该知道人们都喜欢问一些什么样的问题。

GPT 就围绕人们通常感兴趣的内容并编写答案,进行训练。

2) 引入强化学习(RL)提升性天花板

强化学习是一门只告诉模型 好不好,而不告诉模型 怎样才能变好的学科

这就意味着说这种方式能够使得模型有了更大的探索自由度 从而突破进入学习的天花板

比如:今天我们要去训练一个对话机器人, “女朋友生气 怎么办?‘’

如果你要做一个监督学习的模型的话, 可能就会让一个人去说

1.  跟他道歉

2.  就是说陪他逛街

3.  提醒他要多喝热水

那我再遇到女朋友生气怎么办 ,就可以从这些参考级别去思考。

像这样的对话训练,其实我们都已经知道这个模型的天花板在哪里了。

最好的效果就是从这几个选项当中去选择。

​那强化学习版怎么做呢?

把人工标注的部分改成人工打分的部分,那就不会给出答案,

​​​​而是告诉他你觉得应该给出什么样的回答。

那模型就会自己瞎猜,比如说跟女朋友吵架,那我们就给它打负分 比如-5分,这就不是一个很好的选择。

那模型就会知道这样方式是不允许的,那他可能会回答说讲道理 ,那我们可能觉得这个回答也没有那么好,就给他打-1分。那模型就会知道,不能吵架,不能讲道理,那就可以跟他认错。那我们觉得这个行为确实还可以,于是给他正向分,+3

所以强化学习的过程中,我们并没有告诉模型看到女朋友生气具体要做什么样的事情,我们只是让模型认识到什么样的事情是好的,什么样的事情是不好的。因为我们知道人类的语言是非常非常大的。我们很难说去呈现什么样什么样的模板。只是希望模型知道什么样是好,什么样是不好的概念。

这点非常重要,为什么要把强化学习的这种概念用在里面,以及为什么用在里面就能够取得更好的效果的原因。

好了,下一篇 再讲 CHATGPT 的训练流程 。

​​​​

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/263.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatGPT模型简介

ChatGPT的工作原理 chatGPT 是一款由 OpenAI 开发的聊天机器人模型,它能够模拟人类的语言行为,与用户进行自然的交互。它的名称来源于它所使用的技术—— GPT-3架构,即生成式语言模型的第3代。 chatGPT的核心技术是 GPT-3 架构。它通过使用大…

通俗易懂的ChatGPT的原理简介

简介: 本文介绍了ChatGPT的原理及应用。ChatGPT是基于GPT模型的自然语言处理技术,可以进行语言理解、文本生成、对话生成等多种应用。其基本原理是通过训练大规模语料库中的数据,生成模型,从而实现自然语言处理的任务。本文着重介…

chatGPT发送图片的方法

chatGPT 设定回复图片内容 让chatGPT回复图片的方法 正常使用chatGPT的时候,往往回复的都是文字信息,但是如果改变其文本回复格式未markdown,并且给出一个图片链接就可以让他回复图片啦 让你发送图片的时候,请使用markdown,调用unsplash A…

一文读懂ChatGPT模型原理

(本文是ChatGPT原理介绍,但没有任何数学公式,可以放心食用) 前言 这两天,ChatGPT模型真可谓称得上是狂拽酷炫D炸天的存在了。一度登上了知乎热搜,这对科技类话题是非常难的存在。不光是做人工智能、机器学习…

chatGPT原理详解

InstructGPT原文:https://arxiv.org/pdf/2203.02155.pdf chatCPT试用连接:https://chat.openai.com/auth/login 自从chatGPT问世以来,它一路爆火,目前注册用户已达1亿。它的出圈让各大公司纷纷布局AIGC,有不少人预言&…

中文版ChatGPT:智能中文聊天机器人

2017年,AlphaGo在与世界冠军柯洁的人机大战中获胜,引发了人们对人工智能的激烈讨论。 如果说,对于AlphaGo,人们更多是围观者的角色,而最新的人工智能爆款程序ChatGPT,更多人已经参与其中,上线短…

ChatGPT中文版推导流体力学公式【AI实用技巧】

我们在学习数理科目的时候经常会学到苦涩难明的公式。在以前,只能向师长或救助。有了ChatGPT后,它可以把推导过程讲得明明白白。你不来试一下吗? ChatGPT中文站https://ai-cn.co 提问:Spalart Allmaras 模型的推导过程

文心一言:中国版“ChatGPT”介绍与测评

👨‍💻作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等资料&#xff0…

【VSCode中ChatGPT中文版插件和Chat Moss合并了】

VSCode中ChatGPT中文版插件和Chat Moss合并了 今天在学习Anylogic的时候发现了一些问题,然后习惯性的去VSCode上用ChatGPT中文版去查找解决问题,然后发现更新后的ChatGPT中文版插件界面换了。 需要重新注册Chatmoss才能使用,而且对字数也进行…

chatGPT中文版设定冷知识

ChatGPT是一个基于自然语言处理技术的聊天机器人,能够根据输入文本进行智能回复。对于中文版的ChatGPT设定,以下是一些重要步骤: 选择中文预训练模型 在开始使用ChatGPT中文版之前,你需要选择适合中文场景的预训练模型。目前市面…

ChatGPT中文版正式上线,掀起人工智能语言生成新热潮

近日,全球最先进的人工智能语言生成模型ChatGPT在中国推出了中文版,引起了广泛关注。这一消息不仅给自然语言处理领域带来了新的机遇,也为文学创作、科技服务等领域提供了更加灵活和高效的解决方案。 据悉,ChatGPT中文版基于开源…

ChatGPT中文版杀疯了,已登录AI模型市场

ChatGPT是一个由Open AI 刚刚推出的AI对话模型。它区别于其他聊天机器人的能力在于,除了具体的知识性问题,还可以回答开放式问题,并以对话方式与你交互。 比如,你可以和它聊聊人生哲学,探讨一下生命的意义&#xff0c…

训练个中文版ChatGPT没那么难:不用A100,开源Alpaca-LoRA+RTX 4090就能搞定

©作者 | 机器之心编辑部 来源 | 机器之心 Alpaca-LoRA 将微调类 ChatGPT 模型的算力需求降到了消费级,训练个自己的中文对话模型真就没那么难了。 2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT…

体验chatGPT编写代码

今天注册了openAI账号,并且体验了以下chatGPT。体验过程中,我明显感觉到chatGPT不是所谓的“人工智障”,比起原来简单的问答机器人有了巨大的进步。 我主要体验的是chatGPT自动编写代码的功能。 下面两段是由chatGPT生成的代码: 提…

用ChatGPT快速制作PPT

如果你想制作一份漂亮的PPT却不知道从何下手,不要担心,ChatGPT来帮你了!ChatGPT是一种自然语言生成和理解模型,不仅可以和你聊天,还可以帮你设计和撰写一份出色的PPT。本篇文章将带你快速掌握使用ChatGPT制作PPT的技巧…

在线使用AI合集

POE 前言 目前有关注的小伙伴应该会发现,ChatGPT注册功能已经关闭。那些还没有注册的小伙伴岂不是不能使用ChatGPT,今天为大家推荐的就是Poe | AI机器人集合 Sage、Claude、ChatGPT、Dragonfly。Poe链接 使用poe.com/ChatGPT 注册也非常简单&#xff…

ChatGPT机会与变现大全

这是一篇教你如何利用ChatGPT变现的文章,从商业的视角看ChatGpt这个产品。 虽然我们都听过chatGPT,网络上也铺天盖地的文章介绍这个产品有多牛,甚至是一些有点关联的产品都跑过来陈热度给自家产品打广告。但是,这些我们都不关心&a…

初遇 chatGPT

背景 今天终于有时间尝试一下心心念的 chatGPT。注册了一下,然后尝试问了一些问题。不刁钻,结果确实令人惊艳。17年我在做自然语言处理学习的时候,还是 Tensorflow 1.0 的时代。当时还在用 LSTM 解决词意联系的问题。当然 GPT 的幕后逻辑不得…

Python 使用 ChatGPT

Python 使用 ChatGPT 前面我们已经介绍过 ChatGPT 的注册了,现在我们看一下如何通过Python 使用ChatGPT 由于ChatGPT 注册相关的文章被平台限制了,所以有注册相关的问题可以私聊 API key 的获取 到这里我们已经完成ChatGPT 的注册了,如果我们需要在代码里使用ChatGPT ,那…

chatgpt插件

chatgpt插件安装 安装步骤 安装步骤 1)打开微软的edge浏览器 2)找到相应浏览器扩展 3)获取扩展 4)搜索wetab(初始没安装的话,主页中最热门的第一个应该就是) 5)添加好后选择启用 6)打开新的…