chatgpt的原理 第二部分

三、GPT-2

自从 Bert 炸街后,跟风效仿的改进模型也就越来越多了,比如 albert、roberta、ERNIE,BART、XLNET、T5 等等五花八门。

 

最初的时候,预训练任务仅仅是一个完形填空任务就可以让语言模型有了极大进步,那么,很多人就想,给 LLM 模型出其它的语言题型,应该也会对模型训练有极大的帮助。

 

想要出语言题型不是很简单么,什么句子打乱顺序再排序、选择题、判断题、改错题、把预测单字改成预测实体词汇等等,纷纷都可以制定数据集添加在模型的预训练里。很多模型也都是这么干的。

 

既然出题也可以,把各种NLP任务的数据集添加到预训练阶段当然也可以。那就把机器翻译、文本摘要、领域问答统统往预训练里加。

 

这个过程也和人脑很像,人脑是非常稳定和泛化的,既可以读诗歌,也可以学数学,还可以学外语,看新闻,听音乐等等,简而言之,就是一脑多用。

 

我们一般的 NLP 任务,文本分类模型就只能分类,分词模型就只能分词,机器翻译也就只能完成翻译这一件事,非常不灵活。

GPT-2 主要就是在 GPT 的基础上,又添加了多个任务,扩增了数据集和模型参数,又训练了一番。

既然多个任务都在同一个模型上进行学习,还存在一个问题,这一个模型能承载的并不仅仅是任务本身,“汪小菲的妈是张兰”,这条文字包含的信息量是通用的,它既可以用于翻译,也可以用于分类,判断错误等等。也就是说,信息是脱离具体 NLP 任务存在的,举一反三,能够利用这条信息,在每一个 NLP 任务上都表现好,这个是 元学习(meta-learning)。本质上就是语言模型的一脑多用。

 

四、GPT-3

大模型中的大模型

首先, GPT-3 的模型所采用的数据量之大,高达上万亿,模型参数量也十分巨大,上千亿,学习之复杂,计算之繁复,不说了。

 

GPT-3 里的大模型计算量是 Bert-base 的上千倍。统统这些都是在燃烧的金钱,真就是 all you need is money。如此巨大的模型造就了 GPT-3 在许多十分困难的 NLP 任务,诸如撰写人类难以判别的文章,甚至编写SQL查询语句,React或者JavaScript代码上优异的表现。

 

之前提到过,GPT-n 系列模型都是采用 decoder 进行训练的,它更加适合文本生成的形式。也就是,模型完全黑盒

27ab1fbee1054df7938b21e18e3f6338.png

 今日学习寄语:

1、要么做第一个,要么做最好的一个。
2、信念和目标,必须永远洋溢在程序员内心。3、最累的时候,家人是你最好的归宿。
4、C程序员永远不会灭亡。他们只是cast成了void。
5、真正的程序员认为自己比用户更明白用户需要什么。
6、退一步海阔天空,这是一种应有的心境。
7、过去的代码都是未经测试的代码。
8、优秀的判断力来自经验,但经验来自于错误的判断。
9、测试是来表明bug的存在而不是不存在。
10、我们这个世界的一个问题是,蠢人信誓旦旦,智人满腹狐疑。
11、一个好汉三个帮,程序员同样如此。
12、看再多的书是学不全脚本的,要多实践。13、无私奉献不是天方夜谭,有时候,我们也可以做到。
14、世界上只有两句真理:1、人一定会死。2、程序一定有Bug。
15、UNIX很简单。但需要有一定天赋的人才能理解这种简单。
16、程序中蕴含着很多的道理,唯有大彻大悟者方能体会其中的奥妙。
17、编程中我们会遇到多少挫折?表放弃,沙漠尽头必是绿洲。
18、做技术一定要一颗恒心,这样才不会半途而废。
19、不要被对象、属性、方法等词汇所迷惑;最根本的是先了解最基础知识。
20、请把书上的例子亲手到电脑上实践,即使配套光盘中有源文件。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11048.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信公众号之接入微信公众号服务器开发(一)

说明:该篇博客是博主一字一码编写的,实属不易,请尊重原创,谢谢大家! 一丶概述 公众号与公众平台 1. 微信账号类型 个人号公众号 订阅号服务号企业号 2. 公众号 微信公众号主要面向名人、政府、媒体、企业等机构推…

记录一次使用JustAuth进行微信公众号的简单扫码登录

前言:由于工作需要对接微信公众号登录,所以就去了解了JustAuth这个依赖,这中间遇到了很多坑,(别笑我)我弄了整整两天… 前置操作 一:安装依赖 <!--JustAuth依赖--><dependency><groupId>me.zhyd.oauth</groupId><artifactId>JustAuth</arti…

当我们在讨论chatgpt的时候,我们在讨论什么

当我们在谈论 ChatGPT 的时候&#xff0c;我们在谈论一种基于人工智能的自然语言处理技术&#xff0c;它能够模拟人类的语言交互&#xff0c;并且可以自动地完成各种自然语言处理任务&#xff0c;如文本生成、文本分类、机器翻译、问答系统等。ChatGPT 的核心是一个基于 GPT-4 …

ChatGPT-5传闻将于2023年底推出,它会实现AGI吗?

人工智能研究实验室OpenAI最近因发布其大型语言模型 (LLM) 的最新版本ChatGPT-4而成为头条新闻。然而&#xff0c;关于 ChatGPT-5 开发的报道已经浮出水面&#xff0c;有传言称 OpenAI 预计将在 2023 年底完成培训。 由于 OpenAI 尚未公开讨论该项目&#xff0c;因此围绕GPT-5 …

ChatGPT也有犯晕的时候

前面测试 ChatGPT 进行写代码、优化代码、解释代码、一般问答都表现的很好。 偷个懒&#xff0c;用ChatGPT 帮我写段生物信息代码 如果 ChatGPT 给出的的代码不太完善&#xff0c;如何请他一步步改好&#xff1f; 代码看不懂&#xff1f;ChatGPT 帮你解释&#xff0c;详细到爆&…

哈工大张民:ChatGPT 之后,NLP 还有 12 个待解决命题

从语言模型角度看&#xff0c;ChatGPT 的天花板非常低&#xff0c;但在触及天花板之前&#xff0c;还有很多红利。 作者丨张民 演讲整理丨李梅 编辑丨岑峰 整理 | AI科技评论 进NLP群—>加入NLP交流群 ChatGPT在产业界掀起商业化与资本狂潮的同时&#xff0c;也给自然语言处…

chatGPT真的会替代掉很多人的工作吗?

来看看ONLYOFFICE中的chatGPT能帮你做些什么 随着人工智能技术的不断发展&#xff0c;Chat GPT等大型语言模型已经具备了相当的语言理解和生成能力。这种技术的发展引发了一些人的担忧&#xff0c;他们担心这些语言模型会取代人类的工作&#xff0c;造成大规模的失业和社会问题…

对标ChatGPT:百度大语言模型 文心一言发布

看了发布会&#xff0c;总体而言感觉中规中矩&#xff0c;当然也显示了一些不错的能力&#xff0c;例如能够生成图片、视频&#xff0c;这是OpenAI目前没有开放的功能&#xff0c;百度给整合了&#xff0c;挺好的。但视频生成功能目前没开放体验&#xff0c;因为运算量太大。 很…

【自然语言处理】【ChatGPT系列】大模型的涌现能力

大语言模型的涌现能力 《Emergent Abilities of Large Language Models》 论文地址&#xff1a;https://arxiv.org/pdf/2206.07682.pdf 相关博客 【自然语言处理】【ChatGPT系列】WebGPT&#xff1a;基于人类反馈的浏览器辅助问答 【自然语言处理】【ChatGPT系列】ChatGPT的智能…

New Bing相关设置与解除聊天次数限制

最近ChatGPT相关的话题很多。之前使用了一下&#xff0c;感觉虽然功能很强大&#xff0c;但是ChatGPT只能查找2021年之前的信息&#xff0c;并且会编造一些虚假信息。例如让其给出一些信息的来源的时候&#xff0c;就会胡乱编造。 1. New Bing的优势 New Bing是ChatGPT的升级…

教育学研究生,我们能用ChatGPT这类AI工作做什么?

ChatGPT来了&#xff0c;在世界范围内引起了极大的震动&#xff0c;有人说这会引起“iPhone效应”&#xff0c;就是像iPhone发布一样成为一个划时代的标志。体验过ChatGPT3.5&#xff08;没买会员&#xff0c;用不了4.0&#xff09;、与ChatGPT同一个微软爸爸的新必应&#xff…

Github骚操作绑定中国+86手机号码实现两步验证

在GitHub上绑定手机号码时候&#xff0c;发现没有中国手机号码的选项&#xff0c;原因是国内手机号码接收到短信的成功率低&#xff0c;所以官方就直接去掉了。 事实上我们可以使用一些手段让他显示&#xff0c;修改网页的元素。 这就有了。 此时输入你的中国手机号码&#xff…

小型中文版聊天机器人

入门小菜鸟&#xff0c;希望像做笔记记录自己学的东西&#xff0c;也希望能帮助到同样入门的人&#xff0c;更希望大佬们帮忙纠错啦~侵权立删。 目录 一、简单介绍与参考鸣谢 二、数据集介绍 三、数据预处理 1、重复标点符号表达 2、英文标点符号变为中文标点符号 3、繁…

【Chatbot】2:中文聊天机器人的实现

前言&#xff1a; 上一篇【聊天机器人】1&#xff1a;DeepQA使用自己的数据集做chatbot上传后&#xff0c;收到了好多伙伴支持&#xff0c;在这里表示感谢。上一篇也遗留了一个问题——介于DeepQA是一个以英文语料为场景的聊天机器人&#xff0c;在中文场景应用中得到的结果却…

【chatGPT4结对编程】chatGPT4教我做图像分类

开始接触深度学习 大语言模型火了之后&#xff0c;我也想过是否要加入深度学习的行业当中来&#xff0c;一开始的想法就是AI大模型肯定会被各大厂垄断&#xff0c;我们作为普通应用型软件工程师直接调用api就完事&#xff0c;另外对自己的学历也自卑(刚刚够线的二本&#xff0…

对比体验 ChatGPT,聊聊文心一言的优缺点

在昨天文心一言发布后&#xff0c;我第一时间拿到了体验的资格&#xff0c;但第一次使用后却不禁有些失望。他的逻辑能力极度缺乏、创造力也差点意思。不过&#xff0c;今天再次高强度使用后&#xff0c;却又让我对这款产品的想法有了些许改变。 前言 将 2023 年称为 AI 纪元…

聊聊 ChatGPT 的逻辑架构与赚钱模式

先讲讲 ChatGPT 这一波 AI 浪潮的技术架构&#xff0c;再聊聊一些已经被市场验证可行的个人盈利模型。 一图胜千言&#xff0c;上图囊括了当下 AI 生成式逻辑&#xff0c;不管哪个产品、框架还是产品都可以找到自己的位置&#xff0c;抽象出来后跟一般的技术架构也没什么两样&a…

ChatGPT-4:恐怖的AI再度进化,可识别图像内容

近日&#xff0c;OpenAI公司发布了一款新的AI技术——ChatGPT-4&#xff0c;它是一种基于自然语言处理的深度学习模型&#xff0c;可以识别图像内容并生成相应的文字描述。ChatGPT-4的发布&#xff0c;标志着人工智能技术再度进化&#xff0c;令人恐惧。 ChatGPT-4是OpenAI公…

ChatGPT再度封号; 英伟达市值暴涨超2000亿美元

&#x1f680; 英伟达市值暴涨超2000亿美元&#xff0c;或将成为第一家市值破万亿美元的芯片公司 摘要&#xff1a;英伟达市值在一天内暴涨超2000亿美元&#xff0c;即将成为第一家市值破万亿美元的芯片公司。这一涨幅创下历史最大单日涨幅纪录&#xff0c; 背后原因是英伟达…

百川智能发布开源中英文大模型;GitHub调查显示92%的程序员使用AI编码工具;第一季度中国云服务支出增长6%丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 百川智能发布开源中英文大模型 6月15日&#xff0c;百川智能公司推出了70亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B在C-Eval、AGIEval和Gaokao中文权威评测榜单上&#xff0c;超过了ChatGLM-6…