ChatGPT原理剖析-李宏毅

ChatGPT原理剖析-李宏毅

news/2024/12/26 14:03:58/文章来源:https://blog.csdn.net/weixin_45444387/article/details/131877811

ChatGPT原理剖析

ChatGPT原理剖析2_2

ChatGPT分为三个部分

1.Generative,Pre-trained,Transformer

2.以往的机器学习是根据成对的例句，通过大量成对的例句找出规律，可以理解为找出了某个函数

3.如果让人类来制造例句的话，效率会比较低，并且成本会很高，因此这里开始使用互联网的数据进行监督学习，并根据互联网上的讯息总结为某个函数

在这里插入图片描述

###

4.在收集了足够多的数据后，就可以基于这些数据来回答问题，基于算法来做文字接龙了

在这里插入图片描述

GPT的参数以及规模

1.GPT-3的参数量是175Billion，数据集是570GB这个数据量相当于是将哈利波特全集读了30万遍，一套哈利波特的文字量大约是150万字。可见GPT使用的数据有多大，并且570GB还只是GPT从所有数据45T中选取的一部分

完整的流程

这里解释了整个流程预训练->监督学习->强化学习，我们需要前期给到足够多的例句让GPT有基本的文字接龙的能力，在通过人类老师的监督学习，这里GPT->ChatGPT这里就是Finetune(微调)使其能达到更好的效果，在最后一步就是强化学习(Reinforcement Learning)，通过打分机制来告诉ChatGPT回答的好不好，以提升ChatGPT的效果。

1.这里为什么要进行预训练呢，这里对其进行了解释，在多种语言上进行预训练后，只要教某一种语言的一种任务，就能达到比较好的效果。

###

2.这里举了一个例子在是否做了预训练后，通过中文进行微调，做中文的测试，效果会比没有做预训练的模型效果要好。

###

ChatGPT原理剖析2_3

ChatGPT带来的研究问题

1.如何精准提出需求

和人一样，如果没有精准的表达内容，聆听者是没有办法知道你所想表达的意思的，ChatGPT也是一样，我们需要表达让它听的懂得内容，这样它才能较好的给到我们反馈，而这个过程称为Prompting

2.如何更正错误

ChatGPT数据只更新到2021年，所以它对之后的事情并不知情(当然现在有很多可以联网的插件可以用)，这里李宏毅老师在得到不准确的数据后，告诉ChatgGPT 最近的世界杯足球赛冠军是阿根廷。但我们可以想象，如果告诉ChatGPT错误的答案会不会影响ChatGPT的反馈结果，这里就有一个研究方向是Neural Editing。

3.侦测AI的物件

这里举了一个例子通过人写的内容和AI生成的内容对照，寻找两者之间的区别。但这似乎没这么简单。最近有听说Sam Altman也是在寻求找到区分人类和AI内容的方法。

4.如何保护不想上传到互联网的内容

在李宏毅老师搜寻自己住哪里的时候，开始ChatGPT是直接回答不知道的，但是当绕着弯让其扮演自己一定知道李宏毅住在台湾某个地方的时候，AI还是提供了一个地址，这里就对于隐私保护就蛮重要的，因此也诞生了一项新的研究Machine Unlearning。

ChatGPT是怎样炼成的-GPT社会化的过程

ChatGPT和instructGPT非常像，区别仅仅在于ChatGPT是在GPT3.5的基础上fine-tune，而instructGPT是在GPT3.0基础上fine-tune

1.由于每个文字出现的概率不同，所以GPT每次抽取出的文字是不同的，因此最终输出的内容也是不同的。

2.通过对InstructGPT的论文，可以看出不用给到GPT所有的数据，它具备泛化的能力，不过我们需要给到GPT一些范例，让其知道人类的喜好，以便其能按照需求回答人类的问题

3.需要训练一个老师模型(老师模型知道人类的偏好)，来告诉GPT，回答的哪些答案是比较好的答案，打出一个分数，以便于它能有更高的概率回答出更好的答案

4.这里将问题和答案给到teacher model，她会有打分，经过reinforce learning 再给到GPT，这样就有了ChatGPT.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/55157.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

云数据库技术行业动态：ClickHouse Cloud正式GA或有融资；openGauss社区引入新成员

云数据库技术行业动态：ClickHouse Cloud正式GA或有融资；openGauss社区引入新成员

行业动态 ClickHouse Cloud正式GA，同时，B轮融资得到进一步增加这是由ClickHouse官方推出云服务，启用新域名：clickhouse.cloud ，类似于MongoDB的Atlas服务。目前支持在AWS构建，从Roadmap看，很快…

阅读更多...

【数值分析】用幂法计算矩阵的主特征值和对应的特征向量（附matlab代码）

【数值分析】用幂法计算矩阵的主特征值和对应的特征向量（附matlab代码）

题目用幂法计算下列矩阵的按模最大特征值及对应的特征向量幂法代码 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % 简介：用幂法计算矩阵的主特征值和对应的特征向量 % 作者：不雨_亦潇潇 % 文件：mifa.m % 日期：20221109 % 博…

阅读更多...

计算两个对应点集之间的旋转矩阵R和转移矩阵T

计算两个对应点集之间的旋转矩阵R和转移矩阵T

这篇文章的相应数学推到在这个地方，有兴趣的可以瞧一瞧计算两个点集合的旋转矩阵R和T的数学推导假设有两个点集A和B，且这两个点集合的元素数目相同且一一对应。为了寻找这两个点集之间的旋转矩阵 R R R和转移矩阵 t t t。可以将这个问题建模成如下的公式…

阅读更多...

diag矩阵(Diag矩阵计算公式)

diag矩阵(Diag矩阵计算公式)

A＝diag(a1,a2..an)是表示对角矩阵吗？书上没有明确? 是的,其中ai表示在第i行第i列的数是ai,其余都是0 对角行列式的读法对角行列式(对角矩阵的行列式)可记为-diag( 对所有的数学符号都要考虑音(读),形(写),意(内涵), 其中读和写都是为了记载和交流, |d…

阅读更多...

澳洲将推新支付系统实现跨行实时转账

澳洲将推新支付系统实现跨行实时转账

澳洲准备在国庆日（Australia Day）后推出新支付系统，实现不同银行间实时转账，有望淘汰BSB电汇清算网络编码。据《悉尼先驱晨报》报道，2012年时，澳洲对支付基础设施进行了审查，促使新支付平台…

阅读更多...

LinuxUnix time时间戳的处理转换函数

LinuxUnix time时间戳的处理转换函数

linux下的时间函数我们在编程中可能会经常用到时间，比如取得系统的时间（获取系统的年、月、日、时、分、秒，星期等），或者是隔一段时间去做某事，那么我们就用到一些时间函数。 linux下存储时间常见的有两种…

阅读更多...

澳洲最热门职业，护士排第一，医生竟然不如程序员？

澳洲最热门职业，护士排第一，医生竟然不如程序员？

2022澳洲最新的职业紧缺名单出炉了，令人惊讶的是护士竟然排行第一名，可见澳洲的医疗人力资源紧缺的问题。既然人力资源紧缺，那么首当其冲的医生作为高学历且同属医疗行业的代表理应收到重视，然而令人意外的是，通过榜单…

阅读更多...

走出腾讯和阿里，大厂员工转型记

走出腾讯和阿里，大厂员工转型记

击上方“码农突围”，马上关注，每天早上8:50准时推送真爱，请置顶或星标编辑 | 熊腿腿作者 | 婷婷的勇敢世界脉脉研究院的《人力迁徙：2019》显示，过去的一年里，互联网公司出来的人，大部分…

阅读更多...

澳洲社区宜居指数：首都第一西澳垫底

澳洲社区宜居指数：首都第一西澳垫底

澳洲一向被认为是充满安宁与希望的土地，然而社区相关数据可能颠覆这一看法。首都领地社区宜居程度被评为全澳第一（澳洲新闻集团图片） 据澳洲新闻集团报道，澳洲社区理事会（Community Council for Australia&#xff09…

阅读更多...

你是如何转行的？转行容易吗？

你是如何转行的？转行容易吗？

你是如何转行的？转行容易吗？ 没考上大学，也不喜欢复读。特别不喜欢父母从小说的，考不上大学没有出路的说法。所以心里头一直想的就是，考不上大学有什么大不了的。但是什么都不会，于是读了个自考。电…

阅读更多...

澳洲游戏市场分析

澳洲游戏市场分析

一、全球游戏市场概览 1.1 全球游戏市场规模逐渐扩大，2020年游戏利润可达800亿美元全球游戏市场规模保持逐年扩大的趋势。2020年预计全球游戏市场份额将达到1593亿美元。据Deloitte的《2020科技、传媒和电信行业预测》，2020年智能手机增值营收的前三大来源为手机广告、应…

阅读更多...

澳洲大火可视化

澳洲大火可视化

前言小编找到一些数据，在接下来的文章中可能会连续推出几篇数据分析可视化的，大概十几个项目吧，数据集来自【凹凸数据】这个公众号的文章的推荐: https://mp.weixin.qq.com/s/j2dnxFaO1WYVJJAkBg_Hxg 这次我们来做一个澳洲大火可视化的案例…

阅读更多...

澳洲服务器拳头账号怎么注册,云顶之弈手游澳服账号怎么注册澳洲服拳头账号注册方法分享...

澳洲服务器拳头账号怎么注册,云顶之弈手游澳服账号怎么注册澳洲服拳头账号注册方法分享...

云顶之弈手游澳服账号怎么注册澳洲服拳头账号注册方法分享 2020-02-10 18:25 作者：佚名来源：本站整理浏览：17932 评论：1 云顶之弈手游版最近在澳洲上线了，很多玩家想要提前体验却不知道该怎么注册账号，下…

阅读更多...

澳洲语言成绩等级c,D比C好—说说澳洲的学位成绩分几等

澳洲语言成绩等级c,D比C好—说说澳洲的学位成绩分几等

原标题：D比C好—说说澳洲的学位成绩分几等澳洲的成绩，三言两语道不尽。即便是学霸拿着全班第一的成绩单，不解释一番只怕别人也要一头雾水。那么，扑朔迷离的澳洲成绩等级究竟面目如何？一张表格道尽全部。图中可以看出…

阅读更多...

「转行人工智能」是否前景一片光明？

「转行人工智能」是否前景一片光明？

「转行人工智能」是否前景一片光明？ https://mp.weixin.qq.com/s/ZHmMvIemM9tqUwA4LdlxVw 知乎科技板块上有一类问题经久不衰：xxx是否可以转行做AI？代表性的问题有： 锅炉设计转行 AI，可行吗？28岁女孩想转行…

阅读更多...

计算机澳洲博士后要考雅思么,博士后移民澳大利亚（澳洲做科研博士后）

计算机澳洲博士后要考雅思么,博士后移民澳大利亚（澳洲做科研博士后）

我是哈尔滨工业大学的博士在读，想毕业后去澳洲读博士后或者找工作移民， 你的条件是可以的，只要你到时候找的工作在澳洲移民局列出的工种之内就可以办理移民。总的来说你如果在那边博士毕业了之后留下来是非常容易的。可以的，并不…

阅读更多...

澳洲语言成绩等级c,澳洲本科成绩等级介绍怎么划分的

澳洲语言成绩等级c,澳洲本科成绩等级介绍怎么划分的

想去澳洲留学本科，就要了解澳洲本科的一些情况，特别是成绩方面的，只有了解清楚才能顺利的通过考试最后拿到毕业证。那你知道澳洲跟国内的的成绩等级跟划分标准与国内是完全不一样的吗，今天就让蔚蓝留学的老师带大家了解一下澳洲本…

阅读更多...

澳洲计算机专业几年,澳洲计算机硕士几年

澳洲计算机专业几年,澳洲计算机硕士几年

澳洲计算机硕士几年计算机硕士学制根据学校的课程不同安排有所区别，一般是1.5-2年时间。澳洲计算机硕士前景在澳洲留学的专业选择中，计算机专业一直是仅次于会计专业的最热门专业之一，也是热门的移民专业之一。据立思辰留学360介绍&#x…

阅读更多...

企业数字化转型技术盘点及趋势展望

企业数字化转型技术盘点及趋势展望

作者 | 张家驹出品 | CSDN（ID：CSDNnews） 数字化转型是指采用数字技术将非数字产品、服务或运营数字化，其实施目标是通过创新、发明、提升客户体验或效率来增加价值。回顾历史，数字化曾特指使用模数转换器将模拟信息转…

阅读更多...

因果推断类问题探索实践

因果推断类问题探索实践

作者 | 陆春晖出品 | CSDN（ID：CSDNnews） 近些年来，随着机器学习和深度神经网络等人工智能技术的高速发展，人们对数据的理解和应用不再仅仅满足于拟合的准确性，而是开始探索数据内部更深层次的逻辑关…

阅读更多...

最新文章

推荐文章