大致聊聊ChatGPT的底层原理,实现方法

文目录

  • 深度学习基础
  • ChatGPT的本质
  • ChatGPT原理详解

一、深度学习基础

— 深度学习是什么?如何理解神经网络结构?

关于生物神经网络结构如下:

神经网络介绍

人工神经网络( Artificial Neural Network, 简写为ANN)也简称为神经网络 (NN), 是一种模仿生物 神经网络结构和功能的计算模型。

当电信号通过树突进入到核细胞时,会逐渐聚集电荷。达到一定的电位后,细胞会被激活,通过轴突发出信号。

从大脑的神经元抽象得到的模型的数学表示:

第一个感知机模型

如果学习参数w

通过误差反向传播更新参数。

神经网络发展经历

神经网络中信息只想一个方向移动,即从输入节点向前移动,通过隐藏节点,再向输出节点移动。其中基本部分是:

1. 输入层: 即输入 x 的那一层

2. 输出层: 即输出 y 的那一层

3. 输入层和输出层之间都是隐藏层

1.确定神经网络层数

(1)输入层和输出层仅有一层,隐层有多层

2.确定每层单元的个数

(1)输入层单元个数根据输入数据个数定

(2)输出层单元个数根据目标分类个数确定

(3)隐层的单元个数如何确定?

• 神经网络介绍

=>隐层个数设定没有明确规则,根据准确度来进行判断和改进。

ChatGPT是在GPT基础上进一步开发的NLP模型

Generative Pre-trained Transformer( 生成式训练模型)

ChatGPT是基于GPT-3的优化实现版本

二、ChatGPT本质

2022年11月30日,OpenAI的CEO,Altman在推特上写道:“今天我们推出了ChatGPT,尝试在这里与它交谈”, 然后是一个链接(https://chat.openai.com/auth/login),任何人都可以注册一个帐户, 开始免费与 OpenAI的新聊天机器人ChatGPT交谈。

ChatGPT是由OpenAI开发的一种大型预训练语言模型, 其和人类沟通的方式为人机对话形式

这个时候,我们可以思考两个问题。机器如何判断一条输入句子的合理性?机器的回复是否是人类可以理解的或者是人类习惯在日常生活中习惯表达的。

什么是语言模型?

通俗理解:判断一个句子序列是否是正常语句, 即是否是人话.

标准定义:对于某个句子序列, 如{W1, W2, W3, …, Wn}, 语言模型就是计算该序列发生的概率, 即P(W1, W2, …, Wn). 如果给定的词序列符合语用习惯, 则给出高概率, 否则给出低概率

N-gram语言模型

为了解决上述问题, 引入马尔科夫假设:随意一个词出现的概率只与它前面出现的有限的一个或者几个词有关

如果一个词的出现与它周围的词是独立的, 那么我们就称之为unigram(一元语言模型).

如果一个词的出现仅依赖于它前面出现的一个词, 那么我们就称之为bigram(二元语言模型).

如果一个词的出现仅依赖于它前面出现的两个词, 那么我们就称之为trigram(三元语言模型)

一般来说, N元模型就是假设当前词的出现概率只与它前面的N-1个词有关, 而这些概率参数都是可以通过大规模语料库来计算的。

在实践中用的最多的就是bigram和trigram

bigram语言模型

举例说明:

首先我们准备一个语料库(简单理解让模型学习的数据集),为了计算对应的二元模型的参数, 即

P(Wi|Wi-1),我们要先计数即C(Wi-1, Wi),然后计数 C(Wi-1),再用除法可得到概率.

为了方便理解,了解P(A|B) 公式如下:

举例说明:

首先我们准备一个语料库(简单理解让模型学习的数据集),为了计算对应的二元模型的参数, 即

P(Wi|Wi-1),我们要先计数即C(Wi-1, Wi),然后计数 C(Wi-1),再用除法可得到概率.

C(Wi-1,Wi) 计数结果如下

C(Wi-1)的计数结果如下:

那么bigram语言模型针对上述语料的参数计算结果如何实现?假如,我想计算P(想|我)=0.38, 计算过程如 下显示: (其他参数计算过程类似)

如果针对这个语料库的二元模型(bigram)建立好之后, 就可以实现我们的目标计算:

C(Wi-1)的计数结果如下:

那么bigram语言模型针对上述语料的参数计算结果如何实现?假如,我想计算P(想|我)=0.38, 计算过程如 下显示:(其他参数计算过程类似)

如果预测:我想去打乒乓球?引入拉普拉斯变化。

神经网络语言模型

ChatGPT的本质

GPT-1(1.17亿参数)

GPT-1有一定泛化能力,能够用于和监督任务无关的 NLP 任务中

GPT-2(15亿参数)

除了理解能力外,GPT-2在生成方面表现 。非常好:阅读,摘要,聊天,编故事;

GPT-3(1750亿参数)

GPT-3实现将网页转化为相应代码、模仿人 。类叙事、创作定制诗歌、生成游戏剧本。InstructGPT是一个经过微调的GPT-3,实 现更好的输出将人类的反馈纳入训练过程,更好地使模 型输出与用户意图保持一致

三、ChatGPT原理详解

GPT-3原理初探

目前基于ChatGPT的论文并没有公布, 因此接下来我们基于openai官网的介绍对其原理进行解析

目前基于ChatGPT的论文并没有公布, 因此接下来我们基于openai官网的介绍对其原理进行解析

原始的GPT-3就是非一致模型, 类似GPT-3的大型语言模型都是基于来自互联网的大量文本数据进行训练, 能够生成类似人类的文本, 但它们可能并不总是产生符合人类期望的输出.

ChatGPT为了解决模型的不一致问题, 使用了人类反馈来指导学习过程, 对其进行了进一步训练. 所使用的具体技术就是强化学习(RLHF). ChatGPT是第一个将此技术用于实际场景的模型

强化学习(RL)

  • 强化学习又称再励学习、评价学习或增强学习。
  • 是机器学习的一个重要分支,主要用来解决连续决策的问题。
  • 围棋可以归纳为一个强化学习问题,需要学习在各种局势下如何走出最好的招法。
  • 用于描述和解决智能体(Agent)在与环境的交互过程中, 通过学习策略以达成回报最大化或实现特定目标的问题。

理解强化学习基本要素

如何让AI实现自动打游戏

强化学习和模型的关系

一个游戏里记录每一步的状态和行动:T={s1, a1, s2, a2, s3, a3, ..., st, at}

ChatGPT强化学习步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10405.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互发短信之SmsManager

短信管理器 : SmsManager 1. 在 Android 2.0 以前 应该使用 android.telephony.gsm.SmsManager 之后应该用 android.telephony.SmsManager; 2. 获取系统默认的短信管理器 SmsManager smsManager = SmsManager.getDefault(); 3. 按照每条短信最大字数来拆分短信 List<S…

手机号短信验证码接口

1.1 注册账号 https://www.yuntongxun.com/user/login 1.2 登录即可看到开发者账号信息 1.3 添加测试账号 2.使用容联云发送代码测试 1. 安装容联云sdk pip install ronglian_sms_sdk # 免费测试文档地址:https://doc.yuntongxun.com/p/5a531a353b8496dd00dcdfe22. 短信发送…

sms收发手机短信

这几天在试VS2005里面的SerialPort 类,这个类主要功能是串口通信,以前没接触串口这方面的知识,一开始还比较吃力,还好现在清楚了大半利用这个类做了一个sms收发手机短信的demo,我又重新把这个类封装了下,里面增加了PDU编码和解码的方法,这样可以直接调用封装后的类发送和接收中…

Android SMS —— 读取短信 联系人

Android SMS&#xff08;一&#xff09; —— 读取短信 分类&#xff1a; Android 2012-03-07 12:49 9551人阅读 评论(9) 收藏 举报 sms android integer string date 数据库 Android SMS Read [java] view plain copy print ? package com.homer.sms; import java.…

Android 实现手机号短信验证码

使用mob第三方平台提供的免费短信验证码服务SMSSDK。 在Mob官网中注册登录并创建应用&#xff0c;获取相应的App key和App Secret。 在线安装&#xff0c;免下载SDK&#xff08;官网介绍&#xff09; 在根目录下的build.gradle文件中添加内容 在app目录下的build.gradle文件…

Android手机中获取手机号码和运营商信息

代码如下&#xff1a; package com.pei.activity;import android.app.Activity; import android.os.Bundle; import android.view.View; import android.view.View.OnClickListener; import android.widget.Button; import android.widget.TextView;/*** class name&#xff1a…

Android Contacts(二)—— SMS 短信 与 Contacts 联系人关联

Android 的SMS读取短信&#xff0c;可以获取发信人/收信人的手机号码&#xff08;address&#xff09;&#xff0c;Contacts的联系人&#xff0c;可以过滤手机号码&#xff08;address&#xff09;&#xff0c;因此SMS可以通过手机号码&#xff08;address&#xff09;关联到Co…

在 Linux 终端上使用 ChatGPT, 轻松提高生产力

随着NFT和元宇宙的流行逐渐消退&#xff0c;人工智能已成为技术领域的新热词。ChatGPT及其替代品在互联网上蓬勃发展&#xff0c;帮助用户轻松完成日常任务。很多文章都介绍了如何开始制作类似ChatGPT的聊天机器人以及如何在任何浏览器中使用Bing AI等指南。但是&#xff0c;如…

大家查找医疗英文文献都去哪个网?

文献阅读是每一个医学科研人都逃脱不了且贯穿整个科研生涯的需求&#xff0c;尤其是英文文献的检索与阅读&#xff0c;我们不得不承认医疗类国际前沿与热点的文章都普遍为英文文献。那么拥有一个使用起来得心应手的文献检索网站就是非常必要的&#xff0c;毕竟巧妇难为无米之炊…

哪些平台可以查看医学类文献?

世上文献检索千千万&#xff0c;医学文献检索选哪站&#xff1f;下面我就为大家总结了8个检索医学类期刊的文献检索网站&#xff01; 目录 1. 中国知网全文数据库(CNKI) 2. 掌桥科研 3. SinoMed中国生物医学文献数据库(CBM) 4. 中华医学期刊全文数据库 5. JAMA Netw…

如何着手写一篇医学综述?

各位医学研究生&#xff0c;研0的时候是不是导师都已经把综述布置下来作为你的第一份作业呀&#xff1f;对于医学生们来说&#xff0c;不管你是本科就已经开始接触科研还是研究生开始才接触科研&#xff0c;反正在你开始阅读文献的时候开始一篇综述总是逃不过的。鉴于有综述任务…

【学习】ChatGPT对问答社区产生了哪些影响?

引用 StackExchange 社区 CEO Prashanth Chandrasekar 的一篇博客标题 “Community is the future of AI”&#xff0c;引出本文的观点&#xff0c;即ChatGPT对问答社区产生了颠覆性影响&#xff0c;问答社区必须釜底抽薪、涅槃重生&#xff0c;但我们必须坚信“社区才是AI的未…

你想要的宏基因组-微生物组知识全在这(2023.5)

欢迎点击上方蓝色”宏基因组”关注我们&#xff01; 宏基因组/微生物组是当今世界科研最热门的研究领域之一&#xff0c;为加强宏基因组学技术和成果交流传播&#xff0c;推动全球华人微生物组领域发展&#xff0c;中科院青年科研人员创立“宏基因组”公众号&#xff0c;联合海…

2023年第二十届ChinaJoy新闻发布会 十大亮点解读

5月29日&#xff0c;2023年第二十届中国国际数码互动娱乐展览会&#xff08;ChinaJoy&#xff09;新闻发布会&#xff0c;在上海浦东嘉里大酒店召开&#xff0c;宣布本届ChinaJoy将于7月28日至7月31日&#xff0c;在上海新国际博览中心举办。 中国音像与数字出版协会第一副理事…

BFT 最前线 | 王小川:2033机器智慧将超人类;扎克伯格财富暴涨;哈工大:能跳跃的昆虫机器人;北京支持“1+4”机器人领域

原创 | 文 BFT机器人 名人动态 CELEBRITY NEWS 01 王小川&#xff1a;10年后机器智慧将超过人类 年底将推出对标GPT-3.5的模型 科技预言大师雷库兹韦尔说人工智能的奇点&#xff0c;机器智慧超过人类会发生在2045年&#xff0c;王小川的判断比这更激进&#xff0c;他认为这一…

开启单细胞及空间组学行业发展黄金时代!首届国际单细胞及空间组学大会在穗闭幕

2023年4月16日&#xff0c;首届TICSSO国际单细胞及空间组学大会圆满闭幕&#xff0c;本次大会吸引了2000余位来自产、学、研、资、医、政、媒等业界人士齐聚羊城&#xff0c;注册总人数5398人&#xff0c;网络播放总量达548245人次&#xff0c;网络观看覆盖美国、德国、日本、澳…

聚集十二罗汉,探索宇宙本质,马斯克神秘的xAI

作者 | 德新编辑 | 王博 马斯克组团入局通用人工智能。 7月12日&#xff0c;马斯克发推官宣成立新的公司xAI。据官网介绍&#xff0c;这是一家试图「探索理解宇宙本质」的公司。 新公司公布了12名首批成员&#xff0c;除了马斯克外&#xff0c;他们曾经在「AlphaStar、AlphaCod…

Transformer作者:指令型智能体的构建之法

来源 | The Robot Brains PodcastOneFlow编译翻译&#xff5c;徐佳渝、贾川、杨婷2017年&#xff0c;Google发布的《Attention Is All You Need》论文提出了Transformer架构&#xff0c;这成为过去十年神经网络领域最具影响力的技术创新之一&#xff0c;并被广泛应用于NLP、计算…

华为版AIGC或于7月7日发布;350名行业大佬警告AI可能给人类带来灭绝风险;钉钉斜杠“/” 面向企业用户定向邀测丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 欧盟官员将于6月会见OpenAI CEO&#xff1a;讨论人工智能法规 5月30日&#xff0c;欧盟官员表示&#xff0c;欧盟产业主管埃里布雷顿将于下月在旧金山与美国人工智能研究公司OpenAI首席执行官山姆阿尔特曼会面&…

大湾区年度盛会上线!院士领衔,20+重磅嘉宾,相信边缘的力量!

边缘计算&#xff0c;作为一种革命性的计算范式&#xff0c;已经引起了全球各行各业的广泛关注。在云计算、大数据、人工智能等技术的驱动下&#xff0c;边缘计算能够将计算能力下沉到数据源头&#xff0c;实现更快的响应、更高的效率、更低的成本和更强的隐私保护。据市场研究…