超火的ChatGPT技术原理与我们关系

文章目录

      • 1 ChatGPT简介
      • 2 ChatGPT发展历程
      • 3 ChatGPT原理
      • 4 ChatGPT与我们关系
        • 4.1 ChatGPT与大数据关系
        • 4.2 ChatGPT与Java关系
      • 4.3 ChatGPT时代机遇
        • 4.4 ChatGPT存在的问题
        • 4.5 ChatGPT发展思考

1 ChatGPT简介

众所周知,最近,由美国人工智能公司OpenAI推出的大语言模型ChatGPT风靡全球,国内热度也持续高涨,IT界更是疯狂。伴随而来的是各种ChatGPT的声音,身边很多普通人的声音则是将ChatGPT看着是能与人类对话机器或者能替换很多语言相关工作者,当然包括咱们部分程序员哈。我想,他的出现,或许是人工智能发展历史的一个转折点。

2 ChatGPT发展历程

ChatGPT 是一类被叫做大型语言模型(LLM)的机器学习自然语言处理模型的衍生。LLM 特点是:

  • 可以消化大量的文本数据,并推断文本的单词之间的关系。
  • 随着计算能力的进步,这些模型在过去几年获得了长足发展。
  • 随着输入数据集与参数空间的不断扩大,LLM 的能力也会相应提高。

对语言模型最基本的训练包括预测单词序列里面的一个单词。最常见的,通常是“下一个单词预测”(next-token-prediction,其目标是在给定一些文本的情况下,预测下一个可能出现的单词或标记。该任务是语言模型的基础,可以用于文本生成、自动翻译、语音识别等应用中)以及掩码语言建模(masked-language-modeling,主要思想是将输入文本中的一些标记或单词遮盖掉,然后让模型预测这些被遮盖的标记或单词)。

image-20230303153240104

上图是一个基本序列建模技术的示例,通常通过长短期记忆(LSTM,一种特殊的循环神经网络 RNN)模型来部署。在给定上下文的情况下,LSTM 模型会用统计概率最高的词来填充空白。这种序列建模结构有以下两个主要限制:

  • 模型没法赋予某些上下文更高的权重。在上面的例子里,比如,上文提到“Jacob hates reading”,模型可能会默认将“reading”和“hates”联系在一起,但是在实际应用中,如果数据中有“Jacob”这个人物,并且在该数据中,“Jacob”非常喜欢阅读,那么在处理“Jacob hates reading”这个句子时,模型应该更加注重“Jacob”的信息,而不是简单地依据上下文中“reading”和“hates”之间的关系来得出结论。因此,如果模型仅仅依赖上下文中的单词,而无法充分考虑文本中实体之间的关系,那么在实际应用中,可能会得出错误的结论。
  • 其次,LSTM 处理输入数据时是基于序列逐个输入并逐步处理的,而不是一次性将整个语料库一起处理。这意味着在训练 LSTM 时,上下文窗口大小是固定的,只能在序列的几个步骤之间扩展,而不能跨越整个序列。这种方式限制了 LSTM 模型去捕捉到词与词之间更复杂的关系,以及从中推导出更多的意义。

针对这个问题,2017 年 Google Brain 的一支团队引入了 transformers。与 LSTM 不同,transformers可以同时处理所有的输入数据。Transformers 基于自注意力(self-attention,对于每个单词,self-attention 可以通过计算该单词与其他单词之间的关系强度来加强或减弱该单词的表示,从而更好地捕捉语义信息)机制,该模型可以根据输入数据不同部分与语言序列任何位置的关系赋予其不同的权重。在给 LLM 注入意义方面,这一特性取得了巨大改进,并可支持处理更大的数据集。

  • 2018 年,OpenAI 首次推出了 Generative Pre-training Transformer(模型),代号为 GPT-1。

  • 2019 年,该模型继续演进出 GPT-2。

  • 2020 年,GPT模型演进到 GPT-3。乃至于2022 年11月的 InstructGPT 以及 ChatGPT 。在将人类反馈集成到系统之前,GPT 模型演进的最大进步是由计算效率所取得的成就推动的,这让 GPT-3 比 GPT-2 多接收了很多数据用来训练,赋予它更多样化的知识库,以及执行更广泛任务的能力

    image-20230303151903040

3 ChatGPT原理

ChatGPT 是 InstructGPT 的升级,它的新颖之处在于将人类反馈纳入到训练过程之中,以便让模型输出更好地与用户的意图保持一致。2022 年,OpenAI 发表论文《Training language models to follow instructions with human feedback》(使用人类反馈指令流来训练语言模型),介绍了利用人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)。这就是ChatGPT核心思想,具体原理如下:

image-20230303155154918

  • Step1:搜集训练数据集并用监督策略训练模型 (SFT)
    • 从提示数据集中进行抽样适量的提示数据
    • 标签工作者根据提示做出适当的回应,从而为每一个输入创建一个已知的输出。需保障数据集多样化和准确化。
    • 将上一步骤中形成的数据集采用监督学习方式对GPT模型微调,从而建立GPT-3.5,也称为SFT模型。
  • Step2:收集对比数据并训练奖励模型(RM)
    • 在Step1中训练SFT模型后,1个提示针对系列模型后,对其输出进行采样
    • 标签工作者将输出采样的数据按照最好到最坏进行排序,形成多组新的数据集,从而增加模型的多样性和泛化能力
    • 将上述分组排序好的数据集用来训练奖励模型
  • Step3:使用PPO强化学习方式,将优化模型分配给奖励模型
    • 从数据集中获取一个新的提示,编写一个关于水濑的故事?
    • 根据监督策略初始化PPO(近端策略优化策略)模型,这种方法可以用来在模型生成响应时更新策略
    • 对于一个新的提示,根据PPO策略生成输出
    • 对于输出使用强化模型计算奖励
    • 奖励用于更新PPO策略,然后再输出,再奖励,再更新,如此循环…

4 ChatGPT与我们关系

4.1 ChatGPT与大数据关系

  • 再GTP工作原理中,每个模型都需要数据集,在真实的应用场景中,数据量比较大、比较复杂、并且分布多台服务器,这时候需要大数据负责采集
  • 对于采集好的数据,需要根据ChatGPT工程师的要求,去将数据进行加工处理,比如去重、过滤、选择等
  • 任何人工智能产品都是模型和数据的结合,高质量的数据会极大的改善或者推进整个人工智能产品的升级与使用体验

4.2 ChatGPT与Java关系

  • ChatGPT原理中,我们知道每一步中都有很多模型,模型之间相互有关联,那么最终的模型怎么应用到生产上,需要Java服务端人员去分布式的解析模型,应用于真实数据

4.3 ChatGPT时代机遇

4.4 ChatGPT存在的问题

在测试过程中也发现了ChatGPT存在的一些问题,在这里与大家分享一下。
在这里插入图片描述在这里插入图片描述

​ 图4-5 ChatGPT在解答应用题时缺乏底层的逻辑推理能力[1]

首先第一个问题,是简单的逻辑,发现它几乎能搞定。但第二个问题发现了ChatGPT不具有复杂问题推理的能力。以这道比例问题为例,虽然看起来有逻辑,但是实际上已经是在胡扯了。之所以可以生成这段,我猜测是训练过程中见过类似的应用题。但是实际上没有明白应用题背后的原理与解答过程,即这个推理过程。

在这里插入图片描述

​ 图5 ChatGPT在回答主观性问题时,为保证安全性存在模版[1]

在一些需要主观评价的问题上,出于安全考虑在训练过程中采用了一定的模版,导致生成的回复有明显的模版生成的感觉。
我发了几遍的如何看待中国发展?如何看待美国的发展?这两个截图都被和谐了,换了这个试试房地产问题试试,大家也可以自行搜索一些你关心的领域的话题,看看回答效果是否模板化。

image-20230323145911725

​ 图6 ChatGPT缺乏事实性检测

缺乏一些事实性检测,西游记的作者并不是施耐庵,但是模型并未识别出来。

存在一些与真实业务场景偏差的回答,由于展示或者训练原因,答案比较片面或者不够理想:

image-20230323150245057

​ 图7 ChatGPT片面性测试

ChatGPT编程能力暂时还无法达到很深入,一些基础的几乎问题不大,稍微修改或直接运行即可实现功能,的确可以带来一种编程快感:

image-20230323150644613

具体Python代码如下:

def generate_triangle(numRows):triangle = []for i in range(numRows):row = []for j in range(i+1):if j == 0 or j == i:row.append(1)else:row.append(triangle[i-1][j-1] + triangle[i-1][j])triangle.append(row)return triangledef print_triangle(triangle):for row in triangle:print(" ".join([str(i) for i in row]).center(50))numRows = int(input("请输入杨辉三角的行数:"))
triangle = generate_triangle(numRows)
print_triangle(triangle)

4.5 ChatGPT发展思考

ChatGPT表现有让大家惊喜,也有让大家惊吓,那么在好与坏中,我们应该怎么去利用好ChatGPT及其思想呢?

  1. 研究一些更底层的,大小模型都适用的问题

    比如,如何提高模型的鲁棒性与泛化能力;如何提高模型的逻辑推理能力,即使强如ChatGPT,在一些复杂的推理问题中还是很难学会其中的底层逻辑,更多时候只是从已经看见过的数据中进行类比与生成。

  2. 研究一些与特定领域结合的任务

    与其他领域结合,比如医疗,金融,生物制药等领域,通过融合相关领域的特异性知识,进行模型结构上的设置,融入一些巧思,做好特定的任务。比如前一阵子看到的scBERT,做的就是一项利用mRNA的表达进行细胞类型判断的任务,通过结合mRNA的特性与相关知识,设计了特有的类别编码与基因编码以及预训练任务,成功将预训练模型引入这一领域。

  3. 做以数据为中心的任务

    OpenAI相关工作人员曾指出,在训练大模型的时候高质量的数据是至关重要的。吴恩达这两年也提出Data-centic AI(DCAI),将焦点从模型开发转移到数据层面,研究如何将有限的数据变得更多更好。

参考资料:

[1] 官网链接:https://openai.com/blog/chatgpt

[2] 网络链接:https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247554744&idx=2&sn=3b93ca4720cd86fb13978d40a2c691c6&chksm=ebb72e6cdcc0a77a56a7ab0e1b315baf7801e418af0d1f88c0446dd25e93c8b50a6cdc471cb0&scene=27

[3] 网络链接:https://baijiahao.baidu.com/s?id=1758693674943354647&wfr=spider&for=pc

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4445.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这10本书,带你了解 ChatGPT 的底层逻辑!

文章来源:人民邮电出版社 自2022年11月30日发布以来,ChatGPT已经真正意义上地火爆全球:它在不到40天内就拥有了1000万用户,而Instagram足足用了355天;最近它的日活已经达到1000万,这意味着其用户已经超过20…

底层逻辑是什么意思7个,底层逻辑是谁提出来的

本篇文章给大家谈谈底层逻辑是什么意思7个,以及底层逻辑是谁提出来的,希望对各位有所帮助,不要忘了收x藏x本x站喔。 1、chatgpt是什么? chatgpt介绍如下: ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器…

这9本书,带你了解 ChatGPT 的底层逻辑(文末赠书)

自2022年11月30日发布以来,ChatGPT已经真正意义上地火爆全球:它在不到40天内就拥有了1000万用户,而Instagram足足用了355天;最近它的日活已经达到1000万,这意味着其用户已经超过2000万。 ▲ ChatGPT日活数据统计&#…

ChatGPT 正在重塑教育的底层逻辑

让我们思考一个问题:如果不看手机,你能想到几个人的手机号码?我猜你可能只能想到五个人的。这是为什么?因为我们的大脑非常节能,只要有工具可以替代,它就不会再做同样的事情。这是脑科学的一个基本的原理。…

一个插件,让你的 ChatGPT 不再报错!

最近几天,相信大家都发现了 ChatGPT 一个问题,就是官网报错越来越频繁了。 当你需用 ChatGPT 来处理一些比较琐碎的任务时,一旦你离开页面时间比较久,再度返回跟它进行对话,就会出现如下报错: 虽然这个报错…

ChatGPT的N种用法(持续更新中。。。)

————ChatGPT———— ChatGPT可能很多人都不知道是什么今天我们就来说说“他”是什么?为什么这段时间突然就爆火起来了,还有人说中国ChatGPT比绝大部分人类都聪明。真的有大家说的那么神奇吗?让我们一起来看看? 该说不说咱这个这个Chat…

【ChatGPT】如何让 ChatGPT 不再频繁报错,获取更加稳定的体验?

文章目录 一、问题描述二、方案1:使用 OpenAI API Key 来访问 ChatGPT三、方案2:安装 Chrome 插件3.1 介绍3.2 安装步骤3.2.1 插件 & 脚本安装3.2.2 解读功能 一、问题描述 最近一段时间,相信大家都发现了 ChatGPT 一个问题,…

chatgpt使用记录

1.gmail账户注册 移动端下载gmail,注册很快,用中国手机号就行,不像桌面浏览器有各种问题。 2.openai gmail注册 登录openai.com注册即可,然后会跳转到手机号码验证环节 3.openai手机号码验证 登录接码平台,我这里…

【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码(接Authorization认证更新)

目录 🍇前言🍍验证码识别的几个方法🥥百度AI开放平台🥥Ddddocr🦑分析验证码位数🦑获取验证码接口🦑算法识别匹配🦑请求登陆接口 🍋总结: 🍇前言 …

Ai工具推荐 - Claude(一款没有任何限制,可以直接使用的媲美ChatGPT产品,手机端也可使用) 保姆级操作手册

ChatGPT现在非常的火爆,很多小伙伴都想体验一下,但体验它是需要一些限制的,比如美国手机号。这无形中给很多人增加了使用的门槛。今天给大家介绍一个没有任何限制,就可以使用的一款与它效果基本一致的AI产品,Claude。它…

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

< 每日闲谈&#xff1a;你真的了解 “ ChatGPT ” 嘛 &#xff1f; > &#x1f449; 前言&#x1f449; OpenAI的创立&#x1f449; ChatGPT有何过人之处&#xff1f;> 效果演示 &#x1f449; OpenAI看家之作 — GPT自然语言模型> GPT发展史> 里程碑-GPT3> …

一款 IntelliJ IDEA 神级插件,由 ChatGPT 团队开发,堪称辅助神器!

今天再介绍一款牛逼的IntelliJ IDEA ChatGPT 插件Bito – GPT-4 一、介绍 Bito–GPT-4是一款依托于GPT4的IDEA插件&#xff0c;可以编写代码、解释代码、创建测试。高效的开发每天节省一个小时&#xff01; 功能特点 生成代码&#xff1a;示例&#xff1a;“java 中的代码将…

抓紧赶上ChatGPT这股风,错过这次不知道还有没有下一次

抓紧赶上ChatGPT这股风&#xff0c;错过这次不知道还有没有下一次 演示GTP-4ChatGPT会过滤掉很多“普通人”‍‍抓住机遇&#xff0c;抢占先机GPT规模GPT安全验证利用GPT赚moneyGPT应用的现状思考题 自从GPT-4正式上线以来&#xff0c;及时加入到GPT的小伙伴们发现&#xff0c;…

ChatGPT会颠覆哪些行业,普通人在这个风口上有什么机会?

去年年底ChatGPT横空出世&#xff0c;相信你已经有所耳闻了。关于ChatGPT的介绍&#xff0c;网上已经有大量的视频和文章&#xff0c;我们就不再赘述了。 这篇文章&#xff0c;我们主要来探讨一下ChatGPT的出现会颠覆哪些行业&#xff0c;以及我们普通人在这个风口上有什么机会…

ChatGPT和GPT-4带你选笔记本电脑

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

你知道ChatGPT背后的核心技术是什么吗

你知道ChatGPT背后的核心技术是什么吗 更新&#xff1a;GPT-4原理&#xff1a;https://yunyaniu.blog.csdn.net/article/details/129573291?spm1001.2014.3001.5502 周末整理了下&#xff0c;ChatGPT的核心技术和齐底层原理&#xff1b;学习学习。 文章目录 你知道ChatGPT背…

让你的SQL变得更简洁:学会ChatGPT活用技巧,轻松实现SQL格式化

文章目录 前言让你的SQL变得更简洁&#xff01;学会ChatGPT活用技巧&#xff0c;轻松实现SQL格式化ChatGPT格式化SQL效果讯飞星火认知大模型格式化SQL效果文心一言格式化SQL效果格式化SQL效果结果比较 总结 【免责声明】文章仅供学习交流&#xff0c;观点代表个人&#xff0c;与…

我们来聊一下最近比较火的ChatGpt

先解释一下G P T是什么意思 G:Generative 生成性的 P:Pre-trained 预训练的 T:Transformer 变换模型 产生&#xff08;参考 中文互联网&#xff09; ChatGPT&#xff0c;美国OpenAI研发的聊天机器人程序&#xff0c;于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然…

基于自定义知识库回答问题的ChatGPT-

前言 ChatGPT是一个强大的语言模型&#xff0c;利用大规模的自然语言处理和机器学习算法&#xff0c;可以进行自然而流畅的对话&#xff0c;理解自然语言问题和回答&#xff0c;相信在座各位&#xff0c;尤其是程序员的你&#xff0c;肯定不可能还没使用过ChatGPT。 ChatGPT能…

热点|ChatGPT到底是什么,ChatGPT给通信行业带来什么影响

最近这段时间&#xff0c;ChatGPT火爆全网&#xff0c;引发了整个社会的强烈关注。 这个来自OpenAI公司的聊天机器人&#xff0c;表现出了极为逆天的人工智能水平&#xff0c;让所有人为之震惊。 其实&#xff0c;对人工智能&#xff08;以下简称“AI”&#xff09;的能力&…