用一张图说一说 ChatGPT 内部技术工作流程

前沿

这几天ChatGPT可谓是热火朝天,很多同事和朋友都来找到勇哥,说能不能说一说相关话题,但是之前几天勇哥都在默默的干一件大事情,今天终于成型、有结果了,所有就抽了点时间来和大家一起聊聊ChatGPT背后的技术,让大家对一自然语言处理背景的技术有一个入门级别的了解。

阅读本文你的收获★★★

  • 了解到ChatGPT是什么、有哪些功能?

  • 了解到ChatGPT背后自然语言技术有那些?

  • 了解到一般AI系统的工作流程

老规矩,你觉得本文不错,点赞、关注一下,鼓励鼓励勇哥!

ChatGPT简介

ChatGPT是OpenAi 在12 月 1 日上线的一套在线人机聊天产品,而这套产品这几天已经突破上100万的,可谓是火得不要不要的了,但勇哥总结其火的背后主要有这么几方面的因素:

  • OpenAi 背后的大佬是微软

  • ChatGPT之别被姓马的夸赞,起到了很好的宣传

  • OpenAi 这套产品自身从技术+架构方面有新的突破

  • 各位网友心中都有一个未来科技梦

  • ChatGPT不对中国区开放,但是支持中文(这点细品....)

在这里勇哥主要站在产品自身的技术和架构方面的突破来给大家说一说,先说一说ChatGPT能做什么,我简单的归类了一下功能,包括:

  • 知识问答

    • 知识点解答

    • 数学题求解

      .....

  • 文学创作

    • 写作文

    • 写诗

    • 写小说

    • 写邮件

      ......

  • 程序创作

    • 写代码

    • 改BUG

      ......

ChatGPT技术★★★

下面这张图是OpenAi官网上的一张说明图,但是这张图只说明了其系统的模型(PS:这里的模型大家可以简单理解成一对特殊的数据)训练和应用流程:

上图并没有说明太多这样系统的技术架构,那么勇哥在这里来给大家脑补一下,一般这种系统的数据流是如何进行流转的:

数据流说明:

ChatGPT是一个聊天系统,用户输入一句话,那么ChatGPT就需要依据用户输入的信息反馈相关内容,比如上述用户输入“背《观沧海》",系统接收到信息后,就经过以下处理,来为用户生产相对准确的答案:

  • Li处理:既语言识别(Language identification),ChatGPT是面向中国区之外的用户,因此用户输入的信息有多种语言,至于是那种语言需要先进行识别。识别之后既可以确定在PPO中使用的是中文、还是英文、还是其它模型数据。

  • Ea处理:既情感分析(Emotional analysis),ChatGPT对于输入信息进行了多中情感分析,如果情感不符合正能量方面的要求,ChatGPT会自动拒绝回答相关用户问题。这点也是非常必要的。Ea处理也需要基于PPO模型库来分析计算。

  • Ei处理:既抽取信息 (Extract information),从用户输入的信息中提取关键特征,为下一步准备数据

    • NER处理:既命名实体识别(Named entity recognition),负责提取其中的人名、地名、专业术语等信息

    • SS处理:既句子相似性处理(Sentence Similarity),用户输入的信息可能存在错别字等信息,通过此步可以进行一个修正

    • TC处理:既文本分类(Text Classification),把用户输入得信息进行分类,通过此步分类,好定位到下一步搜索用到的相关搜索索引

  • Full Search 处理:既全文搜索处理,ChatGPT是一个自然语言+搜索引擎集成的架构,通过Ei处理得到的数据就是全文搜索的输入数据,比如EI提取出 NER=观沧海,SS=,TC=文学,那么此步就可以去搜索文学索引中的《观沧海》,得到想要的答案。

  • TG处理:既文本生成(Text Generation),上一步搜索的结果可能有多条数据,那么那一条最符合用户需求呢?则通过RM模型来进行选取,选取后生成对应的文本内容。

  • QA处理:既问题解答(Question Answering),把上一步生成的答案进一步转换成适合问答的形式或格式。

总结:

ChatGPT总体架构技术是:NLP是核心 , 搜索辅助,算力是硬核

NLP : 上述流程描述中:Li、Ea、Ei、NER、SS、TC、TG、QA等处理,都需要依赖ChatGPT自身的GPT-3.5自然语言模型数据,而且按照上述流程执行,流程步骤长,上一步的结果就是下一步的输出,一步出错,结果必错。ChatGPT能做到现在这样已经是相当的了不起了。NLP自然就是ChatGPT的核心了。

搜索:一般自然语言处理后的特征数据,是句子或者词组,对此搜索,常规的搜索肯定不行,而全文搜索技术自然就成为首选,比如开源流行的Elasticsearch,在里面主要存储了大量的问题答案、范本数据等。

算力:告诉大家一个事实:一般一个NLP模型数据非常大,上G上T都是非常正常的事情;那么这么大的数据量,每次搜索都要进行与其计算,普通的CPU肯定是更不上的,因此GPU是首选,而且最好是使用云上的GPU算力,才能收缩性更得上。

展望未来

我在网上看到很多喷ChatGPT答案不正确的(如下图),其实这个问题在我意料之中,毕竟AI的难度不是一点半点,而且它还依赖硬件等外部因素的影响,所以一步登天很难。展望未来,ChatGPT这一波展现出模型上的突破,但在应用场景上并没有创新,所以未来ChatGPT除了完善模型(这个是重点)、完善搜索库等之外,还需要考虑一些创新性的应用场景。

比如:网友问 ChatGPT,霍布斯主张三权分立吗?很明显回答的很好,但它的回答却是错误的。

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3gatjq6iej280

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1411.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

火爆全网的ChatGPT 背后的工作原理

火爆全网的ChatGPT 背后的工作原理: 第1步是有监督的调优:预训练的语言模型在少量已标注的数据上进行调优,以学习从给定的 prompt 列表生成输出的有监督的策略(即 SFT 模型); 第2步是模拟人类偏好&#xff…

用chatGPT提高程序员工作效率+个人使用体验

有个澳洲的朋友带一个团队正在研究一款应用层产品,chatGPT AI辅助程序员写代码。 目前产品内部测试估算原本一个12人的开发团队,使用这款产品后,可以缩减到4人。 最近一段使用下来, 发现通过使用ChatGPT,不仅可以获…

【ChatGPT】ChatGPT 工作原理解析 技术架构讲解 | How ChatGPT Works Technically | ChatGPT Architecture

目录 ChatGPT 1亿月活用户只用了2个月 什么是大型语言模型? 模型的有害输出问题

聊聊开源类ChatGPT工作——MOSS

自从ChatGPT发布以来,它的“三步走方案”就好比《九阴真经》流落到AI江湖中,各大门派练法不一,有人像郭靖一样正着练,循序渐进;有人像欧阳锋一样反着练,守正出奇;也有像梅超风一样仅练就半部《九…

面对ChatGPT我们未来有怎样变化,先了解ChatGPT工作流

不在沉默中毁灭,那就傍人门户,你吃肉我喝汤。 ChatGPT是一个基于神经网络的语言模型,可怕的是它具有强大的学习能力和语言理解能力,能没日没夜训练互联网上的各种文本数据。具体来说,OpenAI使用了大量的网络爬虫技术&a…

ChatGPT工作提效之初探路径独孤九剑遇强则强

ChatGPT工作提效之遇强则强 前言一、如何使用ChatGPT二、ChatGPT实战应用三、ChatGPT会叫的小孩有奶吃工具类的交互问答类的交互开发类的交互 前言 读《笑傲江湖》西湖比剑时,对于独孤九剑1的解读印象颇为深刻。令狐冲被任我行这个高手激发出许多精妙的剑招。这独孤…

ChatGPT工作原理解析

自 ChatGPT 发布以来,已经吸引了无数人一探究竟。但 ChatGPT 实际上是如何工作的?尽管它内部实现的细节尚未公布,我们却可以从最近的研究中一窥它的基本原理。 ChatGPT 是 OpenAI 发布的最新语言模型,比其前身 GPT-3 有显著提升。…

ChatGPT工作原理与技术细节

ChatGPT工作原理与技术细节 自ChatGPT发布以来,ChatGPT的能力一直在刷新大家对人工智能的认知,但 ChatGPT究竟是如何工作的呢?虽然其内部运作的细节尚未公布,但我们可以从最近的研究中拼凑出它的工作原理。 ChatGPT 的工作原理 Ch…

给程序员的ChatGPT使用指南:优化工作流程的 3 种实用方法

ChatGPT for Coders: 3 Practical Ways to Optimise your Workflow 自从 ChatGPT 发布以来,我在互联网上看到了很多关于它对未来编程可能意味着什么的讨论。 肯定有很多“FUD”在那里传播,但它基本上归结为两个论点: 编程将继续有利可图&…

ChatGPT能承担哪些工作?

ChatGPT拥有高效的自然语言处理能力,它最容易取代的领域可能是:文本分类、聊天机器人、文本生成、问答系统、文字识别和自动翻译方面。最容易取代的职业可能是:客服人员、技术类、媒体类、教师、法律类、金融类。使相关的人员在工作生活中更加…

重磅!ChatGPT 网页版来啦!响应速度超快!

平替 ChatGPT 继公众号对接 ChatGPT 以来,经过大家的试用与提出的建议,上线、优化了诸多功能,使得我们的公众号几乎完美~ 在此之上,不负众望,五一假期掏粪三天三夜,平替 ChatGPT 网页版 已经上线&#xf…

这个gayhub的大佬作者,更新起ChatGPT的项目,简直是高产如奶牛呐!实战网页版chatgpt-web源码(上)

大家好啊,我是测评君,欢迎来到web测评。 最近chatgpt真的是火了一遍又一遍,基本逛gayhub,gitee等开源社区的时候,随处可见各种大佬写的开源项目。今天给大家分享的是Chanzhaoyu大佬编写的一个网页版chatgpt&#xff0c…

如何使用 ChatGPT 完全自动化网页抓取

Web 抓取是使用脚本从网站自动提取数据的过程。ChatGPT 能够为您生成网络抓取脚本代码。让我们看看这是如何工作的…… IMDb 是一个提供有关电影、电视节目和其他娱乐形式的信息的网站,包括评分最高的电影图表,该网站https://www.imdb.com/chart/top/?r…

免费快速部署ChatGPT线上聊天网页:ChatGPT API + Github + Railway

1、使用工具 (1)需要自己生成的openai api,获取API的网站:openAI API 获取方式:OpenAI的API key获取方法 (2)本次使用该参考项目进行部署:chatweb 需要将该项目fork到自己的仓库里 …

ChatGPT网页版(基于SpringBoot和Vue)

目录 1.使用说明1.1 登录1.2 获取OpenAI KEY或User Token1.3 创建对话1.4 删除会话 1.使用说明 1.1 登录 登录http://chatgpt.alpacos.cn/ 1.2 获取OpenAI KEY或User Token 如果自己有OpenAI的token(sk-xxxx)的话,可以直接输入,点击右上角绑定按钮&am…

基于Vercel自建ChatGPT网页应用

因为平时我们在使用ChatGPT官方提供的网页应用的时候,总是经常访问不了,或者经常报错,越来越频繁,一旦你离开页面太久,再返回跟它对话的时候,就会出现如下报错等等。 An error occurred. If this issue per…

ChatGPT-Next-Web: 一键轻松拥有自己专属的 ChatGPT 网页服务

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! ​ 今天给大家推荐一个非常好用的开源项目:ChatGPT-Next-Web。 这个开源项目可以做到一键免费部署你的私人 ChatGPT 网页应用。如果部署Vercel,Vercel可以绑…

ChatGPT实现HTML网页文本提取

网页自动化工具 既然ChatGPT对于编程语言有非常强大的理解能力,那么它是否可以用来自动化地处理网页呢?答案是肯定的。ChatGPT可以使用机器学习算法来识别网页元素中的文本,并抽取出有用的信息。 例如我们提供一段层数比较多的相对来说较为…

【ChatGPT实战】5.使用ChatGPT自动化操作网页

在当今数字化的时代,网页已经成为了人们获取信息、娱乐、社交和购物等方面的主要途径。然而,随着我们对网页的需求和使用不断增加,我们也经常会面临着一些繁琐的网页操作,例如自动填充表单、自动化浏览和搜索等,这些操…

【chatGPT】API 即将来临,GPT-3 不等同于chatGPT,chatGPT收费了?

今天的人工智能系统具有令人印象深刻但范围有限的能力。 似乎我们会不断削弱它们的限制,在极端情况下,它们几乎可以在每一项智力任务上达到人类的水平。 很难想象人类水平的人工智能能给社会带来多大的好处,同样也很难想象如果构建或使用不当…