「ChatGPT」爆火背后的大语言模型到底是什么?

点击上方关注 “终端研发部

 

设为“星标”,和你一起掌握更多数据库知识

本文首发于我的知乎,终端研发部!

链接:https://www.zhihu.com/question/585248111/answer/2903130554

说起chatGPT,我们都知道非常的火爆,作为程序员,我们更要知其然,知其所以然!

而在这个领域,最为重要的核心技术之一就是大语言模型。而在大语言模型中,ChatGPT就是备受关注的代表之一,几天我就给大家说说chatGPT背后的那些事情。

其实它是由开放人工智能研究院(OpenAI)开发的一种大型自然语言生成模型。其前身为GPT,经过不断的迭代和升级,已经发展成为了目前最为先进的自然语言处理技术之一。

0a895c686d32a804ce133088262a3f8c.png

ChatGPT主要是针对智能客服、聊天机器人等领域的人机交互应用而设计的。该模型不仅可以实现对话交互,还可以根据输入的信息进行推理,生成符合语义逻辑的文本,从而大大提高了对话的质量和效率。

so,我来补充一下什么是 语言模型

语言模型(language model):把语言输出看作一个符号序列,通过定义在词序列上的概率模型,计算一个词序列的概率。
c85abb598e99848cc05477fd498cd62e.jpeg

2020年5月,OpenAI推出GPT-3模型(generative pre-trained transformer-3),其参数大小175亿参数,是上图第二大参数的 10 倍。

2022年11 月 30 日,OpenAI 发布了针对对话进行优化的语言模型 ChatGPT,该模型采用对话模式进行交互,不仅能回答问题,还能承认错误、质疑不正确的前提和拒绝不恰当的请求。

作为一款先进的大语言模型,ChatGPT拥有着很强的文本生成能力,可以模拟人类的思维过程,理解和处理自然语言。该模型使用了Transformer网络结构,并且训练了数百亿个单词级别的语言模型参数,从而可以对多种任务进行预测和生成。同时,该模型还集成了对话管理、情感识别、知识图谱等多种先进技术,使其更加智能化、人性化。

然而我不得不说一下大语言模型(LLM)的技术的重要性!

简单说,它的思路就是把尽可能大量大量大量大量的数据通过 Transformer 架构做机器学习,就能从数据中学到很多很多很多很多能力,多到超出原始设计者的想象。

比方说,它在翻译方面的能力,不输于,甚至超过了专业的机器翻译系统。

本文开头机翻的比尔盖茨的话,我觉得 ChatGPT 就比 Google 翻译得要好上一个层次。唯一瑕疵是用了比较生僻「元界」,而不是更常用的「元宇宙」。但当我告诉它「元宇宙」更常用后,它立刻就能修正翻译:

13b967bdbd2fad4a3616a4ea885efb74.jpeg

这个LLM模型规模必然非常巨大,ChatGPT是目前最接近理想LLM的技术方案,而理想中的LLM应该是以一个几乎无所不能的基础通用大模型作为依托,来支持各种各样的上层任务类型。目前看,支持越来越多的任务类型,主要是通过增加LLM预训练数据的多样性来达成的,数据多样性越好,LLM能够支持的任务类型就越丰富。所以,应该重视通过增加数据多样性来增加LLM新能力的思路。

6c382863a0c0d29a2768bd1d5d7e07f2.jpeg

这要以大模型成功的四个核心要素来分析。这四个要素是:

  1. 算法

  2. 数据

  3. 工程技巧

  4. 大量的钱买来的算力和人工反馈

像国内的阿里,百度,和腾讯也加入了这方面技术的研究。百度在人工智能领域从事了十多年,在深度学习算法与框架、人工智能赋能芯片、语言训练模型等技术方面积累了优势。

与此同时,微软表示,它计划在前几天发布自己的人工智能。

现在亚马逊、谷歌,思科、IBM、英特尔、英伟达等公司,都已经在开始布局CPO相关技术了。

同事也说一下,ChatGPT向GPT 3.5模型注入了新知识,方便LLM理解人的命令, 对于什么是好的回答,什么是不好的回答,人类有自己的标准,例如比较详细的回答是好的,带有歧视内容的回答是不好的,诸如此类。这是人类自身对回答质量好坏的偏好。人通过Reward Model反馈给LLM的数据里,包含这类信息。总体而言,ChatGPT把人类偏好知识注入GPT 3.5,以此来获得一个听得懂人话、也比较礼貌的LLM。

随着人工智能技术的不断发展和创新,ChatGPT未来还将发挥更大的作用,带给我们更多惊喜和便捷的体验!

ae44feab5d3b12283f7a3fca8ff9479e.jpeg

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!

7e00e16f14ca4e77331988f08dde4118.png

04c2d1465b17a7e4e48821955770f5e8.gif

喜欢就给个“在看885ac08b7e0431542eb1c116c64c5f10.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3609.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 还没达到“基础模型”状态,国产大模型“速胜论”不靠谱!

整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 在经历寒冬、雾霾,甚至大家纷纷看不到希望之际,ChatGPT 犹如一场春雨,给做 AI 甚至 NLP 等研究的人带来了新的希望。 3 月 11 日,由中国人工智能…

ChatGLM-6B 类似ChatGPT功能型对话大模型 部署实践

好难为了看到这个页面 ChatGLM-6B 简介 ChatGLM-6B 是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型开发的一个开源的类 ChatGPT 模型, ChatGLM(alpha内测版:QAGLM)是一个初具问答和对话功能的中英双语模型&#xff0c…

【ChatGPT】各大互联网企业开发的类ChatGPT大模型

各大互联网企业开发的类ChatGPT大模型 国际互联网公司国内互联网公司 ChatGPT是由开放人工智能公司OpenAI开发的一款基于人工智能技术的聊天机器人,采用了大规模Transformer网络,可以实现对话的生成和理解。其可以进行多轮对话,并具备一定的语…

技术科普与解读:ChatGPT 大模型硬核解读!(三)GPT-4的多模态架构

本文选自《GPT-4核心技术分析报告》的第2章的简写版(无公式版)。前两节从GPT家族的发展历史开始,讲解GPT-4的多模态架构和GPT-4中的关键技术。 作者陈巍博士为AI/存算一体专家,曾担任华为系自然语言处理企业的首席科学家。 技术科…

从ChatGPT出发:大模型与自然语言模型

目录 引言基石故事的开始:Transformer异姓兄弟:GPT、Bert与GPT-2GPTBertGPT-2 大力出奇迹:GPT3模型的进化:InstructGPT ChatGPT代码库TransformerGPT-2GPT-3InstructGPT 未来的工作安全性&有效性算力与标注代价的平衡 参考文献…

ChatGPT的各项超能力从哪儿来?万字拆解追溯技术路线图来了

作者:符****尧、彭昊、Tushar Khot、郭志江等**** 符尧(yao.fued.ac.uk),爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学。他与彭昊、Tushar Khot在艾伦人工智能研究院 (Allen Institute for AI) 共…

ChatGPT从入门到精通学习路线

课程名称适应人群 ChatGPT从入门到精通,一站式掌握办公自动化/爬虫/数据分析和可视 点击上述名称,学习完整视频 全面AI时代就在转角,道路已经铺好了“局外人”or“先行者”就在此刻等你决定 1、对ChatGPT感兴趣并希望有人手把手教学的新手 …

ChatGPT常用的指令(prompts)系列九——生活教练、评论员、魔术师

系列文章目录 内容翻译自:https://github.com/f/awesome-chatgpt-prompts,并加入自己的实践内容 1、 ChatGPT常用的提示语(prompts)系列一 2、 ChatGPT常用的提示语(prompts)系列二 3、 ChatGPT常用的提示语…

ChatGPT黑化版来了!拉踩TikTok用户智商、写暴力故事等为所欲为,bug只因3个字母...

杨净 羿阁 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT“越狱”后,彻底放飞自我了。 直接无视掉OpenAI给它在安全、伦理上限定的条条框框—— 写暴力故事、拉踩用户智商、随意预测未来……简直无恶不作! 而这一切背后竟然只靠一位Reddit用户实现&#xf…

Visual chatgpt多模态大模型的前菜

刚开始感觉这就是一篇工程类文章,把各种的模型做了整合,把最近很热的两个方向chatgpt和文本生成图、图文提问整合在一起。看完文章发现自己太自傲了,绝对轻视了微软亚研院大佬们的实力。 表面看起来这是一个用chatgpt做意图理解、对话管理&am…

2023最新ChatGPT3.5网站源码+支持用户开通会员赚取收益功能

正文: 第一步-配置APIKEY:在"index.php"最顶部配置自己的APIKEY,不然网站无法使用! 第一步-配置数据库:lib/config.php 第三步-导入数据库 第四步-PHP选择:7.3 第五步-访问网页即可! 程序: wweoeg.lanzouw.com/ifvgL0t6yxzi…

ChatGPT常用的提示语(prompts)系列二

系列文章目录 内容翻译自:https://github.com/f/awesome-chatgpt-prompts,并加入自己的实践内容 1、 ChatGPT常用的提示语(prompts)系列一 文章目录 系列文章目录5、作为一个Excel工作表(Act as an Excel Sheet&#x…

ChatGPT提示词,汇聚全网提示词,chatgpt提示词大全

免费chatgpt:http://chat.bctweb.cnhttp://chat.bctweb.cn 提示词使用教程: 将提示词发给chatgpt 后面再问的时候他会你按照提示词上的提示给你发送内容 加入用户交流群,了解或分享更多玩法 点击链接加入群聊【ChatAi】:6023542…

ChatGPT提示语编写指南

ChatGPT AI 对话模型自 2022 年 11 月下旬开始可用,此后用户一直在探索聊天机器人的局限性和功能。 然而,OpenAI 也在不断地进行调整,因此 ChatGPT 处于不断变化的状态。 但是我们在这个小指南中描述的提示应该是永恒的。 要获得想要的结果&…

ChatGPT提示词技巧

自计算机问世以来,人类与计算机之间的交互方式已经经历过几个重要的阶段: 指令式交互(Command-based Interaction) 早期的计算机系统主要采用了指令式交互方式,用户需要输入特定的命令或代码来完成各种任务。这种交…

玩转ChatGPT提示词 持续更新·······

导语: 众所周知,在AI的世界里,提示词就是和AI沟通语言的桥梁,提示关键词常用于AI对话及AI绘画等相关场景,通过准确的使用关键词,你就能更好的让AI辅助自己的工作,其中的成分重要性不言而喻&…

ChatGPT 提示词设置

提示词 Prompt(提示词):当我们询问GPT时,发送的消息就是Prompt。 通过给出合适的Prompt,可以让GPT了解我们的想法,在根据我们的想法做出更加合适的判断,帮助我们完成任务,提高效率。…

最新ChatGpt提示词教程

注意:该文章只是用于日常提问或者是其他工作场景下使用,并未有深入研究。仅仅用于满足日常的需求。作者水平有限请嘴下留情。 ChatGpt 2022 年 11 月,Chatgpt作为一款全新的智能聊天系统,横空出世,先在北美、欧洲等地…

为什么是ChatGPT引发了AI浪潮?

目录 BERT和GPT简介 BERT和GPT核心差异 GPT的优势 GPT的劣势 总结 随着近期ChatGPT的火热,引发各行各业都开始讨论AI,以及AI可以如何应用到各个细分场景。为了不被时代“抛弃”,我也投入了相当的精力用于研究和探索。但在试验的过程中&…

可以顺畅使用不输Chatgpt的AI

一前言 虽然chatgpt不错,但是如果在咱们国家,想使用起来还是有一定的门槛的,又要科学上网,又要申请账号,申请账号还要申请虚拟手机号接收验证码,难道就没有适合普通人使用的AI了吗,直到我发现了…