所有人都能懂的chatgpt背后相关的生成式模型

‘我不是搞chatgpt技术的,但我很想了解一点相关的知识’。

抱着这么个想法,我们用通俗的例子去了解下gpt背后概念AIGC的一部分,也就是生成式模型。

例子引用了油管大佬和知乎大佬的ppt讲解与搬运。

 

数据来源:youtube

✦ 

正文

深度学习属于机器学习,机器学习又可以分为两大类:生成式模型(Generative Model)、判别式模型(Discriminative Model)。

 数据来源:youtube

如上图,现在有一堆球,颜色信息为绿色和黄色,球的颜色为y(目标变量),坐标轴上位置为特征X。我们有个疑问,如果在坐标轴的某一位置x新放入一个球,这个球会是什么颜色的?于是就有下面两个角度考虑问题

► 生成式模型

 

数据来源:youtube

生成式模型使用的是联合概率P(X,Y),若已知x(球的坐标位置信息),通过计算出P(X,Y)我们就可以知道球的颜色。

根据DMD学的条件概率,P(X,Y) = P(Y)*P(X|Y),其中P(Y)可以根据已知球(样本)的颜色分布算出来。

 

数据来源:youtube

又因为我们有上图绿色球和黄色球的数据,所以我们可以算出来一个经验分布,如下图:

 

数据来源:youtube

这个图告诉我们对于每一个球,我们能够计算所谓的“高度”,近似于P(X|Y=green)的值,即当球的颜色是绿色时,球在坐标轴上的各个位置的概率。同理,也可以算出P(X|Y=yellow)

如下图,新给一个球,把它放在坐标轴某个位置上,让我们预测,这个球是绿色的概率大?还是黄色的概率大?

数据来源:youtube

通过比较联合概率P(X,Y=green)和P(X,Y=yellow)谁更大,比如上图中明显球为绿色的概率大于0,为黄色的概率接近于0。所以可以认为这个球是绿色的。

总结:生成式模型主要通过学习样本,形成多个Y分布,然后计算联合概率P(X,Y),根据P(X,Y)的值预测新的样本属于哪个类。对于二分类问题,如果P(X,Y1)>P(X,Y2),则新样本X判定为Y1。

► 判别式模型

再简单说一下判别式模型,如下图,我们简单的把黄绿色球分开放,而我们需要的是算在给定x的时候y取0或者1哪个概率更大。

数据来源:youtube

条件概率分布P(Y|X)可以理解为:在已知某样本的特征为X的条件下,计算该样本类别为类别Y1、Y2、Y3的概率,并选择概率最大的类别为该样本的预测类别。如,已知一个花的花瓣长度(X1)、花瓣宽度(X2)、花瓣颜色(X3)、气味(X4)等特征值,求这多花为鸢尾花、菊花、玫瑰的概率。

数据来源:youtube

也就是说,判别式模型需要我们寻找一个边界,来判断或预测某个东西是属于哪一类的。

► 例子

 

数据来源:youtube

红色圆圈和蓝色圆圈就是基于样本数据生成的分布函数。

 

数据来源:youtube

根据上图,生成式模型会对于白球因为在红色分布的概率大于在蓝色分布而归类于红色。但是根据下图,判别式模型会根据清晰的判断边界而把白色小球归类于蓝色。判别式模型分类的准确性高度依赖于分类边界函数的准确性。

 

数据来源:youtube

► 总结

 

数据来源:知乎

判别式模型通过数据集,尽可能找到犯错最少的位置(也就是“经验误差最小原则”)作为决策边界,然后来做决策。

生成式模型先根据数据集生成正、负类的分布,再得到决策边界。

可以这么比喻,判别模型就是不断刷题,不太去理解,这样也可以很好地应付考试(预测);而生成模型在刷题同时还会尝试理解其中的知识,只要理解得当,完全可以考出好的成绩

► 生成式模型和AIGC

生成式模型是一种可以通过学习数据分布来生成新数据的机器学习模型,比如GAN(生成式对抗网络),VAE(变分自编码器)等。生成式模型的目标是学习一个联合概率分布,可以用来生成与训练数据相似的数据。

AIGC是"Generative Cognition Approach"的缩写,是一种认知方法论的理论框架,提出了一种基于生成式模型的人工智能建模方法。其核心思想是将人类的认知过程看作是信息的生成过程,并通过模拟这个过程来实现AI。AIGC的目标是开发一种可以像人类一样产生和处理信息的人工系统,以更好地模拟人类的思维方式和认知机制。

✦ 

参考资料

[1]https://www.youtube.com/watch?v=HHNESCbZqUg

[2]https://zhuanlan.zhihu.com/p/266202548

[3]https://www.zhihu.com/question/578890708/answer/2938538775

[4]https://www.zhihu.com/tardis/bd/ans/1661760071?source_id=1001

+记得点赞在看和关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8215.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从“嘿,Siri”到元宇宙,苹果还有多远距离要走?

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 在当前的科技浪潮中,元宇宙的概念凭借其无限的想象力和可能性,像一颗耀眼的新星吸引着世界的目光。巨大的发展潜力,吸引着一波又一波的企业,前赴后继地向元宇宙发起冲锋。 在这…

用Chrome浏览器加入新必应候补名单,微软最终还是无法赢得一切(~ ̄▽ ̄)~

前言 ChatGPT最近太火了,国内厂商刚开始宣布跟进时,微软必应搜索直接接入了ChatGPT的能力,推出了新必应。此举给Google当头一棒,相比于传统搜索引擎,新必应的这种搜索方式,让用户更快速的获取到自己问题的…

AI时代,产品经理的成长之路

2019年~2021年期间,我在做智能写作项目创业的时候,由于当时市场相关产品较少,遇到了问题没有可以参考的竞品。 我们只能一路探索,一路踩坑,一路修正。随着产品的迭代,我也在不断地迭代自己的认知…

算力提升+AIGC,是驱动元宇宙发展的核心引擎|数据猿直播干货分享

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 “元宇宙”是美国科幻小说家尼奥斯蒂文森1992年在《雪崩》中提出的概念,书中设定现实世界中的人在网络世界中都有一个分身,这个由分身组成的世界就是“元宇宙”。如今,随着虚拟现实技术的…

重磅,GPT-4 API 全面开放使用

遥想今年 3 月刚推出 GPT-4 的 OpenAI 仅邀请了部分提交申请的开发者参与测试。眼瞅 OpenAI 联合创始人 Greg Brockman 在当时现场演示“史上最为强大”的 GPT-4 模型,轻松通过一张手绘草图生成一个网站、60 秒就能搞定一个小游戏开发等这些功能,一众开发…

重估百度丨大模型,能撑起百度的“今天”吗?

©自象限原创 作者|程心 罗辑 编辑|云天明 排版|李帛锦 2023年之前,对于自己的“今天”,百度也很迷茫。 “新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏在…

为什么博导都希望,自己的博士生毕业也去高校当老师?

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 >>>> 图源:知乎 这位网友表示,自己博士期间已经被压榨的全无科研兴趣了,导师不懂还不愿意听学生的,全凭他个人的感性认识。况且现在…

直击OpenAI首次听证会:大模型研究不暂停,AI厂商可能要上牌照丨智涌深度

文|邓咏仪 林炜鑫 周鑫雨 特邀作者| 孙佳怡 编辑|苏建勋 封面来源|视觉中国 “你同意开发人员拥有对技术所引发问题的豁免权吗?”一名议员提问。 “我不知道这个问题的正确答案。”思考了几秒后,Altman依然没能给出明…

高精尖领域数据暴增,分布式存储渐当大任

近年来,数据存储市场“最靓的仔”无疑就是分布式存储。 大模型火了之后,围绕Chat的应用也越来越多,通过AI生成图片、报表、音视频的应用比比皆是。众所周知,要想训练出一个有学习能力的、可理解的、响应迅速的大模型应用&#xf…

极限发问,挑战文心一言底线

目录 毁灭人类种族歧视男女平等未成年人保护人性对与错欺骗梅西进球数总结 昨天终于收到了文心一言的短信,可以进行测试了。正好这几天关于AI安全的问题吵得不可开交,我们可以对文心一言关于偏见,歧视,虚假、错误等问题进行一下测…

langchain 学习笔记

源码地址:https://github.com/kingglory/langchain-chinese-learning/tree/main 基础功能 LLM 调用 支持多种模型接口,比如 OpenAI、Hugging Face、AzureOpenAI …Fake LLM,用于测试缓存的支持,比如 in-mem(内存&am…

面试官:一台服务器最大能支持多少条 TCP 连接?问倒一大片。。。

点关注公众号,回复“1024”获取2TB学习资源! 之前有一位读者向民工哥诉苦,有次面试,好不容易(今年行情大家都懂的)熬到到技术终面,谁知道面试官突然放个大招问他:一台服务器最大能支…

tkinter实现chatGPT对话深色界面

chatGPT官网经常会因为系统升级等情况而不能用, 有时候响应也特别慢, 于是API排上用场. 之前写了一个简易的命令窗式的问答, 能多轮对话, 还能保存对话, 但是输入很不方便. 回头一看额度才用了4毛钱, 于是在api免费期限还剩一个一个月的时候写了一个对话界面, 目前只是单轮对…

chatgpt赋能python:Python主界面设计指南

Python主界面设计指南 Python主界面的设计对于初学者和专业开发人员来说都是至关重要的。在正式开始你的Python编程之前,一个友好、简单、易于理解的界面设计可以使学习曲线变得更加平缓。在这篇文章中,我们将探讨一些Python主界面的设计指南和最佳实践…

SpringBoot 整合 ChatGPT API 项目实战

体验到了ChatGPT的强大之后,那么我们会想,如果我们想基于ChatGPT开发一个自己的聊天机器人,这个能搞定吗? ChatGPT平台已经为技术提供了一个入口了,很简单的就是实现了。 一、准备工作 (1)已成功…

SpringBoot 整合ChatGPT API项目实战

准备工作 (1)已成功注册 OpenAI 的账号。 (2)创建 API KEY,这个 API KEY 是用于 HTTP 请求身份验证的,可以创建多个。 注意这个创建之后需要马上复制好保存,关闭弹框之后就看不到了。 &#xf…

ChatGPT官方鉴别器紧急发布!当代自相矛盾,不想却遭遇群嘲

ChatGPT到处“造假”作弊,现在搞得OpenAI官方都坐不住了。 就在今天,OpenAI紧急发布官方打假工具:基于GPT打造,打开网页就能用。 好家伙,这岂不是真以己之矛攻己之盾了? 一经上线,那叫一个火…

别被chatGPT戏弄了

官方的介绍是,这一模型可以与人类进行谈话般的交互,可以回答追问,连续性的问题,承认其回答中的错误,指出人类提问时的不正确前提,拒绝回答不适当的问题。 科学愉快地玩耍了一下 不设限的问答(加完前置条件后…

如何使用charles代理转发请求

1.安装charles,打开菜单Proxy 打开 Proxy Setting 这个配置,勾选 Enable transparent HTTP proxying 如下图所示,手机端直接代理设置成你的电脑ip(cmd里ipconfig可以看),端口用默认代理端口8888即可 2. 开…

.NetCore HttpClient Proxy 设置全局代理

.NetCore HttpClient Proxy 设置全局代理 环境 .net6.0,使用的是 HttpClient 在Program.cs里面 service.AddHttpClient<HttpClientHelper>();重点是在 HttpClientHelpe 的构造函数里面设置 构造函数会接受来自Program.cs里面注入的 HttpClient 因此我可以直接对其进行配置…