你以为ChatGPT真的听懂了你的话吗?

1/6、多年以后……

多年以后,面对长长的领失业救济金队伍,人们将会回想起2022年12月,不是因为大感染,而是初次体验ChatGPT。那时,人们感受到的,还不是旧世界的行将崩塌,而是对新世界到来的惊叹。

请允许我用这样一个烂俗的开头,因为大部分人可能都低估了ChatGPT对未来生活的改变,以为不过是一个更智能的搜索引擎,只有这句话才是最恰当的表达。

当然,如果觉得太悲观,或者机器代替人类的思路太俗套,我们也可以给自己的晚年换一个喜剧的结局:

多年以后,面对不需要上班就能领到工资的银行卡,人们将会回想起2022年12月……

ChatGPT对于人类到底是悲剧还是喜剧,并不取决于技术本身,而在于我们每一个人如何对待它,但毫无疑问的是,这将是人工智能诞生以来,人类的工作第一次真正接近被大规模替代的时点——不是部分工作被替代,而是大规模被替代的开始

为了消除这种深深的恐惧,我很想知道ChatGPT到底是如何学习的,于是花了几天时间看了一些技术资料,大致理解了机器学习的过程。

没想到恐惧没有消除,反而多了几份敬意,敬意是送给ChatGPT算法的设计者,这真是一个天才的想法,而恐惧是我再次确信,不是少数专业工作者被替代,而是大量的普通白领。

这一篇文章,我想从ChatGPT的底层逻辑——“学习方法”入手 ,谈谈我为什么这么认为。

不过,在介绍核心内容之前,我先简单谈一谈ChatGPT跟以前的AI有什么根本的不同。

2/6、决策式AI和生成式AI

我们比较熟悉的AI已经成功应用的领域,包括人脸识别,自动驾驶、精准广告推送、风险评级,这些领域都有一个共同点——判断与决策,所以称之为“决策式AI(Discriminant Model)”.

ChatGPT应用的是另一个领域:生成式AI,首先要理解文本的要求,判断自己的任务,检索相关的内容。这些跟决策式AI并没有什么不同,只是ChatGPT多了一步,它还要生成全新的内容,需要预测对方的理解偏好,将回复内容变成流畅的文本或有意义的图片、视频。

决策式AI使用的是“条件概率”,一件事发生后,另一件事发生的概率,对于某些特定的场景,即使是最复杂的自动驾驶,输出的决策数量也是有限的;

而生成式AI更多使用“联合概率”,即两件事同时发生的概率,以此将各种文字或图像视频元素组合在一起,进行模仿式创作、缝合式创作。

比如说,要表达“70%相信”的意义,系统需要对“非常”、“极度”、“几乎”、“认可”、“同意”、“信任”、“信仰”这些词不同组合后的概率排序进行判断。

所以,相对决策式AI使用在有限的固定场景而言,生成式AI的应用范围宽广的多,未来的想象空间也更大,GPT需要调用上千亿个参数,海量算力的支持。

所以2022年以前,生成式AI看上去很笨,更多是辅助我们做一些内容,比如根据文字转语音,语音转文字。图像层面,大家最熟悉的是各种美颜神器,还有自动抠图、换脸等图像智能编辑、视频智能剪辑。

但2018年GPT这个革命性的算法诞生之后,经过GPT-1、GPT-2、GPT-3三代进化,生成式AI终于进入“专业化、个性化定制内容终稿”阶段,达到替代部分专业内容生产者的目标。

GPT是如何实现这一伟大的进化的呢?下面我把这个机器学习的过程,尽可能用非专业术语描述出来。

3/6、ChatGPT是如何学习的?

生成式AI的难度,在于对人类语言的理解,人类语言含糊、复杂、多义,还有大量象征、隐喻和联想,如何让使用0和1的机器理解呢?

ChatGPT之所以效果惊艳,在于它充分吸取了之前机器学习算法的经验,又有自己的创新之处,整个过程分为三步:

第一步:冷启动监督策略模型(SFT)

这一步的目的是让系统建立大量人类语言的理解模型,训练方法就是让AI做“填空题”和“选择题”,比如:

老王在家里烧菜,发现没盐了,他出门向小李借了一点盐,小李最可能是?

A、邻居; B、供应商; C、儿子

(这一部分的例子都是我随便举的)

这些训练题来自使用OpenAI的试用用户的真实内容,然后雇佣大量“标注工”对这些内容“出题”,并给出答案。

做了大概1.5万条题目后,机器渐渐学会了预测问题的意图,准确率也越来越高,最后形成各种语言策略(SFT)。

当然,这一步训练得到的只是初步的模型,谁也不知道系统到底理解了些什么,输出的内容也就不可靠。国内大部分机器人客服大概就到这一步,且只针对有限的数据库的内容,常常可以看到文不对题的弱智回答,说明机器并没有真正理解人类的意图。

更常见的问题,一旦离开了专业的数据,系统就会出现大量的“反人类”的表达方式,最典型的是自动翻译的很多结果。

想要让系统知道如何“有话好好说”,需要它理解人类各种情景下的表达偏好,这就是“奖励模型”——

第二阶段:训练奖励模型(RM)

接下来进入真正的人工反馈的强化学习,这一步是让模型的输出内容和人类习惯的输出内容进行比对打分,让系统学会像人类一样表达各种微妙的意思。

这一步的具体做法,先让系统自行生成几个答案,再让“标注工”对这些答案的质量进行排序,比如:

问题:情人节有人约你,你不喜欢他,怎么拒绝更委婉?

系统通过之前的学习,给出了三个答案:A、谢谢,今晚我有约了;B、你是个好人,但不适合我;C、太不巧了,我今天要加班。

“标注工”对这些答案的质量进行排序:C>A>B,这些排序最终形成一个对答案优劣打分的奖励模型(RM),让系统越来越能预测人类的表达方式。

如果拿小朋友学习语言来比喻,第一步就像做填空、选择类客观题,最终成果是让系统可以自动生成一些完整有意义的文本;第二步就是做主观题,只不过要求给出几个答案,批卷老师负责对几个答案进行排序,让系统知道什么样的文本更符合人类喜好。

这两步都需要大量人工标注,而这两步结合起来的第三步,要脱离“人类老师”由机器自动检查自己的学习成果,微调策略。

第三步,PPO模型

大致过程是,先用第一步的策略(SFT)随机生成一个新的文本,放到第二步的奖励模型(RM)里打分,根据分数再回头训练生成新的表达策略(SFT),再调整第二步的奖励模型(RM)的函数,反复迭代,生成最终的模型。

到了这一步,就相当于学生“自学”,自己给自己出题,再对答案,根据答案,修正并改进自己的知识体系和学习方法,最终达到毕业的要求。

不过,“毕业”不代表学习结束,GPT-3之后,OpenAI模型提供了外部API调用——就是我们现在做的,产生了真实用户提问和模型迭代之间的飞轮

ChatGPT超出之前模型的重要原因之一,就是引入了人工标注,这么做可以让模型的思维习惯、表达方式、价值观等等,和人类进行最大程度的一致

也许是ChatGPT的表现实在是过于惊艳了,以至于很多人在与它“对话”时都会想到一个问题:

ChatGPT是否真的理解了人类的语言?是否有了思想?如果是这样,它最终会不会发展为一个有知觉的、有自我意识的强人工智能?

4/6、ChatGPT算不算“懂王”?

要回答这个问题,先来看一看ChatGPT训练的两个目标:

1、理解合理、内容流畅和语法正确

2、生成内容的有用性、真实性和无害性

目标一,基本上没有问题,这也是真正让我们惊叹的地方,它似乎真的能理解我们的语言,并用人类的语言和我们交流。

目标二,粗看也没有问题,特别是那些无法通过搜索引擎直接找到的复杂要求,当你与它持续交流后,它会越来越理解你想得到的内容。

但随着使用量的增加,很多人发现,ChatGPT其实并不真正“理解”你的问题,或者说目前还没到这一步。

最典型的证据在于,如果你用一个模糊的方式问一个明显错误的问题,它常常会很认真地给你一个凭空捏造的回答,比如下面的这个唐玄宗大败赵匡胤的问题:

这个错误,我也试了一个,结果到现在都是如此:

我猜,它的训练数据可以让他判断唐玄宗干过什么,赵匡胤干过什么,却无法让它建立唐玄宗与赵匡胤的关系。

本质上说,ChatGPT只是一个“语言机器人”,它能回答你关于计算机的问题,并不是因为它“懂”这方面的知识,它懂的是所有的语言文字在特定要求下的分布概率,并能预测你要的那个概率

所以说,它只是在无意识地模仿人类的表达方式,把搜索到的信息以适合的方式表达得以假乱真

与其说懂,不如说是“不懂装懂”。

当然,这个能力对普通人而言,跟“懂”并没有区别,但普通人的认知水平和表达能力正是机器的“懂”的极限,大部分专业领域,它只能输出该领域中初级人员的内容,更不可能去解决创新的问题

很多人认为,这也许就是机器人的“懂”,说“唐玄宗大败赵匡胤”并不代表不懂,小孩子也会问关公秦琼哪个更厉害的问题,毕竟ChatGPT还很“小”,每天大量的用户训练下,它也许会进步呢?

但我对此并不乐观,其原因在于,ChatGPT效果最大的还是最初1.5万条有监督的语言模型任务(SFT)——人类老师对它的语言习惯影响很大。

你跟ChatGPT聊久了之后,就会发现,它说话的方式有一种说不出来的假模假式,就好像领导拿大话在忽悠你,所以,除了擅长知识性的问题之外,试用者最津津乐道乐道的是让ChatGPT写年终总结、政治口号、思想汇报、老胡体、打油诗、领导关怀、客户回应等等充满了形式感、套话空话一堆的内容。

还有,ChatGPT经常会犯错,比如做计算题,犯的错误还不太一样,并且是真人常犯的错误——它真的很像人类

这里就有一个很严重的问题,如果你问了一个专业上的错误的问题,很可能得到看上去很有用的错误答案,而且因为ChatGPT太会不懂装懂了,很容易让人信以为真——就像那些朋友圈阴谋论一样。

说白了,它的模型就是个没有什么专业特长的普通人,除非下一代模型有质的变化,否则它在这个方面的可进步空间有限。

但ChatGPT的可怕之处,正是这个“普通”二字。

5/6、即将进入的恐怖谷

大家应该都听说过“恐怖谷效应”,随着机器人或人工智能的拟人程度增加,人类对其好感度出现“上升(有点相似)——下降(高度相似)——上升(完全相似)”的过程,而谷底正是人工智能与人类第一次高度相似的时候。

我看到有分析认为生成式AI已经成功跨过了恐怖谷,进入“逼真性”阶段,理由是随着生成内容与人类相似程度的提升,人类对生成式AI的好感正在增加。并热衷于使用,比如ChatGPT是人类历史上最快突破1亿用户的App。

但我的看法刚好相反,它正处于恐怖谷前的“人形机器人”阶段,使用者只是习惯性地把它当成更智能的搜索引擎一类的工具,很快就要意识到ChatGPT的恐怖之处

ChatGPT未来让人害怕的地方恰恰在于,它不像专家,更像是你身边的普通人——如果像专家,它可以替代的工作反而非常有限。

从原理上说,ChatGPT大规模替代人类工作的担心并非杞人忧天。

首先,ChatGPT的商业模式,可能不会像搜索那样依赖广告,难以出现大规模的2C级应用,而更可能是2B,主要运用于工作场景。

其次,ChatGPT与搜索不同,它输出的基本上是最后的工作成果,而不是搜索那样出现一堆内容,让人类去选择,所以它更像“员工”,而不是员工的工作工具

最后,ChatGPT与决策AI不同,它并不寻求像专家那样找到复杂问题的最优解,而是针对大部分人日常工作的非专家级内容,输出相对合理有用的内容。因此,它可能替代人类的工作范围大大超过想象,不像产线工人、打字员、驾驶员那样,仅限于几个特定的职业。

更何况,工具和员工在一定程度上也是利益对立的,比如和ChatGPT类似的AIGC绘画,目前游戏行业已经开始应用,以前画张原画用三天,现在一天弄完,以前要什么素材要去素材网找,现在要啥直接生成,改改就可以用——尤其那些外包公司,工作效率提高好几倍。

AIGC的工具性质更强,需要人去创作,但由于工作效率大大提升,原来需要招三个设计师,现在一个就行了,这仍然是对人的替代。

有预测,2025年,生成式AI产生的数据将占到所有数据的10%,30%的大型组织出站消息将由生成式AI生成;50%的药物发现与研发将使用生成式AI。

我们不用担心AI拥有意识,但我们确实需要考虑AI大规模替代人类工作的可能性。

6/6、会提问题的人将是最后的赢家

必须承认,人类的大部分工作之所以容易被ChatGPT取代,是因为这些工作需要产生大量文本或其他形式的内容,这些内容本身难度并不高——ChatGPT广泛并普通的刚刚好。

不过,正如任何一项技术都有两面性,既可能让懒得思考的人抄答案,也可以让求知若渴者加速进步。写本文时,看到了ChatGPT与 Bing 搜索结合后的功能介绍,它可以让你的工作不但不会被AI取代,反而创造了全新的工作方式。

比如说,你打算写一份新产品推广的方案,你在问它如何写时,可以详细地描述这个产品的特点和你的目标、推广预算。

AI并不会直接给你一份充满套话的无用方案,而是给你一个推广方案的结构,主要建议,主要内容,还会给出相关内容的引用标记和原文链接。

你还可以就这些内容进一步提问,它会给你更多你想要的东西,更重要的是,它甚至还能提供几个你没有想到的延伸问题,看看你是否需要回答。

可以想象,你将边使用“ChatGPT与 Bing 搜索”,边完成你的这项工作,与单纯靠ChatGPT输出的方案不同,它是真有可能产生真正创新性的内容的

如果说,工业革命拉大了财富差距,互联网拉大了资讯获取能力的差距,人工智能则直接拉大了学习能力的差距。

未来世界将属于会提问的人。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10681.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python量化交易09——使用证券宝获取金融行情数据(baostock)

接上一篇文章介绍怎么用Tushare获取日k数据后,本章教大家怎么用证券宝获取数据. baostock 的官网链接:A股K线数据 - www.baostock.com 这是免费的一个库,数据种类也很很丰富,挺好用的。 日K 导入包: import baost…

HFTrader高频交易系统架构

HFTrader高频交易系统架构 一、开发环境搭建 HFTrader高频交易系统作为QuantFabric量化交易系统的一部分,开发环境搭建与开源QuantFabric量化交易系统相同。 二、HFTrader高频交易系统架构 1、HFTrader功能特性 HFTrader期货功能特性如下: 期货行情…

ChatGPT热潮背后,金融行业大模型应用路在何方?——金融行业大模型应用探索

ChatGPT近两个月以来不断引爆热点,对人工智能应用发展的热潮前所未有地高涨,ChatGPT所代表的大模型在语义理解、多轮交互、内容生成中所展现的突出能力令人惊喜。而人工智能技术在金融行业的落地应用仍然面临挑战,虽然已经让大量宝贵的人力从…

Microsoft Edge Dev版本如何使用chat功能

1.开启全局代理 2.访问https://www.bing.com 如何这个时候你访问的页面是长这个样子 那么你需要设置一下地域 我选择美国,点击之后跳转到了https://www.bing.com/?ccus访问地址https://www.bing.com/new 选择加入候补名单 点击加入候补名单 我的申请已经提交了&a…

盘点超三十款国产类ChatGPT大语言模型,你最期待哪个?

目前已经出现的国产ChatGPT有最先发布的百度文心一言,接着是阿里发布的通义千问,商汤发布的商量,以及最近开放测试的科大讯飞星火认知大模型、360 GPT 大模型产品矩阵“360 智脑”,昆仑天工3.5,知乎知海图Ai、实在TARS…

Stanford Alpaca (羊驼):ChatGPT 学术版开源实现

Stanford Alpaca (羊驼):ChatGPT 学术版开源实现 文章目录 Stanford Alpaca (羊驼):ChatGPT 学术版开源实现前言介绍Alpaca 在线体验查语病写代码连续对话能力 原理简要分析一些有意思的观察总结 前言介绍 最近 ChatGPT 大热,让人惊叹其强大…

火爆全网的 ChatGPT 虽然好玩,但是也有几件事是需要当心的 - 弘扬正能量

大家好,我是 哈士奇 ,一位工作了十年的"技术混子", 致力于为开发者赋能的UP主, 目前正在运营着 TFS_CLUB社区。 💬 人生格言:优于别人,并不高贵,真正的高贵应该是优于过去的自己。💬 &#x1f4…

最近很火的ChatGPT和GPT4

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话…

登录次数限制实例

业务逻辑 1、根据用户名从数据库中取出一行数据,并根据数据库服务器时间,算出上次限制登录的时间和当前时间的时间间隔。 2、判断此用户时间间隔过了15分钟没有。如果没有,则给出禁止登录的提示;如果超过15分钟,则判…

ChatGPT爆火| 微软ATP推出教师AI素养提升秘籍

最近全球爆火的ChatGPT,让我们领略AI技术的迅猛发展,尤其在自然语言处理(NLP)、机器学习(ML)等方向与教育的结合日趋紧密,人工智能在教育领域中的应用呈现出快速增长的趋势。 几乎是在一夜之间 ChatGPT刷爆…

怎么把中文用户名改成英文?

我们的c盘存放的是我们系统的文件,有些用户没有键盘分盘,软件游戏也在其中,因为名字是中文,需要更改成英文,那么win11怎么把中文用户名改成英文?很多小伙伴都想要了解,下面就来看看具体的操作。…

英文论文如何进行润色?

众所周知,英文论文投稿是一件专业性非常强的技术工作。想要被期刊收录,以下三个方面缺一不可:论点和论据优秀的论文;优良的英文表达质量;精湛的投稿技术。 在发表英文论文时,由于语言表达的差异&#xff0c…

心法利器[82] | chatgpt下query理解是否还有意义

心法利器 本栏目主要和大家一起讨论近期自己学习的心得和体会,与大家一起成长。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。 2022年新一版的文章合集已经发布,累计已经60w字了,获取方式看这里&…

chatGPT大规模使用kubernetes,云原生技术在AI领域也大有可为

文章目录 一、云原生在AI领域的应用方向1.1、弹性部署1.2、自动化和可维护性1.3安全性和隔离性 二、云原生在AI领域的应用案例2.1、chatGPT全面使用云原生技术2.2、TensorFlow Serving和k8s及docker的集合2.3、AWS SageMaker 三、云原生AI开发平台的发展 公众号: M…

与chagpt对话记录

每日chagpt对话记录 关注我一下 vscode 浏览器版本 c 函数 无法跳转 C/C IntelliSense, debugging, and code browsing. C/C IntelliSense、调试和代码浏览是指在使用VS Code进行C/C开发时的一些核心功能。下面是对这些功能的简要说明: IntelliSense(智能…

使用 ChatGPT 碰到的坑

最近在使用 ChatGPT 的时候碰到一个小坑,因为某些特殊情况我需要使用 syslog 向 logbeat 中发送日志。 由于这是一个比较古老的协议,确实也没接触过,所以就想着让 ChatGPT 帮我生成个例子。 原本我已经在 Go 中将这个流程跑通,所…

ChatGPT帮你调用PID算法【结合代码】

目录 PID算法是一种控制算法 下面分别介绍PID算法中的三个参数 MATLAB代码实现PID MATLAB代码实现PID PID算法是一种控制算法 用于控制系统的稳定性和精度。PID算法的名称来源于其三个组成部分:比例(P)、积分(I)和微…

ChatGPT实战之PID算法实现

让chatgpt写一段pid控制算法,看看效果如何。 通过调参也能实现收敛了。实际应用还是要看你具体的需求了。 话不多说上代码: import matplotlib.pyplot as plt import numpy as np class PositionPID(object): “”“位置式PID算法实现”“” def __ini…

Qt:依据ChatGpt生成Qt可选择扇形按钮

目录 引言1、生成过程1.1 饼图2.2 扇形图3.3 可选择扇形按钮1.4 新的扇形画法*GraphicItem 2、训练过程3、错误原因4、涉及知识点 引言 因为项目需要绘制一个中间为圆心,包含数个扇形的可选择按钮。正好ChatGpt使用起来比较成熟,因此使用询问的方式得到两…

五分钟零基础开发chatgpt+Midjourney工具赢得被动收入

首先感谢laf提供免费使用Midjourney API接口和云函数,需要详细了解的可以访问他们的官网论坛。 感谢论坛前面几位的分享,我做了参考。都有参考就不列啦哈!!! 直接开始: 第一步 复制MJ-SEND云函数到laf云…