ChatGPT的今天,早已被这本书预言了

最近,ChatGPT大火了!推出之后,ChatGPT只用了两个月就积累了1亿用户,随着越来越多的人开始用ChatGPT,发现他能做的东西越来越多,写论文、写作业、写文案、写代码都不在话下。

于是,各种稀奇古怪的问题、要求,也被突发奇想的人类推到了它面前……

小异发现,竟然可以向ChatGPT询问《人工智能:现代方法(第4版)》书籍的推广提纲,并且它能够提供多个切入点和案例建议,实在是智能又方便!

e6af9b48854038f1a678ef0eed443592.jpeg

正由于ChatGPT这种无所不包、什么都能干的特性,让许多人工智能领域的大佬都对其赞叹不已。

不过,这样的称赞都提到了ChatGPT的一个共同特点,那就是ChatGPT具有“孩子”一样的心智

d1a28bdf7a72b9e1feac7e2d5a8e189d.png

换句话说,虽然ChatGPT非常强大,但它就像一个正在成长中的孩子,能发挥多少本事,取决于你培养和训练。

输入的提示词说得越清楚,需求给的越多、越明确,ChatGPT的答复才更接近人们理想中的答案。

59118bf107069e4ebb84548ed0113af8.png

然而,问题来了:像训练ChatGPT这样调教AI的方式,人类之前也不是没试过,为什么今天的ChatGPT能有如此突破性的进展呢?

其实,对于ChatGPT的种种厉害之处,早已有一本权威书籍做出了分析和预测,它就是堪称人工智能领域“大百科全书”的《人工智能:现代方法(第4版)》

656b11abaf7feaa59111c1690113e8b1.jpeg

 点击封面即可购买,限时特惠5折

今天,小异就带大家一起来看下,这本巨著的精彩之处吧!

01

隽永的智慧

本书的作者Stuart Russell,不仅是加利福尼亚大学伯克利分校计算机科学系的教授,也是人类兼容人工智能中心主任,同时还是计算机与思想奖的获奖人之一。

在任教的40多年间,在人工智能领域发表了300多篇论文,妥妥的领域内大佬啊。

508c60b42ff1f2f7c26d9be0dc370e2e.png

到现在,《人工智能:现代方法》已经出到第四版了,这本书英文版成书于2021年,而上一版第三版在2010年。

而这一版本,也是本书最为重要的更新。因为这十年间,人工智能领域实在发生太多大事了,无论是AlphaGo和李世石的对决,还是AlphaFold更是完成了蛋白质结构的预测,再到现在ChatGPT的问世,都标志着人工智能领域的重大进展。

而这本书,则正好对这些关键进展背后的理论、技术进行了重要分析。

比如,里面就提到了ChatGPT为何如此牛的原因。

02 

 ChatGPT力量的源泉

在本书的第二章,作者就提到,其实ChatGPT如此过人的原因,是由于其采用了一种名为Transformer的架构,而这也是ChatGPT最核心的技术

Transformer全称Generative Pre-trained Transformer(也是GPT名字的由来)系列是OpenAI发布的预训练语言模型,这种模型最大的特点,就是可以减少甚至消除人工监督和标记

那这模型是怎么做到这一点的呢?

首先,海量的数据训练,对模型能力的提升总是立竿见影的。

21941a233e09c96914ec521f9fe78aa9.png

但倘若只止步于此,那它和之前的循环神经网络也不会有太大不同,真正令Transformer拉开差距的,是它能够同时并行进行数据计算和模型训练的能力

之前的循环神经网络,虽然能更好地处理有先后顺序的数据(比如语言),但在处理较长序列的数据,例如长文章、书籍时,往往就拉胯了。

因必须按顺序处理数据,这就无法同时并行训练,于是训练时间就被拉得很长,时间一长,模型就会不稳定,就会发生梯度消失之类的情况。

7f7b9d560457c38b51e6584920bcc076.png

所谓梯度消失,指的是在神经网络中,当前面隐藏层的学习速率低于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类准确率反而下降了。

而与之相比,Transformer不仅能够同时并行进行数据计算和模型训练,而且还克服了传统的神经网络技术用浅层的预训练网络来捕捉单词,并无法解决一词多义等问题缺陷。

简单地说,就是TransformerChatGPT学会举一反三了!这使得它的学习效率非常高

03 

字字珠玑,带你了解GPT的独特机理

除了核心架构Transformer外,书中还对ChatGPT背后运转的独特机理进行了揭示。

与BERT模型类似,ChatGPT或GPT-3.5都是根据输入语句,根据语言/语料概率来自动生成回答的每一个字(词语)。从数学或从机器学习的角度来看,语言模型是对词语序列的概率相关性分布的建模,即利用已经说过的语句(语句可以视为数学中的向量)作为输入条件,预测下一个时刻不同语句甚至语言集合出现的概率分布。

ChatGPT 使用来自人类反馈的强化学习进行训练,这种方法通过人类干预来增强机器学习以获得更好的效果。在训练过程中,人类训练者扮演着用户和人工智能助手的角色,并通过近端策略优化算法进行微调。

bbe22c661165539a5ebe2b665dfa5bbe.png

由于ChatGPT更强的性能和海量参数,它包含了更多的主题的数据,能够处理更多小众主题。ChatGPT现在可以进一步处理回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。

04 

想了解AI学习的奥秘?答案就在这里

书中还提到,ChatGPT之所以进化得如此迅速,主要归功于这么几个学习算法:

第一阶段:训练监督策略模型

GPT 3.5本身很难理解人类不同类型指令中蕴含的不同意图,也很难判断生成内容是否是高质量的结果。为了让GPT 3.5初步具备理解指令的意图,人类首先得用“填鸭教育”的方式,让 GPT-3.5模型知道什么是“标准答案”

具体做法是:先在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调 GPT-3.5模型。

如果这一阶段GPT 3.5被训练得不错,人类就会对其鼓鼓掌,并表示:这孩子真聪明,现在可以做些开放式命题了。

4d3ca19cd90d4d811d4a19ce5ec7119b.jpeg

第二阶段:训练奖励模型(Reward Mode,RM)

这个阶段的主要是通过人工标注训练数据(约33K个数据),来训练回报模型。在数据集中随机抽取问题,使用第一阶段生成的模型

只是到了这时,问题不再有“标准答案”,而是对于每个问题,生成多个不同的回答。

对于这些没有标准答案的“开放式问题”,人类标注者会对这些结果综合考虑给出排名顺序。

接下来,使用这个排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对。RM模型接受一个输入,给出评价回答质量的分数。这样,对于一对训练数据,调节参数使得高质量回答的打分比低质量的打分要高。

86c354a5ec8a312f33e1e0ecc53e4d1e.png

第三阶段:采用PPO(Proximal Policy Optimization,近端策略优化)强化学习来优化策略。 

PPO的核心思路在于将Policy Gradient中On-policy的训练过程转化为Off-policy,即将在线学习转化为离线学习,你可以把这个过程理解为从开卷考试到闭卷考试的转变

不但不让“翻书”了,而且问题的随机性也大大增加。

通过在第二阶段训练好的奖励模型数据集中随机抽取问题,使用PPO模型生成回答,并用上一阶段训练好的RM模型给出质量分数。把回报分数依次传递,由此产生策略梯度,通过强化学习的方式以更新PPO模型参数。

如果我们不断重复第二和第三阶段,通过迭代,会训练出更高质量的ChatGPT模型。

05 

一份AI的藏宝图,等你来打开

除了上述内容外,小异发现书中还介绍了很多关于ChatGPT的技术点,其中就包括但不限于:

—— 卷积网络、循环神经网络

——机器学习(数据科学)

——深度学习(人工神经网络)

——语言模型(词向量、语料库)

——人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)

——自监督学习

——GAN生成式对抗网络

甚至,怀有人文精神的作者,还在本书的第27章和第28章中,专门用两个章节的内容,来探讨了人工智能的哲学、伦理和安全性的问题。

可以说,这是一本既有技术,又有温度的巨著。

在这个AI技术日新月异的当下,ChatGPT背后强大学习算法,无疑代表了人工智能技术最闪亮的结晶,而本书正是对人工智能发展过程中,这些结晶的总结与分析

5b678157512ab191c7241b6d4edd8c34.jpeg

 点击封面即可购买,限时特惠5折

从最初的图灵测试,一直到今天的强化学习算法,书中涵盖了人工智能发展过程中所涉及的数学、心理学、神经科学、计算机科学等多方面内容。

其内容之丰富,就像一张隐藏了无数宝藏的藏宝图,在眼前徐徐展开。

在这个瞬息万变的智能时代,倘若我们能对书中的理论、知识细细钻研,那么必将会使自己在即将到来的科技革命前获得更大优势。

文案:廖  编辑:fine.  审校:桐希、罗玉淇、单瑞婷

参考来源:

1.《大模型正成为AI浪潮的重要拐点》

2.《ChatGPT发展历程、原理、技术架构详解和产业未来》

—END—

bbbeefd4fc1693024a3265475e9f0ecf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14025.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于 ChatGPT 的输出训练开源 LLM,糟透了!

【CSDN 编者按】曾以为在 ChatGPT 上训练模型是不错的捷径,可如今所有的大模型都依靠GPT来训练,所有这些内容都来自一个模型,越来越难以区分 LLM 生成的和真正有价值的内容。或许更多基于开源数据集的 LLM 才是我们所需要的。 作者 | Martin …

ChatGPT赋能产品管理

在产品管理和开发过程中,可以利用ChatGPT辅助完成部分工作,提高工作生产力和创造力。原文: How to use ChatGPT in product management 相信你肯定听说过最近大火的ChatGPT,用自然语言跟机器人聊天是挺有趣,不过我还是希望探索一下…

母亲节快乐- AI绘图节日图片走一波

祝愿天下母亲节日快乐,平安喜乐。

巴比特 | 元宇宙每日必读:训练AI模型也得付钱?版权商们正审查自己“被用于训练ChatGPT”的内容,希望获得应有的补偿...

摘要:据华尔街见闻报道,AI聊天机器人凭借其出色的能力,成为环球市场的焦点,让互联网公司之间掀起了新一轮“军备竞赛”。但是,用于训练人工智能的数据,如新闻、书籍等,许多都是有版权归属的&…

ChatGPT来临,架构师何去何从?

你好,我是李运华。 最近科技圈大火的事件就是ChatGPT的全球火热流行。这款由OpenAI公司在2022年11月底推出的聊天机器人,创造了史上消费应用最快达成1亿用户的历史,在推出仅仅两个月后,月活跃用户估计已达1亿,成为历史…

再度摊上官司了?侵权之争揭秘:ChatGPT对低代码开发平台的冲击

前言 人工智能(AI)技术的迅猛发展带来了前所未有的机遇与挑战。ChatGPT作为AI技术的代表,因其出色的对话模拟功能而一度爆红。但其背后屡禁不止的侵权行为也引发了人们对AI侵权现象的广泛关注。 近年来,人工智能(Artif…

米哈游投资造火箭/ 马斯克裁员高招曝光/ 三星拍月亮是照骗…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月13日星期一,新的一周开始了。 先来和日报君一起看看最近科技圈都发生了哪些大事吧~ 马斯克辞退高薪员工伎俩曝光 为了省钱,马斯克可是使尽了各种手段。 最近&#xff0…

深入了解云计算:发展历程、服务与部署模型、未来趋势与挑战

开篇博主 bluetata 的观点:PaaS 服务必将是未来10年云计算权重最高的趋势(05/02/2023 15:32) 文章目录 一、前言二、认识了解云计算2.1 什么是云计算2.1.1 维基百科上的云计算定义2.1.2 NIST 标准云计算定义2.1.3 如果被面试如何解释云计算 2…

ChatGPT被起诉索赔30亿!OpenAI接连“吃官司”

随着ChatGPT风靡全球,其开发商OpenAI就接连不断地面临着越来越多的质疑与批评。近日,OpenAI就陷入了接连“吃官司”的状态之中。 6月29日,有16 名匿名人士向美国加利福尼亚州旧金山联邦法院提起诉讼,称 ChatGPT 在没有充分通知用…

GPT-4 考 90 分全假!30 年资深律师用 ChatGPT 打官司,6 个虚假案例成笑柄

这是「进击的Coder」的第 835 篇技术分享 编辑:桃子 拉燕 来源:新智元报道 “ 阅读本文大概需要 5 分钟。 ” 【新智元导读】ChatGPT 又有什么错呢?美国律师向法院提交的文件中,竟引用了 6 个根本不存在的案例,反倒惹…

尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询?

文章目录 尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询?Google Bard 的自我介绍Google Bard 暂时不支持中文Google Bard除了支持英语外,还支持日语Google Bard和OpenAI ChatGPT的对比Google Bard的回答O…

chatgpt赋能python:Python控制循环次数详解:多种方法实现

Python控制循环次数详解:多种方法实现 在Python编程中,循环是非常常见的操作。有时候,我们需要控制循环次数来确保程序正常运行并避免无限循环。本文将介绍Python中多种控制循环次数的方法。 1. for循环控制循环次数 for循环是最常见的循环…

奇舞周刊478期:算法工程师深度解构 ChatGPT 技术

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ 算法工程师深度解构 ChatGPT 技术 本文用专业视野带你由浅入深了解 ChatGPT 技术全貌。它经历了什么训练过程?成功关键技术是什么?将如何带动行业的变革&am…

联网之后的ChatGPT,已经远不止“iPhone时刻”那么简单

文| Juny 编辑| VickyXiao 从默默无闻到颠覆整个互联网需要多久?OpenAI告诉你,四个月。 自从去年11月ChatGPT正式发布以来,OpenAI团队更新AI产品和技术的速度快到已经突破了人们的想象。就在上周刚刚宣布推出能力更强大的GPT-4之后&#xf…

python版电报API接入从零到一(有彩蛋)

文章链接 编号分类文章及链接介绍作者来源分类撰写日期收录日期F1框架python版telegram接入开源botpython-telegram-botGithub2023-04-24 申明:本文仅作试验研究用,不对参考本文操作产生的各种结果承担任何责任。 Q&A 使用Telegram的API需要交费吗…

chatgpt赋能python:使用Python来进行抢购,如何轻松秒杀商品

使用Python来进行抢购,如何轻松秒杀商品 在现代社会,大量的人们使用电商平台来完成他们的购物需求。然而,在疯狂的购物节日时,例如"双11",商品往往会被抢购一空。为此,许多人希望能够使用自动化…

谷歌借力AlphaGo造大模型,称其秒杀ChatGPT!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 在 GPT 战场上,谷歌的口令向来是:「咱不能输」。 虽然 Bard 曾在首秀时闹出大乌龙,但谷歌如今还手握 DeepMind 这张牌。 听闻这一次,带着杀手锏出击…

chatgpt赋能python:Python如何访问网页

Python如何访问网页 Python是一种被广泛用于web开发、数据科学和人工智能的编程语言。但是,你知道Python还可以用于访问网页吗?在本文中,我们将介绍Python如何访问网页,帮助您了解Python的这一方面,并掌握它的实际应用…

ChatGPT访问量再创新高:百度的60%,谷歌的2%

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 梦晨 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT上月全球访问量 17.6 亿次,已达到谷歌的2%! 根据SimilarWeb统计,已超越必应、鸭鸭走D…