ChatGPT的今天,早已被这本书预言了|文末赠书

最近,ChatGPT大火了!推出之后,ChatGPT只用了两个月就积累了1亿用户,随着越来越多的人开始用ChatGPT,发现他能做的东西越来越多,写论文、写作业、写文案、写代码都不在话下。

于是,各种稀奇古怪的问题、要求,也被突发奇想的人类推到了它面前……

小异发现,竟然可以向ChatGPT询问《人工智能:现代方法(第4版)》书籍的推广提纲,并且它能够提供多个切入点和案例建议,实在是智能又方便!

e9d77bf878e3fb2a1c7cf602763ee8fb.jpeg

正由于ChatGPT这种无所不包、什么都能干的特性,让许多人工智能领域的大佬都对其赞叹不已。

不过,这样的称赞都提到了ChatGPT的一个共同特点,那就是ChatGPT具有“孩子”一样的心智

43dd5de12a7f4365f2b9165afd77e55d.png

换句话说,虽然ChatGPT非常强大,但它就像一个正在成长中的孩子,能发挥多少本事,取决于你培养和训练。

输入的提示词说得越清楚,需求给的越多、越明确,ChatGPT的答复才更接近人们理想中的答案。

16e6f480174ebac1e3131ea52d12a1da.png

然而,问题来了:像训练ChatGPT这样调教AI的方式,人类之前也不是没试过,为什么今天的ChatGPT能有如此突破性的进展呢?

其实,对于ChatGPT的种种厉害之处,早已有一本权威书籍做出了分析和预测,它就是堪称人工智能领域“大百科全书”的《人工智能:现代方法(第4版)》

0762491a3e41ed2ac5bd84a07582ac9c.jpeg

 点击封面即可购买,限时特惠5折

今天,小异就带大家一起来看下,这本巨著的精彩之处吧!

 01 

隽永的智慧

本书的作者Stuart Russell,不仅是加利福尼亚大学伯克利分校计算机科学系的教授,也是人类兼容人工智能中心主任,同时还是计算机与思想奖的获奖人之一。

在任教的40多年间,在人工智能领域发表了300多篇论文,妥妥的领域内大佬啊。

06359273d338c0d33e9a36cc16141222.png

到现在,《人工智能:现代方法》已经出到第四版了,这本书英文版成书于2021年,而上一版第三版在2010年。

而这一版本,也是本书最为重要的更新。因为这十年间,人工智能领域实在发生太多大事了,无论是AlphaGo和李世石的对决,还是AlphaFold更是完成了蛋白质结构的预测,再到现在ChatGPT的问世,都标志着人工智能领域的重大进展。

而这本书,则正好对这些关键进展背后的理论、技术进行了重要分析。

比如,里面就提到了ChatGPT为何如此牛的原因。

 02 

 ChatGPT力量的源泉

在本书的第二章,作者就提到,其实ChatGPT如此过人的原因,是由于其采用了一种名为Transformer的架构,而这也是ChatGPT最核心的技术

Transformer全称Generative Pre-trained Transformer(也是GPT名字的由来)系列是OpenAI发布的预训练语言模型,这种模型最大的特点,就是可以减少甚至消除人工监督和标记

那这模型是怎么做到这一点的呢?

首先,海量的数据训练,对模型能力的提升总是立竿见影的。

cc2c41302b98a1bb046929ffe3e18bdb.png

但倘若只止步于此,那它和之前的循环神经网络也不会有太大不同,真正令Transformer拉开差距的,是它能够同时并行进行数据计算和模型训练的能力

之前的循环神经网络,虽然能更好地处理有先后顺序的数据(比如语言),但在处理较长序列的数据,例如长文章、书籍时,往往就拉胯了。

因必须按顺序处理数据,这就无法同时并行训练,于是训练时间就被拉得很长,时间一长,模型就会不稳定,就会发生梯度消失之类的情况。

34ca8a0a1bc908a2e70582e11f025530.png

所谓梯度消失,指的是在神经网络中,当前面隐藏层的学习速率低于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类准确率反而下降了。

而与之相比,Transformer不仅能够同时并行进行数据计算和模型训练,而且还克服了传统的神经网络技术用浅层的预训练网络来捕捉单词,并无法解决一词多义等问题缺陷。

简单地说,就是TransformerChatGPT学会举一反三了!这使得它的学习效率非常高

 03 

字字珠玑,带你了解GPT的独特机理

除了核心架构Transformer外,书中还对ChatGPT背后运转的独特机理进行了揭示。

与BERT模型类似,ChatGPT或GPT-3.5都是根据输入语句,根据语言/语料概率来自动生成回答的每一个字(词语)。从数学或从机器学习的角度来看,语言模型是对词语序列的概率相关性分布的建模,即利用已经说过的语句(语句可以视为数学中的向量)作为输入条件,预测下一个时刻不同语句甚至语言集合出现的概率分布。

ChatGPT 使用来自人类反馈的强化学习进行训练,这种方法通过人类干预来增强机器学习以获得更好的效果。在训练过程中,人类训练者扮演着用户和人工智能助手的角色,并通过近端策略优化算法进行微调。

666c79493cb39d17f4cac62bee66b785.png

由于ChatGPT更强的性能和海量参数,它包含了更多的主题的数据,能够处理更多小众主题。ChatGPT现在可以进一步处理回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。

 04 

想了解AI学习的奥秘?答案就在这里

书中还提到,ChatGPT之所以进化得如此迅速,主要归功于这么几个学习算法:

第一阶段:训练监督策略模型

GPT 3.5本身很难理解人类不同类型指令中蕴含的不同意图,也很难判断生成内容是否是高质量的结果。为了让GPT 3.5初步具备理解指令的意图,人类首先得用“填鸭教育”的方式,让 GPT-3.5模型知道什么是“标准答案”

具体做法是:先在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调 GPT-3.5模型。

如果这一阶段GPT 3.5被训练得不错,人类就会对其鼓鼓掌,并表示:这孩子真聪明,现在可以做些开放式命题了。

b34abdbff94968e600e788411820d717.jpeg

第二阶段:训练奖励模型(Reward Mode,RM)

这个阶段的主要是通过人工标注训练数据(约33K个数据),来训练回报模型。在数据集中随机抽取问题,使用第一阶段生成的模型

只是到了这时,问题不再有“标准答案”,而是对于每个问题,生成多个不同的回答。

对于这些没有标准答案的“开放式问题”,人类标注者会对这些结果综合考虑给出排名顺序。

接下来,使用这个排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对。RM模型接受一个输入,给出评价回答质量的分数。这样,对于一对训练数据,调节参数使得高质量回答的打分比低质量的打分要高。

2d15ef89b99a6ea378561b71af7fc4e3.png

第三阶段:采用PPO(Proximal Policy Optimization,近端策略优化)强化学习来优化策略。 

PPO的核心思路在于将Policy Gradient中On-policy的训练过程转化为Off-policy,即将在线学习转化为离线学习,你可以把这个过程理解为从开卷考试到闭卷考试的转变

不但不让“翻书”了,而且问题的随机性也大大增加。

通过在第二阶段训练好的奖励模型数据集中随机抽取问题,使用PPO模型生成回答,并用上一阶段训练好的RM模型给出质量分数。把回报分数依次传递,由此产生策略梯度,通过强化学习的方式以更新PPO模型参数。

如果我们不断重复第二和第三阶段,通过迭代,会训练出更高质量的ChatGPT模型。

 05 

一份AI的藏宝图,等你来打开

除了上述内容外,小异发现书中还介绍了很多关于ChatGPT的技术点,其中就包括但不限于:

—— 卷积网络、循环神经网络

——机器学习(数据科学)

——深度学习(人工神经网络)

——语言模型(词向量、语料库)

——人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)

——自监督学习

——GAN生成式对抗网络

甚至,怀有人文精神的作者,还在本书的第27章和第28章中,专门用两个章节的内容,来探讨了人工智能的哲学、伦理和安全性的问题。

可以说,这是一本既有技术,又有温度的巨著。

在这个AI技术日新月异的当下,ChatGPT背后强大学习算法,无疑代表了人工智能技术最闪亮的结晶,而本书正是对人工智能发展过程中,这些结晶的总结与分析

6d75c8d45ae683e07c1cb15fa301dd12.jpeg

 点击封面即可购买,限时特惠5折

从最初的图灵测试,一直到今天的强化学习算法,书中涵盖了人工智能发展过程中所涉及的数学、心理学、神经科学、计算机科学等多方面内容。

其内容之丰富,就像一张隐藏了无数宝藏的藏宝图,在眼前徐徐展开。

在这个瞬息万变的智能时代,倘若我们能对书中的理论、知识细细钻研,那么必将会使自己在即将到来的科技革命前获得更大优势。

文案:廖  编辑:fine.  审校:桐希、罗玉淇、单瑞婷

参考来源:

1.《大模型正成为AI浪潮的重要拐点》

2.《ChatGPT发展历程、原理、技术架构详解和产业未来》

抽奖赠书

本次福利将送出《人工智能:现代方法(第4版)》* 5本,超高中奖率(参与人少,多期中奖率超过90%)

为避免撸羊毛的用户参与抽奖,让更多真实用户获得社区福利,现在把抽奖方式切换到 spring4all.com 网上通过积分参与。

本次抽奖地址:http://spring4all.com/forum-post/2244.html

还有一大波福利正在路上,一起来参与社区内容的建设,一起学习一起成长吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9566.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI ChatGPT 3.5模型和清华开源ChatGLM-6B模型的对比,到底ChatGPT强在哪里(内含几个国内GPT可用途径)

目录 前言: (1)环境 (2)比较用例 (a)中文提问:用java写冒泡排序算法 (b)中文提问:a10,b6,不新增变量,怎么交换a和b的值&#xff…

当ChatGPT的子弹射中知乎

题图|视觉中国 毫无疑问,ChatGPT 已然成为 2023 上半年最有影响力的商业话题。 ChatGPT 横空出世仅百余天便让整个互联网都为之躁动,心有猛虎的公司都在寻找向上攀爬的入口——“文心一言”之于百度、“通义千问”之于阿里、百川智能之于王小…

OpenAI Translator - 基于 ChatGPT的最强开源 AI 划词翻译工具

为啥要造这个轮子? 我开发了一个 Bob 的插件 bob-plugin-openai-translator 使用 ChatGPT API 在 macOS 上进行全局划词翻译。 但是由于很多用户并不是 macOS 用户,所以特此开发了一个浏览器插件方便非 macOS 用户使用 ChatGPT 进行划词翻译。 既是浏…

Mac最先进的API工具-RapidAPI for Mac

一、前言 当使用 Mac 进行接口测试的时候,一般都会想到接口测试工具 Postman、Jmeter。 Postman 以其页面友好,功能简单,可以快速上手进行接口测试。而 Jmeter 除了测接口外,还可以进行接口自动化测试、性能测试等。 本篇将介绍…

【接口工具ApiPost】Mac系统安装(1)

ApiPost目前提供Window64位,Window32位、Mac、Linux版本的安装包下载。 ApiPost下载页:https://www.apipost.cn/download.html Mac系统安装 流程如下: 升级安装 初次安装打开后的界面 登录 账户登录: 微信登录 所以最后…

Mac 获取 App store下载的文件包 pkg

因为某种原因,我需要搞到 App store 中的某个软件的 pkg 安装文件,百度了半天,没一个能用的。。。不多bb,自力更生,直接开搞 我的系统是Big Sur 访达按CommandShiftG,进入 /private/var/folders 目录 这时…

与ChatGPT合作解析《三体》数学

最近都在讨论爆火的ChatGPT可能会替代10大职业,其中小编所在的媒体工作者就是其中之一,顿时有种危机感……于是开始试探ChatGPT这个竞争对手的真实实力——让它写一篇《三体》中数学问题的文章: 【ChatGPT】 根据上面生成的文章,…

论文阅读和分析:Mathematical formula recognition using graph grammar

HMER论文系列 1、论文阅读和分析:When Counting Meets HMER Counting-Aware Network for HMER_KPer_Yang的博客-CSDN博客 2、论文阅读和分析:Syntax-Aware Network for Handwritten Mathematical Expression Recognition_KPer_Yang的博客-CSDN博客 3、论…

理解不同加密币的要点(一)—— 共识机制

一、加密货币分类 (一)价值层面 与实体资产绑定的代币 为了因应市场需求而生,与实体资产做挂钩的代币,也就是我们说的稳定币。例如与美元做挂钩的USDT、TUSD、PAX与USDC等。 仰赖网络共识的代币 代币价值仰赖网路上市场共识…

雅虎布局AI,台湾会议结束,cntm继续一飞冲天

开年以来,由ChatGPT激起的涟漪,已经变为汹涛骇浪。近日来,微软、谷歌、百度、阿里、京东先后加入战局。然而,就在互联网巨头群雄逐鹿的同时,记者注意到,一款同名虚拟货币也悄悄拿起了“镰刀”。 除此之外&a…

关于数字货币之间相互制衡的一场讨论|ChatGPT

注:本文由区视crypto与ChatGPT深度对话编辑生成,可转载 数字货币是一种利用密码学原理进行点对点传输的电子货币,它不依赖于中央银行或政府来发行、监管或控制。目前,数字货币市场上有许多不同的币种,其中最著名的是比…

App Store 新定价机制 - 2023年最全版

作者:iHTCboy 本文介绍了苹果 App Store 的新定价机制,是 App Store 在 15 周年之际推出的最重要价格升级。 文章通过“为什么,是什么,怎么办”的方法论,让读者从根本原理上理解新机制的意义、背后的原因以及应对方式。…

微信小程序实现多语言方案|中英互译

不管哪个系统,多语言方案套路都是一样的 1、建立多语言映射库 2、记录并存储用户选择的语言版本,下次进入直接进入对应语言版本 3、根据用户设置动态加载语言版本 4、前台调用 效果图 🐤 小程序代码片段(建议看代码片段&#xff…

多语种翻译互译,批量小语种翻译互译

多语种包括联合国通用语种(汉语、英语、俄语、阿拉伯语、法语、西班牙语)和其他不包括在内的小语种,例如日语、韩语、德语和意大利语等。多语种互译软件支持中外语言互译,可以将我们的中文翻译成以上所述的其他语种。 多语种互译软…

AI绘画太好玩了!哈哈哈哈哈~~

最近,AI绘画非常流行,只要输入一些关键词(prompt脚本),就可以AI帮你绘画出精美的图画,真的很有意思。小灰也对AI绘画爱不释手。 在百度上随便搜一下,就能搜出各种乱七八糟的AI绘画平台&#xff…

chatgpt赋能python:Python图画不出来真的会影响SEO吗?

Python图画不出来真的会影响SEO吗? Python是一种高级编程语言,被广泛应用于科学计算、数据挖掘和人工智能等领域。Python语言的简洁、易读易写的特点,让它成为了开发者的首选之一。然而,在SEO优化中,Python却有着一个…

如何与孩子聊ChatGPT:AI大时代的完整版家长指南

前言 ChatGPT和GPT-4迅速蹿红,一夜之间成为新一代人工智能的代言人。家长朋友们有没有发现,家里爱学习的小朋友突然多了很多关于AI的问题? 我是个五年级小朋友的家长,也长期做人工智能技术研发、项目孵化与投资。因为ChatGPT&…

脉脉疯传!2023年程序员生存指南;多款prompt效率加倍工具;提示工程师最全秘籍;AI裁员正在发生 | ShowMeAI日报

👀日报合辑 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 2023年程序员生存指南 不要在互联网公司做低代码项目 保证一定强度的刷题,不要用go刷题,用cpp或者java,性价…

【AI作画】使用DiffusionBee with stable-diffusion在mac M1平台玩AI作画

DiffusionBee是一个完全免费、离线的工具。它简洁易用,你只需输入一些标签或文本描述,它就能生成艺术图像。 DiffusionBee下载地址 运行DiffusionBee的硬性要求:MacOS系统版本必须在12.3及以上 DBe安装完成后,去C站挑选自己喜欢…

Midjourney8种风格极其使用场景(1)

目录 ​编辑 引言 等距动画 场景 分析性绘图 场景 着色书 场景 信息图画 场景 双重曝光 场景 图示性绘画 场景 二维插图 场景 图解式画像 场景 总结: 八种风格箴言: 引言 我相信大家都或多或少玩过Midjourney,但是要形…