ChatGPT的跳跃式技术突破!

ChatGPT自从发布以来,一直热度不减,围绕它的话题也是持续不断。

而ChatGPT 之所以引起这么大的社会反响,不仅仅是因为它作为一个对话机器人,效果比之前的对话机器人好了一大截,因为它从技术的角度来看,出现了一些跳跃式的技术突破,业界称这种现象为“涌现”。

ChatGPT最有代表性的涌现能力是“思维链”

下面我们详细探讨一下。

思维链(Chain of Thought,CoT)是一种思维工具,通过逐步延伸和拓展一个主要想法,帮助人们进行更深层次的思考,并得出更复杂、更全面的结论。

思维链的核心思想是先将一个主要想法视为一个链条的起点,然后通过逐渐延伸这个链条,使得这个主要想法不断衍生出更多的相关想法。每个衍生出来的想法,都可再作为一个链条的起点,再次拓展延伸,直至得出最终结论。

01

现象展示

先来看一个大模型拥有思维链的例子,如下图所示。

13ed3539eddea3a5ebba4d3db3394724.png

在上面的这个例子中,我们直接问 GPT-3 一个包含数学推理的问题:

一个人有 16 个球,一半是高尔夫球,在高尔夫球中又有一半是蓝色的,问 一共有多少个蓝色的高尔夫球?

面对这个简单的问题,GPT-3 的回答却是错误的。

但是,只要我们在问题中加上一句“让我们一步一步思考”。GPT-3 不仅答对了,还把推理的过程完整描述出来。这种现象非常神奇,以至于有人打趣道:“这是 AI 在向人类求鼓励啊!只要得到鼓励,效果就会大幅提升。”

大模型拥有的这种思维链能力,并不是在模型训练过程中训练出来的,人们也从来没有想到过它会有这种能力,只不过在偶然的情况下,研究人员通过加入“让我们一步一步思考”这句话才发现,就像这种能力是突然“涌现”的一样。

ChatGPT 也有这种能力,不过 ChatGPT 后期经过调教,已经不再需要用其他话语来激发这种能力了,直接跟它对话就可以。

当然,如果它的答案是错误的,或者推理过程不够详细,那么还是可以利用类似于“让我们一步一步思考”的话语来提升 ChatGPT 的答案质量的。

用户:想把 100 根火柴分成 10 堆,每堆火柴的根数都是单数,且相邻的两 堆相差两根火柴,应该怎么分?

ChatGPT:首先,我们需要知道每堆火柴的根数应该是多少。由于每堆火 柴的根数都是单数且相邻的两堆相差两根火柴,因此,我们可以从 1 开始,每 次增加两根,即 1、3、5、7、9、11、13、15、17、19。

接下来,我们从第 10 堆开始,每堆减少两根火柴,即 19、17、15、13、11、9、 7、5、3、1。

按照这个方法,我们可以将 100 根火柴分成 10 堆,每堆火柴的根数都是单数,且相邻的两堆相差两根火柴,具体分配方案如下。

第 1 堆:1 根火柴

第 2 堆:3 根火柴

第 3 堆:5 根火柴

第 4 堆:7 根火柴

第 5 堆:9 根火柴

第 6 堆:11 根火柴

第 7 堆:13 根火柴

第 8 堆:15 根火柴

第 9 堆:17 根火柴

第 10 堆:19 根火柴

这种能力涌现现象引起了研究人员极大的兴趣,使其纷纷对这种现象开展了深入研究。

研究的第一个问题是“这种现象是普遍的还是个例?” 经过研究发现,这种现象不是个例,而且都有一定的规律。如下图所示。

b8a79d5a92b63811cdccde58b9a2b229.jpeg

在多种不同的数据集上都有涌现现象,其中的每一个子图都是模型在不同数据 集上的效果图,横坐标都是模型规模,纵坐标都是模型回答这些数据库题目的 准确率。我们在这些图中可以观察到一个普遍的现象 :模型在规模达到一定的 阈值前,回答问题的准确率一直都特别差,但模型在规模达到一定的阈值后, 准确率会快速提升。

02

深度讨论

研究者人员对这种现象感兴趣的原因,还有一部分是想了解这种现象的成因。目前这个领域的研究非常新,还没有形成统一的认知,只是有一些猜测。

如果我们把涌现现象出现的场景研究得更透彻一些,那可能对我们研究其原理有所帮助。

先来讨论一个问题:我们用大模型做的各种各样的任务有哪些出现涌现现象,这些出现涌现现象的任务都有什么特点?这些任务与其他任务有什么区别?

经过研究发现,那些我们不用怎么思考就能得出答案的任务,大模型对这些任务的处理效果随着模型规模的增加是符合标度律的。比如,判断一个餐馆是好吃还是难吃,在这类问题的数据集上的模型效果如下图所示。

506aa47d3985e7709aee296a8842d16c.jpeg

而另一类任务,也就是我们在回答时需要仔细思考和多步推理才能回答的任务,是符合涌现现象的,比如数学应用题,在这类问题的数据集上的模型效果如下图所示。

64aa7c2891ba02cf1e49f43336a4f64b.jpeg

这个研究结果不由得让我们想起了认知学领域里一个有名的理论:System 1 (系统 1)和 System 2(系统 2)理论

System 1 和 System 2 理论是由诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特沃斯基(Amos Tversky)共同提出的。

他们在 20 世纪 70 年代提出了“心理学中的双重过程理论”,认为人类的认知过程可以分为两部分:1快速、自动化的 System 1;2缓慢、有意识的 System 2,如下图所示。该理论对心理学、经济学、神经科学等多个学科领域产生了广泛影响,并被广泛应用于各种决策和行为的分析和解释中。

955c26ac48278f538305d403a1d37508.jpeg

System 1 是一种自动化、快速和无意识的认知系统,像一位能够快速反应的消防员,能够在不经过深思熟虑的情况下快速做出反应。比如,当我们看到一张熟悉的面孔时,我们会立即意识到这是我们的朋友。当我们看到一只猫从街角冲过来时,我们会立即躲开,而不需要花费时间思考怎么做。System 1 基于我们之前的经验和模式进行识别,可以让我们快速做出反应,而不需要深思熟虑。

System 2 是一种有意识、慢速和深思熟虑的认知系统,像一位慢而稳健的科学家,能够通过分析信息、推理和评估信息的可靠性做出决策。比如,在做一道数学题时,我们需要仔细阅读题目,考虑各种可能的解决方案,进行计算并得出答案。这个过程需要我们投入更多的认知资源和注意力,需要经过深 思熟虑来做出决策。System 2 能够帮助我们分析和解决一些复杂的问题,从而得出更加准确的结论。

System 1 和 System 2 经常同时运作。在日常生活中,我们有时需要快速做出决策,同时需要仔细分析和解决一些复杂的问题。例如,在开车时, System 1 会自动帮我们控制方向盘、踩油门和刹车,让我们快速适应不同的 交通状况。但是,当我们进行高速驾驶或者遇到复杂的路况时,System 2 就 需要介入,让我们深思熟虑地决策。

可以发现,出现涌现现象的这些任务,往往是人们的 System 2 处理的任务。 那人们在处理 System 2 类的任务时和在处理 System 1 类的任务时,其过程有什么区别呢?弄清楚其中的区别,我们就可能更容易理解大模型出现涌现现象的原因。

人类在使用 System 2 解决问题时,通常会先有一个大概的整体规划或目标,然后一步一步地推理和分析,以便达到这个目标。

这个过程可以分为下图所示的步骤。

8ffd14dd703b84af88039fb729a1770e.png

对这些步骤解释如下。

(1)确定目标或问题:在使用 System 2 解决问题时,首先需要明确目标 或问题,以便有针对性地思考和分析。例如,在做一个复杂的决策时,我们需 要先确定考虑的因素和问题,以便有条理地进行分析。

(2)制定计划和假设:针对明确的目标或问题,我们需要制定一个大概的计划或假设,以便有一个整体的思路和方向。这个计划或假设可以帮助我们更好地组织思路,更好地理解问题和制定解决方案。

(3)推理和分析:这个过程通常包括对信息进行分类、比较、评估、整合和归纳等,以便得出结论或做出决策。

(4)验证和调整:验证和调整我们的结论或决策,以便更好地适应实际情况和需求。这个过程通常包括对结论或决策进行测试、评估和反思等,以便进行调整和优化。

仔细想一下,这个过程是不是跟程序员编写程序的过程非常像?

程序员编写程序的过程:首先确定程序要实现的目标和问题,然后制定一个大概的思路和计划,接着按照计划一步一步地写出代码,最后验证代码的正确性并调试。

这时我们不得不做一个关联性非常强的假设:是不是在训练模型的过程中加入的代码数据导致了思维链的出现?

经过研究发现,有很多证据表明,没有加入代码到训练数据中的模型没有出现思维链。而加入了代码到训练数据中的模型出现了思维链。但是为什么加入了代码就会出现思维链呢?

研究人员的初步推测是,因为在代码的训练数据中有很多通过多步推理解决问题的描述和代码,还有很多需要多步数学运算过程的描述性信息。这些代码及信息,和人们利用 System 2 解决问题的思考过程有很多相似的地方。模型在见到大量这样的数据之后,学会了通过一步一步推理来得到最终答案的能 力。

当然,这只是目前研究人员的一些猜测和初步研究。真实的原因到底是什么, 相信在研究人员的不断努力下一定会有结果。

以上内容是节选自《一本书读懂ChatGPT》一书,欢迎阅读本书系统地了解ChatGPT!

9b7b113967946e2be70c66612ac960aa.png

08d540fbe06f35b5d68518ccf133c4f5.png

4801223801cc606ab405c796ba117ced.png

京东限时五折,快快扫码抢购吧!

92dca343fa8cc20a0c53046ad619c2e5.gif

点击阅读原文,查看本书详情!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10752.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT , 王炸!!!

昨天我们的ChatGPT星球 实在是太火爆了, 原本以为加入的兄弟不会太多, 我就只设置了50张优惠券, 没想到不到1个小时又被抢完了。 欢迎你加入我们的「ChatGPT编程圈」,带着大家一起探索ChatGPT和新的AI时代。 ChatGPT 编程圈&#…

ChatGPT的语言艺术

介绍 本文用于了解和利用各种提示技术,从ChatGPT生成高质量的答案。 我们将探讨如何利用不同的提示工程技术来实现不同的目标。ChatGPT是一种最先进的语言模型,能够生成类似人类的文本。然而,了解向ChatGPT提问的正确方式,以获得我…

浅尝基于 GPT3 模型的 IDE: Cursor 用法全解读

目录 一、安装介绍二、测试功能2.1 常规类编程任务2.2 爬虫 三、更多推荐 一、安装介绍 Cursor 是一个基于人工智能技术的代码生成器,它可以根据程序员输入的代码上下文和要实现的功能,自动生成相应的代码。支持多平台 Mac / Windows / Linux&#xff0…

向ChatGPT询问的艺术

向ChatGPT询问的艺术 本文是对 Ibrahim John 的书籍《THE ART OF ASKING CHATGPT FOR HIGH QUALITY ANSWERS》的中文翻译,主要目的是练习我的英文阅读能力顺便学习一下 chatgpt 相关的一些提问技巧。 在翻译的过程中,原文没有给出具体的示例,…

GitHub-3KStar吴恩达ChatGPT课程最新中文版Prompt+ChatGPT API+LangChain——面向开发者的 LLM 入门课程开源,小白也可学

目录 导言面向开发者的 LLM 入门课程项目简介项目意义项目受众项目亮点内容大纲一、面向开发者的 Prompt Engineering二、搭建基于 ChatGPT 的问答系统三、使用 LangChain 开发应用程序四、Prompt 高级技巧(暂未完成)配套视频 致谢 参考资料其它资料下载…

吴恩达教你如何玩转ChatGPT,限时免费!

克雷西 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT催生新职业提示工程师,年薪可高达几十万美元。‍‍ 但是,该怎么入门? 吴恩达面向广大开发者推出ChatGPT提示工程课程,与OpenAI合作出品。 限时免费,而且对新手友好&a…

微软计划在未来几周内使用更快版本的 ChatGPT 更新 Bing

根据 Semafor 的一份新报告,微软正在努力在未来几周内将 OpenAI 的 ChatGPT 的更快版本(称为 GPT-4)整合到 Bing 中,此举将使搜索引擎与谷歌更具竞争力。集成将使必应使用 GPT-4 来回答搜索查询。 知情人士告诉 Semafor,ChatGPT 和 GPT-4 的主要区别在于速度。尽管 ChatG…

【微软Bing王炸更新】无需等待,人人可用,答案图文并茂,太牛了

🚀 AI破局先行者 🚀 🌲 AI工具、AI绘图、AI专栏 🍀 🌲 如果你想学到最前沿、最火爆的技术,赶快加入吧✨ 🌲 作者简介:硕风和炜,CSDN-Java领域优质创作者🏆&am…

Win10已死!微软发布Windows 11大更新:引入ChatGPT、升级巨大

今天凌晨微软在开发者大会上公布了Windows 11的新版本更新"Moment 3",整体升级幅度非常的大。 新系统的多任务有了改进,现在按下AltTab时,可以显示更多的Edge标签,同时还支持更多原生支持的压缩格式,比如tar…

ChatGPT横空出世|写代码、写情书、写文章、做题……它啥都会!

在人工智能的发展中,有些行业可能会被替代,但这并不意味着孩子的未来发展方向会受到影响。毕竟,我们在有限的时间内无法掌握所有技术。那么,什么是人工智能无法替代的呢?小编将在结尾给出答案。 最近,OpenA…

ChatGPT横空出世,对UP主来说是威胁吗?

什么是ChatGPT? 资料显示,ChatGPT(全名:Chat Generative Pre-trained Transformer)是美国OpenAI研发的聊天机器人程序,于2022年11月30日正式发布。ChatGPT能火遍全球,是因为它能够通过理解和学…

Java面试宝典

JDK,JRE,JVM 三者关系? JDK 是 JAVA 程序开发时用的开发工具包,其内部也有 JRE 运行环境 JRE。JRE 是 JAVA 程序运行时需要的运行环境,就是说如果你光是运行 JAVA 程序而不是去搞开发的话,只安装 JRE 就能运行已经存在的 JAVA 程…

面试图背背佳

h5语意化标签 <nav><header><footer><article><section> <nav><header><footer><article><section> 优点&#xff1a; 为了在没有CSS的情况下&#xff0c;页面也能呈现出很好地内容结构、代码结构比<div>…

英语学得好,月薪高出10000块?真正影响职场的能力,9成国人有欠缺!

英语重要&#xff0c;大家从小就知道。 每次想学点什么&#xff0c;“学英语”总会从脑海里蹦出来。 但英语到底有用在哪&#xff1f; 说实际点&#xff0c;英语好&#xff0c;真的可以让人生活的更好么&#xff1f; 就在前两年&#xff0c;国内一份针对5000人的深度访谈报告显…

【Python爬虫项目实战一】获取Chatgpt3.5免费接口文末付代码(过Authorization认证)

目录 🚩前言🍑工具🍉分析流程🧅实战部分🧅🧅模拟登陆🧅🧅模拟提问请求🥒login方法🥒chatgpt方法🌰总结🚩前言 大家好!今天的目标是拿下Openmao的接口,他的接口内容和chatgpt3.5是一样的,它们的免责申明中写道:本站点基于外部API二次开发,仅供学习…

【java项目学习】羊腿外卖开发记录

前言 作为第一个练手项目&#xff0c;巩固学习之前学习的知识 教学地址 https://www.bilibili.com/video/BV13a411q753?p6&spm_id_frompageDriver&vd_source2497f00c3af066126b298d1871671eec 本次项目中使用到的技术 springspringMVCspringbootmybatis-plusmysql…

ChatGPT最强竞品重磅升级,免费可用!第一手实测在此,网友:有个性

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后&#xff0c;竞争对手显然坐不住了。 就在刚刚&#xff0c;Anthropic旗下Claude发布第二代——没错&#xff0c;就是被外界评价为GPT-4最强竞品的那一个。 浅划一下这次更新动作的重点&#xff1a; 免费&#xff0c;不用排…

解决谷歌浏览器(chrome)不能登录,不能同步的最简单方法!

工作了之后才发现书签是多么的重要&#xff0c;养成了归类的习惯&#xff0c;无奈也喜欢上了谷歌浏览器....具体的痛想必你也知道&#xff0c;不然你也不会看这篇小短文 &#xff08;有些时候总不能随时抱着电脑做事吧&#xff09; 于是我就在网上搜会发现就是那几个添加什么…

谷歌账号无法登录,登陆页面报错“accounts.google.com 的响应时间过长.”解决办法

应该是浏览器兼容效果不好导致的&#xff0c;解决办法如下&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1YkJr98Q2qz5GdF-R2ctYng 提取码&#xff1a;6666 百度网盘里下载google压缩包&#xff0c;解压后&#xff0c;按照如下操作顺序操作谷歌浏览器 然后谷歌的登录…

谷歌停止登录服务器未响应是什么意思,谷歌账号登录不了没反应这是为什?

2014-06-30 为什么用蓝手指玩COC不能登录谷 蓝手指玩COC不能登录谷歌账户&#xff0c;这个是网际协议规定的。中文名称&#xff1a; 网际协议 英文名称&#xff1a; internet protocol:&#xff0c;IP 曾 用 名&#xff1a; 网际协议 学科分类&#xff1a; 信息科技 网际协议 I…